1.安装

建议直接用conda。

conda create -n cnv cnvnator

conda activate cnv

查看帮助：

$ cnvnator

Not enough parameters.

CNVnator v0.4.1

Usage:

cnvnator -root out.root  [-genome name] [-chrom 1 2 ...] -tree  file1.bam ... [-lite]

cnvnator -root out.root  [-genome name] [-chrom 1 2 ...] -merge file1.root ...

cnvnator -root file.root  [-genome name] [-chrom 1 2 ...] -vcf [file.vcf.gz | file.vcf] [-rmchr] [-addchr]

cnvnator -root file.root  [-genome name] [-chrom 1 2 ...] -idvar [file.vcf.gz | file.vcf] [-rmchr] [-addchr]

cnvnator -root file.root  [-genome name] [-chrom 1 2 ...] -mask strict.mask.file.fa.gz [-rmchr] [-addchr]

cnvnator -root file.root [-genome name] [-chrom 1 2 ...] [-d dir | -fasta file.fa.gz] -his bin_size

cnvnator -root file.root [-genome name] [-chrom 1 2 ...] -baf bin_size [-hap] [-useid] [-nomask]

cnvnator -root file.root [-chrom 1 2 ...] -stat      bin_size

cnvnator -root file.root                  -eval      bin_size

cnvnator -root file.root [-chrom 1 2 ...] -partition bin_size [-ngc]

cnvnator -root file.root [-chrom 1 2 ...] -call      bin_size [-ngc]

cnvnator -root file.root -genotype bin_size [-ngc]

cnvnator -root file.root -view     bin_size [-ngc]

cnvnator -pe   file1.bam ... -qual val(20) -over val(0.8) [-f file]

cnvnator-root file.root [-chrom 1 2 ...] -cptrees newfile.root

cnvnator-root file.root -ls

Valid genomes (-genome option) are: NCBI36, hg18, GRCh37, hg19, mm9, hg38, GRCh38

2.测试

首先准备好数据，再利用一个小数据集，比如这里用一条染色体来测试一下流程。

准备基因组数据。需要将基因组按染色体/scaffold拆分成单条序列，放在一个目录下。

mkdir genome;cd genome

faSplit byname genome.fa genome

# faSplit可用conda安装，或者自己写脚本拆分

测试脚本，先用一条染色体试试：

#从bam文件中提取比对上的reads信息

cnvnator -root file.root -tree sample-1.rmdup.bam -chrom 1

#生成read depth分布图

cnvnator -root file.root -his 1000 -d genome/  -chrom 1

#计算统计结果

cnvnator -root file.root -stat 1000 -chrom 1

#RD信号分割

cnvnator -root file.root -partition 1000 -chrom 1

#拷贝数变异检测

cnvnator -root file.root -call 1000 -chrom 1 > cnv.call.txt

#转化为vcf，如果是conda安装，没有这个脚本，需要从GitHub上下载

/biosoft/CNVnator/cnvnator2VCF.pl cnv.call.txt genome >test.vcf

拷贝数cnv.all.txt结果：、

表头CNV_type coordinates CNV_size normalized_RD e-val1 e-val2 e-val3 e-val4 q0

CNV_type有deletion和duplication两种类型；
CNV_size 位于染色体区域；
normalized_RD 矫正后的read depth；
e-val1 t检验后的evalue值，通常该值越小，代表分析的结果越准确；
q0 比对的质量值为0的reads占比，通常该值越大，代表分析的结果越不准确。

vcf结果：

没有自动加上样品名，需要自己修改。加上--prefix参数也只是改变CNV ID。

更多结果解读，请查看官方文档或网上其他教程。

3.动植物群体检测CNV

正式分析。

ls -l /project/gvcf/*.rmdup.bam |awk -F' ' '{print $8}' >sample.info

cat sample.info |while read id;do

    sample=`basename $id |sed 's/.rmdup.bam//'`

    echo $sample

    cnvnator -root file.root -tree $id

    cnvnator -root file.root -his 1000 -d genome/

    cnvnator -root file.root -stat 1000

    cnvnator -root file.root -partition 1000

    cnvnator -root file.root -call 1000  > cnv.call.txt

    /biosoft/CNVnator/cnvnator2VCF.pl cnv.call.txt genome >${sample}.cnv.vcf

    sed  -i "22s/cnv/${sample}/" ${sample}.cnv.vcf

    bgzip ${sample}.cnv.vcf

    tabix -p vcf ${sample}.cnv.vcf.gz

done

得到各个样本的拷贝数vcf文件，将它们合并成一个。

vcf-merge sample-1.cnv.vcf.gz sample-2.cnv.vcf.gz  ...>merge.vcf

或对不同类型群体进行合并。

https://blog.csdn.net/yangl7/article/details/114656482

https://www.jianshu.com/p/98542359df20

https://blog.csdn.net/weixin_43569478/article/details/108079613

使用CNVnator分析动植物群体拷贝数变异CNV的更多相关文章

DNA拷贝数变异CNV检测——基础概念篇
DNA拷贝数变异CNV检测——基础概念篇一.CNV 简介拷贝数异常(copy number variations, CNVs)是属于基因组结构变异(structural variation), ...
全基因组测序从头测序(de novo sequencing) 重测序(re-sequencing)
全基因组测序全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序 ...
全基因组测序 Whole Genome Sequencing
全基因组测序 Whole Genome Sequencing 全基因组测序(Whole Genome Sequencing,WGS)是利用高通量测序平台对一种生物的基因组中的全部基因进行测序,测定其 ...
GWAS | 全基因组关联分析 | Linkage disequilibrium (LD)连锁不平衡 | 曼哈顿图 Manhattan_plot | QQ_plot | haplotype phasing
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp ...
CNV
CNV: 人类主要是二倍体.如果有些区域出现3个.4个拷贝,那就是扩增了,如果只出现1个拷贝,就是缺失.所以CNV分析是依靠特定位置的测序深度来估算的,先在染色体上划窗,然后看每个窗口的平均测序深度, ...
GATK--数据预处理，质控，检测变异
版权声明:本文源自解螺旋的矿工, 由 XP 整理发表,共 13781 字. 转载请注明:从零开始完整学习全基因组测序(WGS)数据分析:第4节构建WGS主流程 | Public Library o ...
SNP/单核苷酸多态性分析
SNP/单核苷酸多态性分析 SNP(Single Nucleotide Polymorphism),即单核苷酸多态性,是由于单个核苷酸改变而导致的核酸序列多态.一般来说,一个SNP位点只有两种等位基因 ...
对CCLE数据库可以做的分析--转载
转载:http://www.bio-info-trainee.com/1327.html 收集了那么多的癌症细胞系的表达数据,拷贝数变异数据,突变数据,总不能放着让它发霉吧! 这些数据可以利用的地方非 ...
Data Mining的十种分析方法——摘自《市场研究网络版》谢邦昌教授
Data Mining的十种分析方法: 记忆基础推理法(Memory-Based Reasoning:MBR) 记忆基础推理法最主要的概念是用已知的案例(case)来预测未来案例的一些属 ...

随机推荐

Egg.js学习与实战系列 · 文件上传配置
在使用Egg.js搭建文件上传服务时,遇到了几个一般新手都会遇到的坑. 经查阅官方文档,Egg框架中默认使用egg-multipart插件进行文件上传,所以上传文件前需要做相关的配置. 上传文件提示: ...
csp-s 2021
T1 廊桥分配当一架飞机抵达机场时,可以停靠在航站楼旁的廊桥,也可以停靠在位于机场边缘的远机位. 乘客一般更期待停靠在廊桥,因为这样省去了坐摆渡车前往航站楼的周折. 然而,因为廊桥的数量有限,所以这 ...
Spark面试题（二）
首发于我的个人博客:Spark面试题(二) 1.Spark有哪两种算子? Transformation(转化)算子和Action(执行)算子. 2.Spark有哪些聚合类的算子,我们应该尽量避免什么类 ...
大厂面试题分享：如何让(a===1&&a===2&&a===3)的值为true?
当我第一次看到这一题目的时候,我是比较震惊的,分析了下很不合我们编程的常理,并认为不大可能,变量a要在同一情况下要同时等于1,2和3这三个值,这是天方夜谭吧,不亚于哥德巴赫1+1=1的猜想吧,不过一切 ...
小白自制Linux开发板十. NES游戏玩起来
本篇基于我们制作的Debian文件系统而展开,而且我们这会玩一些高级的操作方式--用我们的小电脑进行程序编译. 所以本篇操作全部都在我们个的开发板上完成. 1. 开发环境搭建首先安装gcc, ...
Discovery直播 | 3D“模”术师，还原立体世界——探秘3D建模服务
通过多张普通的照片重建一个立体逼真的3D物体模型,曾经靠想象实现的事情,现在, 使用HMS Core 3D建模服务即可实现! 3D模型作为物品在数字世界中的孪生体,用户可以自己拍摄.建模并在终端直观感 ...
sprint boot 自动创建web应用(3)
1. springboot自动创建地址:https://start.spring.io/ 2.选择web(springMVC) 3.点击创建 4.创建成功 5.解压,导入项目 6.新建成功 7.原因 ...
Jmeter接口数据流测试及持续集成部署：（一）Jmeter环境搭建：安装JDK、安装Jmeter、安装Fiddler、安装ant
Jmeter环境搭建 1.安装JDK 官方下载地址:https://www.oracle.com/java/technologies/downloads/ 安装方法:双击jdk安装包,一直下一步安装即 ...
【不费脑筋系列】发布个人的代码包到Nuget服务器上，并通过VS引用进行使用的方法
打打酱油,写点不需要费脑筋的博客先压压惊. 下面讲个关于个人如何开发nuget包,并部署到nuget服务器上的例子.为了保证.net framework和 .net core都可以访问到我的包,我 ...
oracle合并列的函数wm_concat的使用详解
oracle wm_concat(column)函数使我们经常会使用到的,下面就教您如何使用oracle wm_concat(column)函数实现字段合并,如果您对oracle wm_concat( ...

使用CNVnator分析动植物群体拷贝数变异CNV

1.安装

2.测试

3.动植物群体检测CNV

使用CNVnator分析动植物群体拷贝数变异CNV的更多相关文章

随机推荐

热门专题