bcftools】的更多相关文章

见命令: bcftools merge A.vcf.gz B.vcf.gz C.vcf.gz -Oz -o ABC.vcf.gz 参考链接:http://vcftools.sourceforge.net/htslib.html#merge…
下载安装bcftools 见如下命令: bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf 注意:输入的vcf以gz格式存在,不然会报错:Failed to open 1000Genomes.vcf: not compressed with bgzip 如何将vcf生成gz格式,见这篇文章bcftools将vcf生成bgzip和index格式 如果只想提取指定位置(specifi…
1.下载安装bcftools. 2.准备样本ID文件,这里命名为samplelistname.txt,一个样本一行,如下所示: sample1 sample2 sample3 3.输入命令: bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.v…
利用bcftools软件将vcf格式生成gz格式和index格式,需要用到“-Oz”和“index”命令,具体如下: /bcftools-1.8/bin/bcftools view ExAC.vcf -Oz -o ExAC.vcf.gz /bcftools-1.8/bin/bcftools index ExAC.vcf.gz…
通过GATK calling出来的SNP如果使用UnifiedGenotype获得的SNP文件是分sample的,但是如果使用vcftools或者ANGSD则需要Vcf文件是multi-sample的,这里就需要我们将不同samples的文件进行合并,可以通过vcftools的perl模块进行,但是这种方式对perl的要求较高,且操作比较复杂,这里我们选择使用Bcftools,操作简便. 分三步: 将vcf进行压缩,批量压缩的方法: bgzip -c -f -@ merge.vcf > merg…
在对vcf的操作有这样三个软件: Vcftools:主要用于群体分析,文本处理的功能不是很强大,虽然这个软件也可以拆分样本,但是这种拆分不涉及文件的处理,只是保留在分析流程里. GATK .x:这个软件最大的问题就是需要参考基因组,而且序列长度各个方面都要与待处理的文件一致这样就给我们的数据处理带来一定的麻烦. Bcftools:涉及文本的处理,功能很强大,后续随着我的分析还要继续介绍. 利用Bcftools按样本拆分文件主要利用了“--view”这个软件包,主要代码如下: bcftools v…
两个软件的作用:1.samtools mpileup 主要是用于收集BAM文件中的信息,这个位点上有多少条read匹配,匹配read的碱基是什么,并将这些信息存储在BCF文件中.2.bcftools 是真正进行calling的软件.其也可以用来BCF和VCF格式的转换. 常见流程: #index REF $samtools faidx GCF.fa $bowtie2-build ./GCF.fa ./index/GCF #生成bam比对文件 $bowtie2 -x ./index/GCF rea…
beftools非常复杂,大概有20个命令,每个命令下面还有N多个参数 annotate .. edit VCF files, add or remove annotations call .. SNP/indel calling (former "view") cnv .. Copy Number Variation caller concat .. concatenate VCF/BCF files from the same set of samples consensus ..…
做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎.这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一.根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 keep.list,一行一个个体(参考第三步). 无痛处理,速度超快,命令如下: 1 bcftools view -S keep.list test.vcf >sub_indv.vcf 二.根据染色体位置提取子集 注意…
--------------------安装Samtools----------------------------------------------------------------------------------- 1) 下载 http://www.htslib.org/download/ 2) tar -jxvf samtools-1.9.tar.bz2 3)cd samtools-1.9 4)make 5) make prefix=/home/jxdong/biosoft/sam…