bcftools合并vcf文件】的更多相关文章

见命令: bcftools merge A.vcf.gz B.vcf.gz C.vcf.gz -Oz -o ABC.vcf.gz 参考链接:http://vcftools.sourceforge.net/htslib.html#merge…
通过GATK calling出来的SNP如果使用UnifiedGenotype获得的SNP文件是分sample的,但是如果使用vcftools或者ANGSD则需要Vcf文件是multi-sample的,这里就需要我们将不同samples的文件进行合并,可以通过vcftools的perl模块进行,但是这种方式对perl的要求较高,且操作比较复杂,这里我们选择使用Bcftools,操作简便. 分三步: 将vcf进行压缩,批量压缩的方法: bgzip -c -f -@ merge.vcf > merg…
下载安装bcftools 见如下命令: bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf 注意:输入的vcf以gz格式存在,不然会报错:Failed to open 1000Genomes.vcf: not compressed with bgzip 如何将vcf生成gz格式,见这篇文章bcftools将vcf生成bgzip和index格式 如果只想提取指定位置(specifi…
做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎.这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一.根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 keep.list,一行一个个体(参考第三步). 无痛处理,速度超快,命令如下: 1 bcftools view -S keep.list test.vcf >sub_indv.vcf 二.根据染色体位置提取子集 注意…
目录 需求 示例文件 代码实现 补充说明 需求 客户的一个简单需求: 我有一批功能基因位点,想从重测序的群体材料中找到这些位点,如何批量快速获得? 示例文件 gene.txt test.vcf 代码实现 run.sh cat $1 |while read gene chr from to do #echo $chr $from $to if echo $2 |grep -q '.*.vcf.gz$';then vcftools --gzvcf $2 --chr $chr --from-bp $f…
纯文本文件比较和合并工具一直是软件开发过程中比较重要的组成部分,vimdiff 能够在比较出来的多处差异之间快速定位,很容易的进行文件合并操作.在需要快速比较和合并少量文件的时候,vimdiff是很好的选择. vimdiff 基本用法: 首先保证系统中的diff命令是可用的.Vim的diff模式是依赖于diff命令的. 启动方法1. vimdiff file1 file2 …2. vim -d file1 file2 … 差异点跳转]c 下一个差异点[c 上一个差异点n]c 转到下面第n个差异点…
1. 把引文输入google 翻译,然后点击"朗读"…
不多说,直接上代码.  代码 package zhouls.bigdata.myWholeHadoop.HDFS.hdfs7; import java.io.IOException;import java.net.URI;import java.net.URISyntaxException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apa…
1: %% merge.m 2: %%%%Main程序%%%%%% 3: %%%%%% 4: %%%%%%本程序合并完各个子文件夹中的txt到主文件目录下,并且合并的文件以子文件夹名字命名 5: %%%%%%同时,每次合并时,如果主文件夹已存在某一个子文件夹名字A的txt文件,那么此次合并,将把当前 6: %%%%%%这个子文件夹A中所有的txt文件追加到子文件夹A.txt文件的末尾处. 7: clear; 8: clc; 9: % MainFolder='D:\Master-FTP\磁流变阻尼…
//合并Excel文件 private void MargeExcelFile(string destFile, string dirPath) { DirectoryInfo dir = new DirectoryInfo(dirPath); FileInfo[] files = dir.GetFiles("*.xlsx"); Microsoft.Office.Interop.Excel.Application app = app = new Microsoft.Office.Int…