SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes

详细的说明请阅读:

http://snpeff.sourceforge.net/SnpEff_manual.html

一, 安装:

首先在家目录下, 下载安装包

wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip

然后进行解压

unzip snpEff_latest_core.zip

会产生一个snpEff目录 所有的程序都在这里面

二, 配置自己的基因组和注释文件, 官方的数据库中有大量的参考基因组,一般都不需要配置。如果在官方的database中没有找到就需要自己配置

1,注释文件为gff3格式

假如我现在有一个参考基因组: Osativa_204.fa

有个这个基因组的注释文件: Osativa_204_gene.gff3

首先编辑配置文件,加入新基因组的entry

配置文件在snpEff目录下, 配置文件名为snpEff.config

用vi进行编辑 加入如下两行

# Rice genome, version Osativa_204
Osativa_204.genome : Rice

然后保存退出

还是在snpEff文件下, 创建目录data

mkdir data

cd data

创建Osativa_204 和 genomes目录

mkdir Osativa_204

mkdir genoems

将你的gff3注释文件放在Osativa_204目录下

将你的参考序列文件放在genomes目录下

注意,要将注释文件重新命名为genes.gff

完成后回到 snpEff 目录, 执行命令:

java -jar snpEff.jar build -gff3 -v Osativa_204

2,注释文件时gtf格式

假如有注释文件为:Osativa_204.gtf

前面步骤都一样, 不同的是:
要将注释文件重新命名为genes.gtf

执行命令改为:

java -jar snpEff.jar build -gtf22 -v Osativa_204

三, 开始统计执行:

先将vcf文件copy到data目录下

然后在snpEff目录下执行命令:

java -Xmx8g -jar snpEff.jar Osativa_204 data/testgroup.filtered.ordered.vcf > test.eff.vcf

命令执行完后在snpEff目录下会产生三个文件

snpEff_genes.txt

snpEff_summary.html

test.eff.vcf

然后将snpEff_summary.html用浏览器打开就可以看到结果的汇总情况, 可能网页中有些图片加载不出来,那是因为那些图片需要下载,可能是在国外的服务器,

如果你本身就无法访问国外网站,那就下载不出来,所以FQ吧~

四,对结果的一些说明:

无论你用的是gtf文件还是gff文件, 产生的这个表是一样的:

因为我的gtf是由gff转化过来的,看似少了一些feature,但实际都可以推算出来,所以我的gtf保留了gff的所有信息。

exon和intergenic分别出现两次,不知道为什么。。。

五, 如何更换注释文件

如果想要更换注释文件。先进入~/snpEff/data/Osativa_204目录将注释文件和bin文件删除,将新的注释文件copy到此目录

重新执行上面所述build步

by freemao

FAFU.

free_mao@qq.com

如何使用SnpEff 对SNP结果进行分析的更多相关文章

  1. SNP/单核苷酸多态性分析

    SNP/单核苷酸多态性分析 SNP(Single Nucleotide Polymorphism),即单核苷酸多态性,是由于单个核苷酸改变而导致的核酸序列多态.一般来说,一个SNP位点只有两种等位基因 ...

  2. 突变注释工具SnpEff,Annovar,VEP,oncotator比较分析--转载

    https://www.jianshu.com/p/6284f57664b9 目前对于variant进行注释的软件主要有4个: Annovar, SnpEff, VEP(variant Effect ...

  3. GATK 一些资料

    1. http://blog.sciencenet.cn/home.php?mod=space&uid=1469385&do=blog&classid=166694&v ...

  4. SNPsnap | 筛选最佳匹配的SNP | 富集分析 | CP loci

    一个矛盾: GWAS得到的SNP做富集分析的话,通常都会有强的偏向性. co-localization of GWAS signals to gene-dense and high linkage d ...

  5. 千人基因组计划数据库下载某段区域SNP

    进入http://browser.1000genomes.org/index.html网站 假定要寻找“6:133098746-133108745”这段距离的SNP数据,“6”表示6号染色体,后面的数 ...

  6. SNP问题大集锦

    SNP问题大集锦 [2017-01-19]       最近小编对基因检测很感兴趣,也跟风去测了一下,这一测不要紧,吓得小编几天没睡着觉,这不,检测报告上称小编的减肥能力弱,虽然小编一家都是胖子,唯有 ...

  7. LD SCore计算基因多效性、遗传度、遗传相关性(the LD Score regression intercept, heritability and genetic correlation)

    这篇文章是对之前啊啊救救我,为何我的QQ图那么飘(全基因组关联分析)这篇文章的一个补坑. LD SCore除了查看显著SNP位点对表型是否为基因多效性外,还额外补充了怎么计算表型的遗传度和遗传相关性. ...

  8. 【豆科基因组】大豆(Soybean, Glycine max)经典文章梳理2010-2020

    目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechn ...

  9. SNPEFF snp注释 (添加自己基因组)

    之间介绍过annovar进行对snp注释,今天介绍snpEFF SnpEff is a variant annotation and effect prediction tool. It annota ...

随机推荐

  1. 枚举IoTimer

    /*************************************************************************************** * AUTHOR : ...

  2. java.io中流的操作:字节流、字符流

    java.io中流的操作:字节流.字符流(1)使用File类打开一个文件(2)通过字节流或字符流的子类指定输出的位置(3)进行读/写操作(4)关闭输入/输出 1.字节流:主要是byte类型数据,以by ...

  3. 判断数据库内容,在页面显示自定义数据case when

    判断数据库内容,在页面显示自定义数据 case when...then ...else...end 比如:数据库内容是这样: 通过sql语句判断,数据库的name字段,内容是月桂的,显示嫦娥,其他的显 ...

  4. 使用ASP.Net WebAPI构建REST服务(二)——路由

    REST并没有像传统的RPC服务那样显式指定了服务器函数的访问路径,而是将URL根据一定的规则映射为服务函数入口,这个规则就称之为路由.Asp.Net WebAPI的路由方式和Asp.Net MVC是 ...

  5. jquery 取的单选按钮组的值

    <input type=”radio” name=”wholesale_one” id=”wholesale_one” value=”1″ />1箱起批<input type=”ra ...

  6. Python中的sorted函数以及operator.itemgetter函数 【转载】

    operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子. a = [1,2 ...

  7. struts中的常量,action配置中的默认值

    1.struts中Action的开发方式 继承ActionSupport类,这种方法实现的Action可以进行数据校验: 实现Action接口: 不继承任何类,不实现任何接口: 是否继承类或实现接口, ...

  8. 关于oc运行时 isa指针详解

    Cocoa框架是iOS应用程序的基础,了解Cocoa框架,对开发iOS应用有很大的帮助. 1.Cocoa是什么? Cocoa是OS X和 iOS操作系统的程序的运行环境. 是什么因素使一个程序成为Co ...

  9. fastboot 刷system.img 提示 sending 'system' (*KB)... FAILED (remote: data too large)

    华为G6-C00卡刷提示OEMSBL错误,只能线刷 ,但是官方找不到线刷img镜像,无奈 网上下了个可以线刷的工具套件 流氓ROM . 使用HuaweiUpdateExtractor(工具百度)把官方 ...

  10. openstack 中 log模块分析

    1 . 所在模块,一般在openstack/common/log.py,其实最主要的还是调用了python中的logging模块: 入口函数在 def setup(product_name, vers ...