SNPEFF snp注释 (添加自己基因组)
之间介绍过annovar进行对snp注释,今天介绍snpEFF
SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes
详细的说明请阅读:
http://snpeff.sourceforge.net/SnpEff_manual.html
一、安装
1 wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip
2 unzip snpEff_latest_core.zip
3
4 #会产生一个snpEff目录 所有的程序都在这里面
二、配置自己的基因组和注释文件
以菠菜(spinach)参考基因组为例子:
打开snpEFF文件夹下的snpEff.contig, 增加新的物种信息,可以在任意一行添加,个人建议在 # Databases & Genomes 添加
1 # spinach_v1
2 spinach_v1.genome : spinach
建立data文件夹并且建立名为spinach_v1的文件夹 (和上述对应)
1 mkdir -p data/spinach_v1
在该文件夹下存放两个文件:
- sequences.fa
- genes.gff # (我用的是gff3格式,也可使gff2)
(一定按上述名字)
用build命令进行构建
1 # 在snpEff文件夹下运行命令
2 java -jar snpEff.jar build -gff3 -v spinach_v1
3
4 ## 参数
5 -v: 版本
6 -gff3:gff文件类型
三、开始注释
1 java -jar snpEff.jar ann spinach_v1 input.vcf.gz > snpeff.vcf
同样我们可以选择以下参数简化输出
- -no-downstream
- -no-upstream
- -no-utr
- -no-intergenic
- -no-intron
比如说我们只关注CDS中的注释信息,不考虑上游、下游、UTR、基因间区等信息
1 java -jar snpEff.jar ann -no-utr -no-downstream -no-upstream -no-intergenic spinach_v1 input.vcf.gz > snpeff.vcf
四、结果的说明
- snpEff_genes.txt
- snpEff_summary.html
两个文件记录总结性信息比较简单
*.ann.vcf 是一个注释结果文件,其就在vcf的info信息新添加了anno一列信息,其具体每个值含义如下:
- Allele
突变之后的碱基,第一个突变位点由T碱基突变成了C碱基,对应Allel的值为C
- Annotation
由sequence ontology
定义的突变类型
- Annotation_Impact
对变异位点有害程度的简单评估,取值有HIGH
, MODERATE
, LOW
, MODIFIER
4种,含义如下
- Gene_Name
基因名字
- Gene_ID
基因ID
- Feature_Type
想要分析的特征类型,transcript, motif, miRNA 等
- Feature_ID
根据Feature Type
指定的特征,给出对应的ID
- Transcript_BioType
转录本类型, 通常采用Ensembl数据库的转录本类型
- Rank
只有当变异位点位于基因区域时才有值,会给出变异位点所处的exon/intron的编号和该基因的exon/intron的总数,比如一个突变位点位于基因的第3个exon上,该基因一共有12个exon, 对应的Rank的值为3/12
当变异位点位于基因区域以外时,该字段的值为空
- HGVS.c
采用HGVS
标准命名的基因水平的变异情况
- HGVS.p
采用HGVS
标准命名的蛋白质水平的变异情况,只有当突变位点位于编码区是才会有值
- cDNA.pos/cDNA.length
突变位点在cDNA上的位置/cDNA的总长度
- CDS.pos/CDS.length
突变位点在CDS上的位置/CDS的总长度
- AA.pos/AA.length
突变位点在氨基酸序列上的位置/氨基酸序列的总长度
- Distance
变异位点与最近的特征的距离,当变异位点位于基因间区时,会给出与最近的基因之间的距离;当变异位点位于exon区域时,会给出与最近的内含子边界的距离,不同的情况,距离的定义不同。
- ERRORS/WARNINGS/INFO
对注释结果的可靠程度进行评估,各种取值代表的含义如下图
参考
关注下方公众号可获得更多精彩
SNPEFF snp注释 (添加自己基因组)的更多相关文章
- python笔记30-docstring注释添加变量
前言 python里面添加字符串注释非常简单,如何将变量放入 python 的函数注释里面呢? docstring也就是给代码加注释的内容了,python可以给函数,类.方法,模块添加注释内容,注释标 ...
- mybatis generator为实体类生成自定义注释(读取数据库字段的注释添加到实体类,不修改源码)
我们都知道mybatis generator自动生成的注释没什么实际作用,而且还增加了代码量.如果能将注释从数据库中捞取到,不仅能很大程度上增加代码的可读性,而且减少了后期手动加注释的工作量. 1.首 ...
- ADMethodsAccountManagement 一些简单注释添加
using System; using System.Collections; using System.Text; using System.DirectoryServices.AccountMan ...
- Pycharm头部注释添加
1.第一步 2.第二步 搜索框输入:File and Code Templates 然后右边找到 Python Script 3.第三步 将下面内容复制到图中红框内,然后点击OK #!/usr/bin ...
- 根据SNP的位置从基因组提取上下游序列
代码如下: #!/usr/bin/perl -w use strict; die "perl $0 <vcf> <genome>" if(@ARGV = ...
- 突变注释工具SnpEff,Annovar,VEP,oncotator比较分析--转载
https://www.jianshu.com/p/6284f57664b9 目前对于variant进行注释的软件主要有4个: Annovar, SnpEff, VEP(variant Effect ...
- EF架构~为EF DbContext生成的实体添加注释(T5模板应用)
回到目录 相关文章系列 第八回 EF架构~将数据库注释添加导入到模型实体类中 第二十一回 EF架构~为EF DbContext生成的实体添加注释(T4模板应用) 第二十二回EF架构~为EF DbCo ...
- EF架构~为EF DbContext生成的实体添加注释(T5模板应用)(转载)
转载地址:http://www.newlifex.com/showtopic-1072.aspx 最近新项目要用Entity Framework 6.x,但是我发现从数据库生成模型时没有生成字段的注释 ...
- zendstudio添加注释快捷键
最常用的是ctrl+/来添加行注释 方法是选中代码,按ctrl+/就可以注释掉代码.再按ctrl+/可以去掉注释 添加块注释时,现加/,再加*,再按enter即可添加块注释.
随机推荐
- 微信小程序添加外部地图服务数据
先上效果: 缘起 使用微信小程序做地图相关功能的时候,有个需求是需要接入自己发布的地图服务.查看微信小程序地图组件文档,发现它对地图相关的支持很少,只有一些基础功能,比如添加点.线.面.气泡和一些常规 ...
- 第0次 Beta Scrum Meeting
本次会议为Beta阶段第0次Scrum Meeting会议 会议概要 会议时间:2021年5月27日 会议地点:「腾讯会议」线上进行 会议时长:1小时 会议内容简介:本次会议为Beta阶段启程会议,主 ...
- CSP-S2021幽寂
不管怎么说,这次比赛考的比这一段时间以来的模拟赛都难看 难受,但是也不想太表现出来,所以更难受.... 有点害怕会退役...... Day -6 前一天晚上回宿舍的时候和\(zxs\)一路,聊的过程中 ...
- hdu 5172 GTY's gay friends(线段树最值)
题意: GTY有n个朋友,站成一排,每个人有一个特征值ai. 有m个询问.每次询问给两个数L,R.问你[L,R](即aL...aR)是否是1..(R-L+1)的一个全排列. 是输出YES,否则输出NO ...
- hdu 2154 跳舞毯(简单DP)
题意: 有一个圆圆的毯,被平均分成三个扇形.分为标记为A,B,C. 小余从A开始跳,每次可跳到相邻的扇形上.(A->B 或 A->C) 问小余跳n次,最后回到扇形A的方案数是多少. 思路: ...
- python基础数据类型语法
#标识符:我们自己在写代码的时候,取的名字.#项目名 project name#包名 package name#模块名 .py ptthon文件名#规范:由字母数字下划线组成,但不能以数字#简明知意: ...
- 【java+selenium3】select 下拉选 (八)
一.select 下拉框 1.下拉选的处理类:Select 如果页面元素是一个下拉框,我们可以将此web元素封装成Select对象. Select select = new Select(WebEle ...
- stom消费kafka消息速度慢的问题
原来代码如下 KafkaSpoutConfig<String, String> kafkaSpoutConfig = KafkaSpoutConfig.builder(kafka_serv ...
- CPU被挖矿,Redis竟是内鬼!
却说这一日,Redis正如往常一般工作,不久便收到了一条SAVE命令. 虽说这Redis常被用来当做缓存,数据只存在于内存中,却也能通过SAVE命令将内存中的数据保存到磁盘文件中以便持久化存储. 只见 ...
- 菜鸡的Java笔记 - java 断言
断言:assert (了解) 所谓的断言指的是在程序编写的过程之中,确定代码执行到某行之后数据一定是某个期待的内容 范例:观察断言 public class Abnorma ...