【software】变异注释工具:annovar
annovar提供三种注释方式
一,基于基因的注释 给定变异,看变异是否影响编码蛋白的改变
支持基因定义系统:RefSeq genes, UCSC genes, ENSEMBL genes, GENCODE genes, AceView genes, or many other gene definition systems.
二、基于区域的注释 看变异是否在基因组的特定区域
三、基于过滤的注释 看变异是否在特定数据库中,如dbSNP
annotate_variation.pl 主程序
table_annovar.pl 常用注释程序
关键参数
—-buildver 数据库版本, 如hg19
—-protocol refGene, exac03
anno_refgene.sh
#!/bin/bash
name=$1
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene
-operation g
--outfile ${name}.annovar
13 20797176 21105944 0 - comments: a 342kb deletion encompassing GJB6, associated with hearing loss
annovar_latest.sh
#!/bin/bash
name=huaxi-7.varscan.vcf
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,SAOdbSNP150,cosmic83,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,clinvar_20170905,HGMD,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,r,r 大专栏 【software】变异注释工具:annovaran class="se">
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile ${name}.annovar
TJ集群annovar注释
name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--outfile ${name}.annovar
TJ集群annovar注释, input为VCF
name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}.vcf
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile ${name}.annovar
关于indel的处理
目前没有描述indel的普遍认同的方式。
作为使用者我们应该这样做:(1)分割VCF文件确保每一行只包含一个变异;(2)left-normalize所有的VCF文件; (3)使用ANNOVAR注释
所以使用命令:
bcftools norm -m-both -o ex1.step1.vcf ex1.vcf.gz
bcftools norm -f human_g1k_v37.fasta -o ex1.step2.vcf ex1.step1.vcf
第一个命令分割多allels变异检出为单独的行,第二个命令运行真正的 left-normalization。
(有时候第一个命令可能出现没有变异能被分解,尽管在文件中存在这些变异,这种情况下,你可以使用vt program 代替)
参考:
-END-
【software】变异注释工具:annovar的更多相关文章
- 突变注释工具SnpEff,Annovar,VEP,oncotator比较分析--转载
https://www.jianshu.com/p/6284f57664b9 目前对于variant进行注释的软件主要有4个: Annovar, SnpEff, VEP(variant Effect ...
- VVDocumenter - Xcod代码注释工具
刚接触IOS开发时,发现XCODE非常的强大的,后续的代码实践中发现XOCDE的代码文档注释非常的差, 每次都要用手敲,蛋疼至极: 随着不断学习发现XCODE有代码片段内嵌一说(如:for .bloc ...
- VVDocumenter 注释工具的使用
首先,前往github上下载工程源代码. 然后,编译VVDocumenter工程. 重启xcode. 然后,只要在你自己的工程中要加入注释的方法前面输入“///”,一切搞定. 很好很强大.
- Xcode 注释工具的使用
1:Xcode 8之后 Goodbye World In Xcode 8, Apple integrated a comment documentation generator plugin, whi ...
- sublime 非常好用的注释工具
Sublime在进行前端开发时非常棒,当然也少不了众多的插件支持,DocBlocker是在Sublime平台上开发一款自动补全代码插件,支持JavaScript (including ES6), PH ...
- 【annotation】非人类物种基因组注释(MSU为例)
基因组注释工具ANNOVAR是一款非常好用的注释软件,功能强大,输出数据简单美中不足就是对于非人类物种来说UI不够完善,因此总结一下整个注释的过程,帮助别人快乐自己. 首先我们需要明确我们需要的数据和 ...
- variant的过滤 | filtering and prioritizing genetic variants
WGS和WES测序和分析会产生大量的variant数据. 显然直接分析全部的variant是非常不靠谱的. 做疾病的话,有一些常用的过滤套路. variant作用于基因表达主要分两大类: 1. cod ...
- 【转】Objective-C代码注释和文档输出的工具和方法
http://blog.xcodev.com/blog/2013/11/01/code-comment-and-doc-gen-tools-for-objc/ 代码注释可以让代码更容易接受和使用,特别 ...
- 史上最全 | 39个RNAseq分析工具与对比
文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the ...
随机推荐
- 关于maven的使用总结
maven介绍 项目构建过程 eclipse只是开发工具,虽然提供了创建.编码.编译.测试.运行等功能,但并不是项目构建工具. 项目构建主要过程如下: 实际的项目构建过程要复杂繁琐的多.如果是一个独立 ...
- Linux进程的引入
1.什么是进程? (1).进程是一个动态过程而不是静态实物 (2).进程就是程序的一次运行过程,一个静态的可执行程序a.out的一次运行过程(./a.out从运行到结束)就是一个进程. (3).进程控 ...
- CPA-计划
平时周一到周五上班晚上8点到12点,周末6-8个小时,然后没有节假日,一次差不多可以3.4科 审计 看150页 3小时,看完,做题 2天时间,5门课程,12小时考试,没想到能完整地挺过来.感觉税法战 ...
- vim删除所有
vim test.log :0,$d :wq 注释: :0,$d是删除第0行到最后一行的意思::wq是保存并退出的意思. 执行上面的语句之后,文件中的内容就全部被删除掉了!
- Sequence Diagram时序图 - 应该是最简洁有力的业务了
直接看UML吧,一目了然,不用解释.自信男人,无须多言. 这是用ListView显示Post的流程. 这是Uppdate User Profile的流程.自信男人,无须多言.
- 1)BS和CS区别
(1)CS: 客户端服务器 BS: 浏览器和服务器 (2)二者区别: 微信就相当于 客户端服务器 同时 微信也有 网页版. BS灵活,不用下客户端,但是网页什么内容都有,就有可能将用户的信息泄 ...
- CGLIB原理及实现机制
https://blog.csdn.net/gyshun/article/details/81000997
- STOER-WAGNER算法求解无向图最大流最小割(无指定源点汇点)
学习粗:https://blog.csdn.net/ddelphine/article/details/77935670 模板题:http://poj.org/problem?id=2914 #inc ...
- 对数据集进行最优分箱和WOE转换
对数据集分箱的方式三种,等宽等频最优,下面介绍对数据集进行最优分箱,分箱的其他介绍可以查看其他的博文,具体在这就不细说了: 大体步骤: 加载数据: 遍历所有的feature, 分别处理离散和连续特征: ...
- activity 和 fragment 传递信息
acitvity 传递信息到fragment 初始化fragment 时可以传递arguments 该参数类型时Bundle activity 会持有fragment引用 通过通过参数的set方法 ...