HGVS的变异格式
符号:


1.HGVS的变异格式由两部分组成:
1.1 reference sequence file identifier (accession.version-number) : actual description of a variant
比如:NG_012232.1(NM_004006.2):c.357+1G>A
NG_012232.1(NM_004006.2)是the reference sequence file identifier。
c.357+1G>A:the actual description of a variant
1.2 具体解释
reference sequence file identifiter:只接受NCBI,EBI的公共文件的内容。包括NC_# (e.g. NC_000023.10), LRG_# (e.g. LRG_199), NG_# (e.g. NG_012232.1), ENSG00000182533.6, NM_# (e.g. NM_004006.2), ENST00000343849.2, NR_# (e.g. NR_002196.1) and NP_# (e.g. NP_003997.1)。注意,点号后面的内容是版本号,除了LRG_外,其它的格式都需要版本号。
actual description of a variant:由两部分组成,一是参考序列的类型,二是具体的突变信息。
2.具体变异描述的内容(actual description of a variant)
2.1。参考序列的类型

2.2。具体的突变信息。
2.2.1.蛋白:
1.1替代:
格式:“prefix”“amino_acid”“position”“new_amino_acid”
| LRG_199p1:p.Trp24Cys | missense | 把一个氨基酸换成另一个氨基酸 |
| LRG_199p1:p.Trp24Ter (p.Trp24*) | nonsense | 把一个氨基酸换成终止密码子 |
| NP_003997.1:p.Cys188= | slient | 氨基酸没有变化 |
1.2缺失:
格式:“prefix”“amino_acid(s)+position(s)_deleted”“del”
| p.Ala3del | 第三个氨基酸Ala缺失 |
| p.Ala3_Ser5del | 第三个氨基酸到第五个氨基酸缺失 |
1.3重复:
格式:“prefix”“amino_acid(s)+position(s)_duplicated”“dup”
p.Ala3dup (one amino acid)a duplication of amino acid Ala3 in the sequence MetGlyAlaArgSerSerHis to MetGlyAlaAlaArgSerSerHis
1.4插入:
格式:“prefix”“amino_acids+positions_flanking”“ins”“inserted_sequence”
p.His4_Gln5insAla :the insertion of amino acid Ala between amino acids His4 and Gln5 changing MetLysGlyHisGlnGlnCys to MetLysGlyHisAlaGlnGlnCys
1.5移码(frame shift):移码是插入或缺失的一种特例。
格式: “prefix”“amino_acid”position”new_amino_acid”“fs”“Ter”“position_termination_site”
p.Arg97ProfsTer23 :a variant with Arg97 as the first amino acid changed, shifting the reading frame, replacing it for a Pro and terminating at position Ter23
解释:第97位的Arg变为Pro,这次翻译终止为从该位点数起的第23个氨基酸。
2.2.2基因
在用coding DNA作为参考序列时,其有自己的坐标定义图:

2.1 替代 :
格式: “prefix”“position_substituted”“reference_nucleotide””>”new_nucleotide”
- NC_000023.10:g.33038255C>A
- a substitution of the C nucleotide at g.33038255 for an A
- NG_012232.1(NM_004006.1):c.93+1G>T
- a substitution of the G nucleotide at c.93+1 (coding DNA reference sequence) with a T
2.2缺失
格式:“prefix”“position(s)_deleted”“del”
NG_012232.1:g.19_21del (several nucleotides)
a deletion of nucleotides g.19 to g.21 in the sequence AGAATCACA to AGAA___CA
2.3重复
格式:“prefix”“position(s)_duplicated”“dup”
NM_004006.2:c.20_23dup (NC_000023.10:g.33229407_33229410dup)
a duplication from position c.20 to c.23 in the sequence AGAAGTAGAGG to AGAAGTAGATAGAGG
2.4插入:
格式:“prefix”“positions_flanking”“ins”“inserted_sequence”
NC_000023.10:g.32862923_32862924insCCT (LRG_199t1:c.240_241insAGG)
the insertion of nucleotides CCT between nucleotides g.32862923 and g.32862924
2.5转换:一段序列被参考基因组的另一段序列替换
格式:“prefix”“positions_converted”“con”“positions_replacing_sequence”
NC_000022.10:g.42522624_42522669con42536337_42536382
conversion in exon 9 of the CYP2D6 gene replacing exon 9 nucleotides g.42522624 to g.42522669 with those of the 3’ flanking CYP2D7P1 gene, nucleotides g.42536337 to g.42536382 from the same genomic reference sequence (NC_000022.10)
2.6缺失插入
格式:“prefix”“position(s)_deleted”“delins”“inserted_sequence”
g.6775delinsGA
a deletion of nucleotide g.6775 (a T, not described), replaced by nucleotides GA, changing ..AGGCTCATT.. to ..AGGCGACATT..
参考文章:
http://varnomen.hgvs.org/recommendations/general/
http://www.sohu.com/a/158915410_603295
HGVS的变异格式的更多相关文章
- vcf格式
Variant Call Format(VCF)是一个用于存储基因序列突变信息的文本格式.表示单碱基突变, 插入/缺失, 拷贝数变异和结构变异等.BCF格式文件是VCF格式的二进制文件. CHROM ...
- 生物结构变异分析软件meerkat 0.189使用笔记(二)
一. 运行meerkat 前面已经依序安装了meerkat 的环境和meerkat,运行了预处理一步,在相对应的bam文件目录下生成了大批文件,因此,当要用meerkat处理某个bam文件时,应先将该 ...
- BIM特点及格式文件说明
BIM行业是建筑与IT结合而形成的一个新兴行业,既然能说是行业,说明它包含的内容非常丰富,懂一点和完全懂是两码事,就好像一滴水和一片大海的范围一样.现在国内有很多高校开设了BIM专业,并对口招收了学生 ...
- vcf格式简介
1)背景 伴随着大规模的基因分型及测序工程的产生(例如1000 Genomes Project),之前的信息贮存格式例如gff文件它记录了每一个基因的详细信息,其中许多基因信息在基因组之间是共享的,而 ...
- sam/bam格式
1)Sam (Sequence Alignment/Map) ------------------------------------------------- 1) SAM 文件产生背景 随着Ill ...
- GATK--数据预处理,质控,检测变异
版权声明:本文源自 解螺旋的矿工, 由 XP 整理发表,共 13781 字. 转载请注明:从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程 | Public Library o ...
- 33、VCF格式
转载:http://blog.sina.com.cn/s/blog_7110867f0101njf5.html http://www.cnblogs.com/liuhui0622/p/6246111. ...
- 日期格式代码出现两次的错误 ORA-01810
错误的原因是使用了两次MM . 一.Oracle中使用to_date()时格式化日期需要注意格式码 如:select to_date('2005-01-01 11:11:21','yyyy-MM-dd ...
- 一个粗心的Bug,JSON格式不规范导致AJAX错误
一.事件回放 今天工作时碰到了一个奇怪的问题,这个问题很早很早以前也碰到过,不过没想到过这么久了竟然又栽在这里. 当时正在联调一个项目,由于后端没有提供数据接口,于是我直接本地建立了一个 json ...
随机推荐
- POJ 3304 Segments(计算几何:直线与线段相交)
POJ 3304 Segments 大意:给你一些线段,找出一条直线可以穿过全部的线段,相交包含端点. 思路:遍历全部的端点,取两个点形成直线,推断直线是否与全部线段相交,假设存在这种直线,输出Yes ...
- Asp.net在页面间传递大量数据(数据表)建议采用的方法
能让数据在 两个不同站点之间传递吗? 我现在是想A站点的数据 传递到B站点....... 建议使用Cache (1)不太影响程序性能不太可能,你都说了,是大量数据.我举个例子,你是从A.aspx传到B ...
- Genymotion Android模拟器与fiddler 数据包拦截
Genymotion: https://www.genymotion.com/fun-zone/ https://www.genymotion.com/account/create/ cls清空记录 ...
- centos7.0 安装docker
yum -y install docker docker中常用的命令 docker run -it --name 新名字 centos /bin/bash docker images 查看所有镜像 ...
- 当公有云Azure拥抱Docker容器技术
本文转载至 http://3387405.blog.51cto.com/3377405/1598977 预见未来看似是一件不太可能的事情,然而现在企业科技高速发展的态势完全超乎想象. 就在几周前Inf ...
- SSH配置免秘钥登录
一. SSH 配置免秘要登录 配置SSH 免秘要登录,虽然就那么几步,但总是会出现点小问题,今天就做下记录.SSH 免秘钥就是让两台机器相互信任,不需要输入密码就能相互登录.配置相互信任就是把各自的 ...
- 【Python之路】第十六篇--Web框架之Tornado
概述 Tornado 是 FriendFeed 使用的可扩展的非阻塞式 web 服务器及其相关工具的开源版本.这个 Web 框架看起来有些像web.py 或者 Google 的 webapp,不过为了 ...
- rgba透明的兼容处理
background-color: rgba(0, 0, 0, .6);filter: progid:DXImageTransform.Microsoft.gradient(startColorstr ...
- 洛谷 P3263 [JLOI2015]有意义的字符串
洛谷 首先,看到\((\frac{(b+\sqrt{d})}{2})^n\),很快能够想到一元二次方程的解\(\frac{-b\pm\sqrt{\Delta}}{2a}\). 所以可以推出,\(\fr ...
- 2014牡丹江——Known Notation
题目链接 题意: 输入一个长度不超过1000的字符串,包含数字(1-9)和星号(*).字符串中的空格已经丢失,所以连起来的数字串能够看成很多分开的数.也能够看成连续的数,即能够随意加入空格. 如今有两 ...