符号:

1.HGVS的变异格式由两部分组成:

1.1 reference sequence file identifier (accession.version-number) :  actual description of a variant

比如:NG_012232.1(NM_004006.2):c.357+1G>A

NG_012232.1(NM_004006.2)是the reference sequence file identifier。

c.357+1G>A:the actual description of a variant

1.2 具体解释

reference sequence file identifiter:只接受NCBI,EBI的公共文件的内容。包括NC_# (e.g. NC_000023.10), LRG_# (e.g. LRG_199), NG_# (e.g. NG_012232.1), ENSG00000182533.6, NM_# (e.g. NM_004006.2), ENST00000343849.2, NR_# (e.g. NR_002196.1) and NP_# (e.g. NP_003997.1)。注意,点号后面的内容是版本号,除了LRG_外,其它的格式都需要版本号。

actual description of a variant:由两部分组成,一是参考序列的类型,二是具体的突变信息。

2.具体变异描述的内容(actual description of a variant)

2.1。参考序列的类型

2.2。具体的突变信息。

 2.2.1.蛋白

1.1替代:

格式:“prefix”“amino_acid”“position”“new_amino_acid”

LRG_199p1:p.Trp24Cys missense 把一个氨基酸换成另一个氨基酸
LRG_199p1:p.Trp24Ter (p.Trp24*) nonsense 把一个氨基酸换成终止密码子
NP_003997.1:p.Cys188= slient 氨基酸没有变化

1.2缺失:

格式:“prefix”“amino_acid(s)+position(s)_deleted”“del”

p.Ala3del 第三个氨基酸Ala缺失
p.Ala3_Ser5del  第三个氨基酸到第五个氨基酸缺失

1.3重复:

格式:“prefix”“amino_acid(s)+position(s)_duplicated”“dup”

p.Ala3dup (one amino acid)a duplication of amino acid Ala3 in the sequence MetGlyAlaArgSerSerHis to MetGlyAlaAlaArgSerSerHis

1.4插入:

格式:“prefix”“amino_acids+positions_flanking”“ins”“inserted_sequence”

p.His4_Gln5insAla :the insertion of amino acid Ala between amino acids His4 and Gln5 changing MetLysGlyHisGlnGlnCys to MetLysGlyHisAlaGlnGlnCys

1.5移码(frame shift):移码是插入或缺失的一种特例。

格式: “prefix”“amino_acid”position”new_amino_acid”“fs”“Ter”“position_termination_site

p.Arg97ProfsTer23 :a variant with Arg97 as the first amino acid changed, shifting the reading frame, replacing it for a Pro and terminating at position Ter23

解释:第97位的Arg变为Pro,这次翻译终止为从该位点数起的第23个氨基酸。

 2.2.2基因

在用coding DNA作为参考序列时,其有自己的坐标定义图:

2.1 替代 :

格式: “prefix”“position_substituted”“reference_nucleotide””>”new_nucleotide”

    • NC_000023.10:g.33038255C>A
      a substitution of the C nucleotide at g.33038255 for an A
    • NG_012232.1(NM_004006.1):c.93+1G>T
      a substitution of the G nucleotide at c.93+1 (coding DNA reference sequence) with a T

2.2缺失

格式:“prefix”“position(s)_deleted”“del”

NG_012232.1:g.19_21del (several nucleotides)

a deletion of nucleotides g.19 to g.21 in the sequence AGAATCACA to AGAA___CA

2.3重复

格式:“prefix”“position(s)_duplicated”“dup”

NM_004006.2:c.20_23dup (NC_000023.10:g.33229407_33229410dup)

a duplication from position c.20 to c.23 in the sequence AGAAGTAGAGG to AGAAGTAGATAGAGG

2.4插入:

格式:“prefix”“positions_flanking”“ins”“inserted_sequence”

NC_000023.10:g.32862923_32862924insCCT (LRG_199t1:c.240_241insAGG)

the insertion of nucleotides CCT between nucleotides g.32862923 and g.32862924

2.5转换:一段序列被参考基因组的另一段序列替换

格式:“prefix”“positions_converted”“con”“positions_replacing_sequence”

NC_000022.10:g.42522624_42522669con42536337_42536382

conversion in exon 9 of the CYP2D6 gene replacing exon 9 nucleotides g.42522624 to g.42522669 with those of the 3’ flanking CYP2D7P1 gene, nucleotides g.42536337 to g.42536382 from the same genomic reference sequence (NC_000022.10)

2.6缺失插入

格式:“prefix”“position(s)_deleted”“delins”“inserted_sequence”

g.6775delinsGA

a deletion of nucleotide g.6775 (a T, not described), replaced by nucleotides GA, changing ..AGGCTCATT.. to ..AGGCGACATT..

参考文章:

http://varnomen.hgvs.org/recommendations/general/

http://www.sohu.com/a/158915410_603295

HGVS的变异格式的更多相关文章

  1. vcf格式

    Variant Call Format(VCF)是一个用于存储基因序列突变信息的文本格式.表示单碱基突变, 插入/缺失, 拷贝数变异和结构变异等.BCF格式文件是VCF格式的二进制文件. CHROM ...

  2. 生物结构变异分析软件meerkat 0.189使用笔记(二)

    一. 运行meerkat 前面已经依序安装了meerkat 的环境和meerkat,运行了预处理一步,在相对应的bam文件目录下生成了大批文件,因此,当要用meerkat处理某个bam文件时,应先将该 ...

  3. BIM特点及格式文件说明

    BIM行业是建筑与IT结合而形成的一个新兴行业,既然能说是行业,说明它包含的内容非常丰富,懂一点和完全懂是两码事,就好像一滴水和一片大海的范围一样.现在国内有很多高校开设了BIM专业,并对口招收了学生 ...

  4. vcf格式简介

    1)背景 伴随着大规模的基因分型及测序工程的产生(例如1000 Genomes Project),之前的信息贮存格式例如gff文件它记录了每一个基因的详细信息,其中许多基因信息在基因组之间是共享的,而 ...

  5. sam/bam格式

    1)Sam (Sequence Alignment/Map) ------------------------------------------------- 1) SAM 文件产生背景 随着Ill ...

  6. GATK--数据预处理,质控,检测变异

    版权声明:本文源自 解螺旋的矿工, 由 XP 整理发表,共 13781 字. 转载请注明:从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程 | Public Library o ...

  7. 33、VCF格式

    转载:http://blog.sina.com.cn/s/blog_7110867f0101njf5.html http://www.cnblogs.com/liuhui0622/p/6246111. ...

  8. 日期格式代码出现两次的错误 ORA-01810

    错误的原因是使用了两次MM . 一.Oracle中使用to_date()时格式化日期需要注意格式码 如:select to_date('2005-01-01 11:11:21','yyyy-MM-dd ...

  9. 一个粗心的Bug,JSON格式不规范导致AJAX错误

    一.事件回放  今天工作时碰到了一个奇怪的问题,这个问题很早很早以前也碰到过,不过没想到过这么久了竟然又栽在这里. 当时正在联调一个项目,由于后端没有提供数据接口,于是我直接本地建立了一个 json ...

随机推荐

  1. LeetCode 递归(Recursion) 培训专题 讲解文章翻译 (附链接)

     递归 - 时间复杂度 在本文中, 我们主要介绍如何分析递归算法程序中的时间复杂度.. 在一个递归程序中, 它的时间复杂度 O(T) 一般来说就是他总共递归调用的次数 (定义为 R) 以及每次调用时所 ...

  2. Hibernate每个具体类一张表映射(使用注释)

    在每个类创建一张表的情况下, 表中不使用Null值的列. 这种方法的缺点是在子类表中创建了重复的列. 在这里,我们需要在父类中使用@Inheritance(strategy = Inheritance ...

  3. tonymillion/Reachability的使用

    tonymillion/Reachability是GitHub上的一个开源工具类,目測是依据Apple的Reachability Demo改写而成. 该类能够測试到某一网络.主机等的可达性,支持Blo ...

  4. 循环杀死Mysql sleep进程脚本

    #!/bin/sh while : do n=`mysqladmin processlist -uadmin -p***|grep -i sleep |wc -l` date=`date +%Y%m% ...

  5. Laravel5.1 模型--查询作用域

    所谓的查询作用域就是允许你自定义一个查询语句 把它封装成一个方法. 1 定义一个查询作用域 定义查询作用域就是在模型中声明一个scope开头的方法: public function scopeHotA ...

  6. TFS2013安装与使用图文教程

    from:http://www.jb51.net/softjc/214560.html TFS2013安装与使用图文教程 一.安装和配置过程介绍 要安装TFS2013当然要先进行下载了,可以在下面的地 ...

  7. VMware下安装centos6.7的步骤

    一.虚拟机的创建 1.点击创建新的虚拟机(图片红框的位置) 2.选择自定义安装.下一步(根据自己的需要有选择的进行选择) 3.新装的虚拟机的版本和虚拟机兼容的产品以及这个版本的虚拟机的限制(这个窗口没 ...

  8. K-th Number(主席树)

    K-th Number Time Limit: 20000MS   Memory Limit: 65536K Total Submissions: 59327   Accepted: 20660 Ca ...

  9. SharePoint服务器端对象模型 之 访问网站和列表数据(Part 4)

    (四)栏/字段 SharePoint中的字段(中文版中叫做"栏")与传统的数据栏类似,也有不同类型的区别,不过SharePoint中内置的栏类型除了按照数据类型(如数字.日期和时间 ...

  10. SharePoint服务器端对象模型 之 使用CAML进行数据查询(Part 2)

    (三)使用SPQuery进行列表查询 1.概述 列表查询主要是指在一个指定的列表(或文档库)中按照某些筛选.排序条件进行查询.列表查询主要使用SPQuery对象,以及SPList的GetItems方法 ...