转自:http://blog.sina.com.cn/s/blog_8088f3700101pab7.html

权威发布:长链非编码RNA命名规则

对于人类基因命名标准的制定而言,雨果基因命名委员会(HGNC)是唯一官方授权的机构。HGNC的数据库中有38000个基因名称,其中大部分是编码蛋
白基因;但HGNC也命名了8500多个人类非编码基因及假非编码基因,通过与各层次专家们的合作,他们命名了大多数的小非编码RNA。

小非编码RNA一般可根据它们的同源性及相同功能来分类。相比而言,长链非编码RNA则有其完全不同的一系列特点,它们的长度超过200个碱基,不具有保守序列的同源性,还有多变的功能属性。就像编码蛋白基因一样,长链非编码RNA也是尽量基于它们产物的已知功能来命名。

为了帮助科研人员能有效地命名lncRNA,让他们的命名更规范,名字更能反映功能,HGNC制作了这么一个命名指导标准,供科研人员参考。

在一个长链非编码RNA要发表之前,研究人员应先得到HGNC的认可。

依据相关预测,人类基因组中有大量的长链非编码RNA(至少几千条),但人类了解其功能的很少。所以,一般用基因组上下文来对未知功能的lncRNA命
名。HGNC希望与研究者们一起把长链非编码RNA命名的工作做好。HGNC的目标是让lncRNA的命名具有唯一性、准确性(让名字最大程度的反映功
能)。

lncRNA 命名指导标准
一条lncRNA要命名得合理准确,有一些原则需要去遵循,有许多的因素需要去注意。详细的命名原则及考虑因素如下:
每一条lncRNA的名字应具有唯一性

“名字唯一性”这条原则很重要,不能违反。它能让我们在研究分析某个基因时不会产生问题(不会发生这种事情:一条基因几个名字,存在重名的基
因等)。另一方面,上述问题也不利于HGNC对命名规则的管理及维护。如果一个作者发布一个lncRNA名字,而它已经在别的地方使用过,HGNC将会指
定一个新的名字供选择。例如,一个新的lncRNA,它的功能是维持上皮细胞在非分化状态,本来打算命名为ANCR,但是这个名字已经被使用于“快乐木偶
综合症染色体区,Angelman
syndrome chromosome region”,所以与作者达成一致,用DANCR来命名这个lncRNA“
differentiation antagonizing non-protein coding RNA”.

lncRNA的名字应是描述基因的缩写
每条lncRNA的标识都应是一个描述该基因的“缩写”或者“首字母简写”。
例如BANCR就是由‘BRAF-activated non-protein coding
RNA’短语的首字母排列而成。这样让人们容易理解名字的含义。

lncRNA的名字应仅由拉丁字母和阿拉伯数字组成
每条lncRNA的标识中不应出现标点符号,但可以用字母或者数字来代替标点符号。
连字符仅在特殊场合使用。例如:反义编码蛋白基因可在标识中加连字符(BACE1-AS就是BACE1 antisense
RNA的名字)。

lncRNA的名字中的字母应为大写
为了与其它种类物种的基因区别开来(如啮齿动物基因的标识只要求首字母大写,其余小写),人类基因标识中的字母都应为大写。
例如“热气”(HOTAIR)基因,在人类中叫HOTAIR,而在老鼠中写成Hotair。

lncRNA的名字中不应涉及具体的物种类型
例如:如果基因名字中有H/h(代表人类),由于牵涉到同源基因的问题,就会造成一些疑惑和误导。

lncRNA的标识应避免采用一些常用的词汇
基因的名字中出现的常用词汇会带来一些混乱,给分析研究带来很多问题,因此,在命名中应避免出现常见词汇。
例如:“AIRN”基因最初公布时叫‘AIR’,从公共数据库中搜索可得到22万条不相关的信息,而搜索“AIRN”则只有10条信息。可见“AIRN”的搜索效率有效得多。同样的例子很多。

lncRNA的标识应尽可能的反映其功能
例如:'XIST'基因是'X (inactive)-specific
transcript'的缩写,该基因的作用是参与沉默一对X染色体的转录。
命名的时候尽量反映基因通常的功能,而不体现其突变表型。基因的命名应简洁明了,不应包含太多信息。

  • 基因的标识中不应具有攻击或轻蔑的色彩。
  • 基因的标识中不应具有个人及地方色彩。
  • 基因的标识中不应含有神化,虚构或历史人物的名字。
  • 基因的标识中不应含有“臆想”和没什么意义的信息。

功能性转录假基因应包含它们假基因的名字
目前,一些数量较少的转录假基因被发现具有功能性,例如PTENP1基因就与“PTEN-targeting”miRNA结合一起参与调节PTEN的表达水平。

具有功能的转录假基因在命名时应保留它们的假基因名称,并且不应改变其基于功能的名称。为了方便搜索,这个功能应加在标识的最后。PTENP1的命名就是这方面的例子。PTENP1
是‘phosphatase and tensin homolog pseudogene 1 (functional)’.

如何命名未知功能的基因应遵循如下要求
未知功能的lncRNA应依据基因组上下文来命名,图一中给出如何系统化的命名的规则。

图一

如果有一个很接近的蛋白编码基因,lncRNA的名字应该以这个编码基因名字开始,然后制定以后后缀,这个后缀可以下方式分类:

反义
(antisense,AS),BACE1-AS;
内含子(intronic,IT),例如,SPRY4-IT1;
重叠
(overlapping,OT),例如,OSX2-OT;
长链基因间lncRNA(Long
intergenic
lncRNAs,lincRNAs),以LINC为前缀,数字为后缀,例如LINC00485.
本质上以上命名原则是以GNECODE的注释目录为基准,
反义RNA,正义内含子,正义重叠和长链基因间非编码RNA(lincRNA).一些新的分类方法也应该考虑,特别对这些lnRNA,它们与编码基因是头
碰头(head
to head),因此推断它们拥有双向启动子,HGNC推荐命名这些lncRNA为反义上游(Antisense
upstream,AU),例如,GENE2-AU1。大家也应该注意到HGNC并不赞成以剪接变异体来命名,所以两个剪接变异体命名是以其中一个
lncRNA基因来命名,例如,GENE2-AS1;如果一个lncRNA基因编码的转录本跨多于一个蛋白编码基因,用lncRNA的5’末端的第一个蛋
白编码基因来命名,例如GENE-AS2

上述命名的基本架构适用于大多数lncRNA,但对于基因密集区域的lncRNA可能就不适用了,这种情况下,你应该与HGNC沟通来解决。

HGNC致力于让人类基因组中lncRNA的命名有效、规范。想了解更多相关内容请访问
http://www.genenames.org/rna/LNCRNA,也可以给HGNC发邮件hgnc@genenames.org

权威发布:长链非编码RNA命名规则的更多相关文章

  1. 长链非编码RNA(lncRNA)

    长链非编码RNA(lncRNA) 转自:http://blog.sina.com.cn/s/blog_909da11301010bkz.html     长链非编码RNA(lncRNA)是一类转录本长 ...

  2. TCGA系列--TCGA长链非编码RNA的可视化工具TANRIC

    http://ibl.mdanderson.org/tanric/_design/basic/index.html

  3. 非编码RNA

    生命的基本过程是从DNA转录成mRNA,再翻译成蛋白质发挥功能.DNA就像一张绝密的密码图,不能随意被移动,只能被锁在细胞核里.要想知道这些密码,只能像复印一样,将密码图复印到mRNA上,由它们把这些 ...

  4. HDU4514(非连通图的环判断与图中最长链)

    题目:设计风景线 题意:给定一个无向图,图可能是非连通的,如果图中存在环,就输出YES,否则就输出图中最长链的长度. 分析:首先我们得考虑这是一个无向图,而且有可能是非连通的,那么就不能直接像求树那样 ...

  5. C# 编码规范、命名规则

    1  规范目的 ……………………………………………………… 3 2  适用范围 ……………………………………………………… 3 3  代码注释 ……………………………………………………… 3 3.1  ...

  6. java入门---基础语法&基础常识&编码规范&命名规范

        一个Java程序可以认为是一系列对象的集合,而这些对象通过调用彼此的方法来协同工作.下面简要介绍下类.对象.方法和实例变量的概念. 对象:对象是类的一个实例,有状态和行为.例如,一条狗是一个对 ...

  7. BZOJ.1758.[WC2010]重建计划(分数规划 点分治 单调队列/长链剖分 线段树)

    题目链接 BZOJ 洛谷 点分治 单调队列: 二分答案,然后判断是否存在一条长度在\([L,R]\)的路径满足权值和非负.可以点分治. 对于(距当前根节点)深度为\(d\)的一条路径,可以用其它子树深 ...

  8. ios开发之--编码及命名规范

    做了几年的开发工作,因为是半路出的家,所以对这块一直都没怎么重视,所以在工作中,出现了很多的尴尬场景,编码和命名的规范是一定得有的,最起码一个团队之间的规范也是很有必要的.面向对象的编程,其实很好理解 ...

  9. 「WC2010」重建计划(长链剖分/点分治)

    「WC2010」重建计划(长链剖分/点分治) 题目描述 有一棵大小为 \(n\) 的树,给定 \(L, R\) ,要求找到一条长度在 \([L, R]\) 的路径,并且路径上边权的平均值最大 \(1 ...

随机推荐

  1. pic计数

    #include <pic.h> //用的是PICC编译器 __CONFIG (HS & PROTECT & PWRTEN & BOREN & WDTDIS ...

  2. NOIP201302表达式求值

    NOIP201302表达式求值 题目描述 Description 给定一个只包含加法和乘法的算术表达式,请你编程计算表达式的值. 输入描述 Input Description 输入仅有一行,为需要你计 ...

  3. uml定义的使用的关系

    uml定义的关系主要有六种:依赖.类属.关联.实现.聚合和组合.下面对其定义和表示方法逐一说明. 依赖 (Dependency):元素A的变化会影响元素B,但反之不成立,那么B和A的关系是依赖关系,B ...

  4. Android的适配器

    //====================ArrayAdapter=================================== public class List1 extends  Ac ...

  5. 由 "select *" 引发的“惨案”

    今天凌晨做发布, 要合并多个分数据库的表数据到主数据库中, 有 30+ 分数据库. 前面都比较顺利, 在临近结束时,突然发现一个字段的值插入错误. 有一个表 T,字段分别为 (f1, f2, f3, ...

  6. iOS OC与swift相互调用

    小哥("我"的自称)个人混编的时候喜欢先创建OC项目,然后在项目中创建swift类.这样有个好处就是桥文件可以自动创建的同事路径不需要我手动去写了,另外还有个目的就是现在小哥自我感 ...

  7. [Android新手区] SQLite 操作详解--SQL语法

    该文章完全摘自转自:北大青鸟[Android新手区] SQLite 操作详解--SQL语法  :http://home.bdqn.cn/thread-49363-1-1.html SQLite库可以解 ...

  8. Dynamics AX 2012 R2 在报表上显示和打印条码

        AX中有对条码操作的封装,用其生成BarCodeString类型的值,再配合barcode128字体,即可在显示出条码.     废话不说,上代码. BarcodeCode128 barCod ...

  9. ASP+Access UTF-8 网页乱码问题解决办法

    用ACCESS数据库和ASP做网站时用UTF-8编码有时会出现乱码,再者网页出错或者刷新页面后就是乱码,如果数据库取值乱码在开头加上<%@LANGUAGE="VBSCRIPT" ...

  10. 十步完全理解 SQL(转载)

    英文出处:Lukas Eder. 很多程序员视 SQL 为洪水猛兽.SQL 是一种为数不多的声明性语言,它的运行方式完全不同于我们所熟知的命令行语言.面向对象的程序语言.甚至是函数语言(尽管有些人认为 ...