NCBI淘汰序列GI - 使用Accession.Version代替!

截至2016年9月,被称为“GI”的整数序列标识符将不再包括在NCBI支持的序列记录的GenBank,GenPept和FASTA格式中。FASTA标题将进一步简化,以便仅报告国际序列数据库协作(INSDC)和NCBI参考序列(RefSeq)项目管理的登录的序列登录号和记录标题。 当NCBI进行此转换时,我们鼓励具有依赖于GI的工作流的任何用户开始计划使用accession.version标识符。2016年9月之后,任何完全依赖于地理标志的过程将不再像预期的那样发挥作用。

GI号自GenBank版本81.0(1994年2月)以来一直在使用,作为登录号的附加标识符,以稳定地参考序列记录的特定版本。版本跟踪在1997年作为整数后缀添加到登记号中,该后缀随着对记录中的序列数据的每次更新而增加。例如,“ AC020606.7 ”表示记录的序列内容自第一次发布以来已更新六次。因此,已经以冗余方式通过GI和登录版本提供序列版本化信息。在过去十年中,NCBI继续以快速增长的速度接收新的或更新的序列的提交。为了回应这一点,我们不得不开发使用accession.version信息的新数据存储解决方案,而不是GI信息,以跟踪更新。缺乏GI的序列的当前实例包括WGS和TSA项目中的未注释重叠群。这导致我们传送版本信息不一致的情况。

考虑到数据提交数量的持续增加和记录提交的日益不一致,现在是我们采取下一步,删除旧的冗余GI标识符并保留序列版本的单一标识符的时候了,可读的accession.version。这种改变将简化跟踪序列的过程,而没有任何功能的损失。这种变化还将通过促进使用accession.version作为优选序列标识符来简化科学通信。因此,在接下来的几个月中,我们将不再将GI分配给越来越多的新序列。具有现有GI的序列记录将以某些表示格式保留它们,例如ASN.1和5列特征表格格式,但GI值将不再以其他表示格式显示,包括GenBank平面文件和FASTA格式。将继续支持接受GI作为输入的NCBI服务,并且NCBI将向当前不支持它们的所有服务添加对accession.version标识符的支持。

这种转换到停止分配和报告GI首先在2013年12月的GenBank 199.0版本说明中描述,并在最近的GenBank更新中描述。有关背景信息,请参见当前GenBank发行说明的第1.4.1节:ftp : //ftp.ncbi.nih.gov/genbank/gbrel.txt

由INSDC和所有NCBI RefSeq记录交换的所有序列记录的FASTA显示也将更改为仅报告accession.version和记录标题。这将提高与NCBI提供的其他文件类型(包括GFF3,Gene和dbSNP下载文件)的兼容性。基于用户请求,已经对来自重新设计的基因组FTP位点的数据进行了该FASTA格式改变,以具有GFF3和FASTA格式的单一一致的序列标识符。请参阅此更改的以前公告:http://www.ncbi.nlm.nih.gov/news/08-26-2014-new-genomes-FTP-live/ ..此时,我们计划继续提供来自非INSDC和非RefSeq源的序列的FASTA显示中的数据库源信息,包括:SwissProt,PDB结构,PIR和专利序列。

2016年9月之后,这些更改将开始出现在平面文件和FASTA格式序列数据,NCBI编程实用程序结果以及GenBank和RefSeq全面FTP版本的NCBI Web视图中。

实施例1:INSDC核苷酸记录 - 在下面的样品记录中,核苷酸序列AF123456被分配GI为6633795,并且从其编码区特征翻译的蛋白质被分配GI为6633796:

2016年9月之后,accession.version将是序列版本的唯一指示符。VERSION行上的GI值和编码区特征的GI / db_xref限定符将不再可见。

实施例2:GenPept蛋白质记录 - 当前记录显示包括VERSION行中的GI。注意,GenPept格式的编码区特征从未包括GI值的显示。

2016年9月后,VERSION行将不包含GI值:

示例3:对FASTA格式的更改:GI和数据库源值将从FASTA头中删除 - 在大多数资源中,当前的FASTA显示当前包括GI和数据库源信息(例如,GenBank的'gb'), '。下游分析工具通常需要首先处理FASTA标题行以将序列标识符部分简化为登录版本或GI。复杂的FASTA序列标识符以黄色突出显示:

2016年9月之后,将在FASTA标题中提供一个简单的序列ID用于核苷酸和蛋白质记录

如果要用2016年以前的软件构建database时候要注意了!

NCBI News的更多相关文章

  1. download ncRNA sequences form NCBI

    #!/bin/bash usage() { echo;echo "Usage: ./`basename $0` [gi number list] [number of cpu]"; ...

  2. NCBI database download

    ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp-private.ncbi.nlm.nih.go ...

  3. 生物信息大数据&数据库(NCBI、EBI、UCSC、TCGA)

    想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件: -生物信息学:导论与方法 北大\ 生物信息数据库及软件资源 一个优秀的生信开发者能够解决如下问题: 如何鉴定一个重要的且没 ...

  4. NCBI原始数据下载by Aspera Connect

    主要参考这篇文章: http://mp.weixin.qq.com/s?__biz=MzA5NjU5NjQ4MA==&mid=2651154488&idx=1&sn=e693a ...

  5. NCBI下载sra数据(新)

      今天要上NCBI下载sra数据发现没有下载的链接,网上查发现都是老的方法,NCBI页面已经变更,于是看了NCBI的help,并且记录下来新版的sra数据下载方法,要用NCBI的工具SRA Tool ...

  6. NCBI通过氨基酸位置查看相邻SNP

    进入NCBI网站 在SNP的搜索框中输入SNP位点,比如“rs52811957” 在弹出的对话框中选择“Gene View” 进入以后会显示该变异相邻SNP.原始氨基酸.变异后的氨基酸.positio ...

  7. 【只要有ENA千万别用NCBI】拆分SRA文件,通过SRAtoolkits

    只要有ENA千万别用NCBI!!!! 最近开始分析网上Download的数据,一开始用人家现成的GWAS数据,后来觉得反正自己的数据到手该做的也是要做的,出来混早晚是要还的,所以就开始从头分析一些SR ...

  8. 从 NCBI 批量下载基因组的方法

    先下载 assembly summary files The assembly_summary files report metadata for the genome assemblies on t ...

  9. NCBI上查看SNP位点在哪个基因座上(locus)

    首先,进入NCBI的主页网站:https://www.ncbi.nlm.nih.gov/variation/view/ 进入后,在下图红色框框位置输入目的SNP,比如rs608139 输完后,出现如下 ...

  10. 上传RNA-seq数据到NCBI GEO数据库

    SRA - NCBI example - NCBI 要发文章了,审稿时编辑肯定会要求你上传NGS测序数据. 一般数据都是放在集群,不可能放在个人电脑上,因为有的数据大的吓人(几个T). 所以我们就建一 ...

随机推荐

  1. springMVC数据交互

    控制器 作为控制器,大体的作用是作为V端的数据接收并且交给M层去处理,然后负责管理V的跳转.SpringMVC的作用不外乎就是如此,主要分为:接收表单或者请求的值,定义过滤器,跳转页面:其实就是ser ...

  2. solo

    solo - 必应词典 美['soʊloʊ]英['səʊləʊ] n.[乐]独奏(曲):独唱(曲):单人舞:单独表演 adj.独唱[奏]的:单独的:单人的 v.独奏:放单飞 adv.独 网络梭罗:独奏 ...

  3. Kafka、 RabbitMQ、Redis、 ZeroMQ、 ActiveMQ、 Kafka/Jafka 对比

    Kafka是一种分布式的,基于发布/订阅的消息系统.主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间复杂度的访问性能. 高吞吐率.即使在非常廉价 ...

  4. HTML5拖拽事件笔记

    在HTML5的规范中,我们可以通过为元素增加`draggable="true"`来设置此元素是否可以进行拖拽操作,其中图片.链接默认是开启的. 1. 拖拽元素:设置了`dragga ...

  5. first H5

    <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content ...

  6. 将文件转换成byte[]数组

    代码 /// <summary> /// 将文件转换成byte[] 数组 /// </summary> /// <param name="fileUrl&quo ...

  7. vue 动态修改el-upload 的action

    action是一个必填参数,且其类型为string,我们把action写成:action,然后后面跟着一个方法名,调用方法,返回你想要的地址,代码示例: //html 代码 <el-upload ...

  8. linux操作系统-两台linux服务器SSH免密码登录

    A为本地主机(即用于控制其他主机的机器) ; B为远程主机(即被控制的机器Server), ip为192.168.100.247 ; A和B的系统都是Linux   在A上的命令 # ssh-keyg ...

  9. Linux pip安装使用详解

    简介 pip是Python有它自己的包管理工具,与yum和apt-get相似. 安装步骤: 1.下载get-pip.py:https://bootstrap.pypa.io/get-pip.py 2. ...

  10. C# 通过api函数GetPrivateProfileString读取ini文件,取不到值

    通过api函数GetPrivateProfileString读取ini文件,取不到值,测试了好长时间,都不行 确认程序,ini文件都没有错误的情况,最后发现是ini文件编码的原因. 将ini文件的编码 ...