1. DAVID网站提供了id转换的功能

    • 1 选择上传gene list文件
    • 2 选择上传ID的类型,我们ID-list.txt中的是Ensembl Gene ID,所以这里选ENSEMBL_GENE_ID
    • 3 这个是类型,因为只做ID转换,所以选Gene List就ok了
    • 4 选择你要转换的ID类型,这里我选的ENTREZ_GENE_ID
    • 5 然后选择提交就ok了
  2. bioDBnet

    • 1 输入文件ID类型
    • 2 输出ID类型,这里的Gene ID就是指ENTREZ GENE ID
    • 3 输入ID列表,点击确定。测试的时候发现输出的结果不会超过5000个ID,如果需要转换的id比较多可以考虑分割文件再转换

3.ENSEMBL biomart
ensembl的官方网站提供的工具,ID转换比较齐全,而且除了转换ID之外,还有其他有意思的功能(留给你们自己去挖掘了),缺点就是不能做大量的ID转化,不过2000应该能行吧。

  • 1 选择数据库:Ensembl Gene 86,Homo sapiens就ok
  • 2,3 过滤,主要是输入要转换的ID,选择Ensembl Gene ID,将ID-list.txt导进去,如果想获取这个物种所有的对应关系,那么久什么都不用选;
  • 4 attribute,主要是选择输出的内容,这里作为ID转换,输出就是Ensembl Gene ID和ENTREZ GENE ID就行。
  • 5 设置完了以后最后点击results就会返回结果了。

4 从NCBI下载Gene ID 对应Ensemble ID的文件,写脚本进行转换ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/

Ensembl的Gene ID想要得到它的GENE Symbol的时候,一转换之后就有些对应不上了,有的Ensembl Gene ID对应不上Gene Symbol了,其实这是正常的,因为Ensembl属于EMBL-EBI,也就是欧洲生物信息学中心,NCBI属于美国生物信息学中心,他们对于基因组注释肯定是不同的,但是比较公认的一个观点是Ensembl Gene ID的注释更加详细,所以会出现一个Ensembl Gene ID对应几个Entrez Gene ID(Gene Symbol),或者一个Entrez Gene ID对应几个Ensembl Gene ID也是可能的,而我在对测序数据进行注释的时候几乎都是选用Ensembl提供的参考序列以及注释文件,一般不用NCBI的。
参考博客:http://blog.163.com/bioinfo_wen/blog/static/234301034201610510153827/

基因id转换的更多相关文章

  1. org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID,symbol等之间的转换)

    1)安装载入 ------------------------------------------- if("org.Hs.eg.db" %in% rownames(install ...

  2. 常用Gene ID转换工具--转载

    在自己的研究工作中,经常会遇到一些需要对Gene ID进行转换的情况.目前存在着大量的生物信息数据库,每个数据库都有自己定义的ID命名规则,转换起来实在是一个很大的工作.举个例子,之前构建的Human ...

  3. 微博mid和id转换

    mid为62进制编码,id为常见的10进制编码. id从低位到高位,7个数字为一组,转换为62进制,并顺序合并,即转换为mid. mid从地位到高位,4个字母为一组,转换为10进制,并右移7位,计算和 ...

  4. 字符串ID转换成字符串名字

    select  U.CnName+','  from f_splitstr('1828,1055333,1,1035681,752,494,22549,219,23860,478,23453,677, ...

  5. 基因id

    每个物种都有一个对应的Taxonomy ID: 9606 :人类 10090 :小鼠

  6. 有基因ID或者基因名,如何拿到对应的KEGG通路图?

    1.https://www.kegg.jp/kegg/tool/map_pathway2.html 2.如下图,筛选出基因所在的通路,并标上不同的颜色. 3.结果页面如下,有些基因会找不到对应的通路, ...

  7. ABAP 将SAP用户ID转换成用户名

    FORM frm_coverted_name USING usrid TYPE sy-uname                        CHANGING name TYPE adrp-name ...

  8. KEGG and Gene Ontology Mapping in Bioinformatic Method

    使用KOBAS进行KEGG pathway和Gene Ontology分析 Article from Blog of Alfred-Feng http://blog.sina.com.cn/u/170 ...

  9. NCBI之gene系列

    1.基因系列中的data索引 2.基因ID之间的转换 对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自 ...

随机推荐

  1. 像素迷踪,当Unity的Frame Debugger力不从心时

    http://www.manew.com/thread-92382-1-1.html 从版本5开始,Unity包含了一个全新的可视化帧调试工具,Frame Debugger.该工具能帮你解决很多图形方 ...

  2. 数据结构实验之排序六:希尔排序 (SDUT 3403)

    其实,感觉好像增量不同的冒泡,希尔排序概念以后补上. #include <bits/stdc++.h> using namespace std; int a[10005]; int b[1 ...

  3. MySQL5.7 基础之二

    设计范式: 第一范式:字段是原子性 第二范式:存在可用主键 第三范式:任何表都不应该有依赖于其它表非主键的字段 创建数据库.设计数据表 字段:字段名.数据类型.约束(通过键来实现,而键其实可以当做索引 ...

  4. [luogu 4719][模板]动态dp

    传送门 Solution \(f_{i,0}\) 表示以i节点为根的子树内,不选i号节点的最大独立集 \(f_{i,1}\)表示以i节点为根的子树内,选i号节点的最大独立集 \(g_{i,0}\) 表 ...

  5. #C++初学记录(acm试题#预处理)

    C - Lucky 7 in the Pocket BaoBao loves number 7 but hates number 4, so he refers to an integer as a ...

  6. NoSql数据库MongoDB系列(1)——MongoDB简介

    一.NoSQL简介    NoSQL(Not Only SQL ),意即“不仅仅是SQL” ,指的是非关系型的数据库 .是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨.No ...

  7. [转]MyEclipse基础学习:Java EE Learning Center

    我就不翻译了,直接给出Java EE学习中心的原文链接: Java EE Learning Center 另外,给出MyEclipse IDE 环境中Apache Tomcat server服务器正常 ...

  8. 阿里云ECS服务器环境搭建(1) —— ubuntu 16.04 图形界面的安装

    阿里云ECS服务器环境搭建(1) —— ubuntu 16.04 图形界面的安装1. 背景在我们购买阿里云ECS服务器之后,默认的系统环境是很干净的,我购买的是ubuntu16.04,远程登录进入之后 ...

  9. 大数据/NoSQL经典电子书pdf下载

    Hadoop系列 Cloudera出品的各种官方文档 入门必备 https://www.cloudera.com/documentation.html Cloudera Hadoop大数据平台实战指南 ...

  10. Variance Inflation Factor (VIF) 方差膨胀因子解释_附python脚本

    python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_camp ...