基因id转换
DAVID网站提供了id转换的功能
- 1 选择上传gene list文件
- 2 选择上传ID的类型,我们ID-list.txt中的是Ensembl Gene ID,所以这里选ENSEMBL_GENE_ID
- 3 这个是类型,因为只做ID转换,所以选Gene List就ok了
- 4 选择你要转换的ID类型,这里我选的ENTREZ_GENE_ID
- 5 然后选择提交就ok了

-
- 1 输入文件ID类型
- 2 输出ID类型,这里的Gene ID就是指ENTREZ GENE ID
- 3 输入ID列表,点击确定。测试的时候发现输出的结果不会超过5000个ID,如果需要转换的id比较多可以考虑分割文件再转换
3.ENSEMBL biomart
ensembl的官方网站提供的工具,ID转换比较齐全,而且除了转换ID之外,还有其他有意思的功能(留给你们自己去挖掘了),缺点就是不能做大量的ID转化,不过2000应该能行吧。
- 1 选择数据库:Ensembl Gene 86,Homo sapiens就ok
- 2,3 过滤,主要是输入要转换的ID,选择Ensembl Gene ID,将ID-list.txt导进去,如果想获取这个物种所有的对应关系,那么久什么都不用选;
- 4 attribute,主要是选择输出的内容,这里作为ID转换,输出就是Ensembl Gene ID和ENTREZ GENE ID就行。
- 5 设置完了以后最后点击results就会返回结果了。
4 从NCBI下载Gene ID 对应Ensemble ID的文件,写脚本进行转换ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/
Ensembl的Gene ID想要得到它的GENE Symbol的时候,一转换之后就有些对应不上了,有的Ensembl Gene ID对应不上Gene Symbol了,其实这是正常的,因为Ensembl属于EMBL-EBI,也就是欧洲生物信息学中心,NCBI属于美国生物信息学中心,他们对于基因组注释肯定是不同的,但是比较公认的一个观点是Ensembl Gene ID的注释更加详细,所以会出现一个Ensembl Gene ID对应几个Entrez Gene ID(Gene Symbol),或者一个Entrez Gene ID对应几个Ensembl Gene ID也是可能的,而我在对测序数据进行注释的时候几乎都是选用Ensembl提供的参考序列以及注释文件,一般不用NCBI的。
参考博客:http://blog.163.com/bioinfo_wen/blog/static/234301034201610510153827/
基因id转换的更多相关文章
- org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID,symbol等之间的转换)
1)安装载入 ------------------------------------------- if("org.Hs.eg.db" %in% rownames(install ...
- 常用Gene ID转换工具--转载
在自己的研究工作中,经常会遇到一些需要对Gene ID进行转换的情况.目前存在着大量的生物信息数据库,每个数据库都有自己定义的ID命名规则,转换起来实在是一个很大的工作.举个例子,之前构建的Human ...
- 微博mid和id转换
mid为62进制编码,id为常见的10进制编码. id从低位到高位,7个数字为一组,转换为62进制,并顺序合并,即转换为mid. mid从地位到高位,4个字母为一组,转换为10进制,并右移7位,计算和 ...
- 字符串ID转换成字符串名字
select U.CnName+',' from f_splitstr('1828,1055333,1,1035681,752,494,22549,219,23860,478,23453,677, ...
- 基因id
每个物种都有一个对应的Taxonomy ID: 9606 :人类 10090 :小鼠
- 有基因ID或者基因名,如何拿到对应的KEGG通路图?
1.https://www.kegg.jp/kegg/tool/map_pathway2.html 2.如下图,筛选出基因所在的通路,并标上不同的颜色. 3.结果页面如下,有些基因会找不到对应的通路, ...
- ABAP 将SAP用户ID转换成用户名
FORM frm_coverted_name USING usrid TYPE sy-uname CHANGING name TYPE adrp-name ...
- KEGG and Gene Ontology Mapping in Bioinformatic Method
使用KOBAS进行KEGG pathway和Gene Ontology分析 Article from Blog of Alfred-Feng http://blog.sina.com.cn/u/170 ...
- NCBI之gene系列
1.基因系列中的data索引 2.基因ID之间的转换 对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自 ...
随机推荐
- Angular惰性加载的特性模块
一:Angular-CLI建立应用 cmd命令:ng new lazy-app --routing (创建一个名叫 lazy-app 的应用,而 --routing 标识生成了一个名叫 app- ...
- Day13:H5+JS+C3
css布局中,什么是BFC BFC是Block formatting context的缩写,表示"块级格式化上下文". 设置BFC的元素,是一个独立的渲染区域,只有Block-le ...
- 2019暑期金华集训 Day6 杂题选讲
自闭集训 Day6 杂题选讲 CF round 469 E 发现一个数不可能取两次,因为1,1不如1,2. 发现不可能选一个数的正负,因为1,-1不如1,-2. hihoCoder挑战赛29 D 设\ ...
- 在Mac如何启动MySQL
安装好MySQL服务后(安装步骤可以参考系列经验1).打开“系统偏好设置”,单击下端的“MySQL”图标. 2 在“MySQL”对话框中,单击“启动MySQL服务”按钮. 3 在弹出的窗口中,输入管理 ...
- el-select定义初始值并且可以修改
[](https://img2018.cnblogs.com/blog/1338470/201811/1338470-20181112152013318-1731627947.png <el-f ...
- 数据库blob图片文件,多图片打包下载
数据库存储blob图片文件,前端打包下载 数据库图片文件实体类 package com.cmrh.mspserver.pos.dto; import java.io.Serializable; imp ...
- Spring boot RSA 文件加密解密
github项目地址 rsa_demo ##测试 加密D:/hello/test.pdf 文件,生成加密后的文件 testNeedDecode.pdf 对testNeedDecode.pdf 文件进行 ...
- 2019SDN上机第4次作业
一.作业要求 1.解压安装OpenDayLight控制器(本次实验统一使用Beryllium版本) 2.启动并安装插件 3.用Python脚本搭建给定的拓扑,并连接OpenDayLight控制器 4. ...
- 北漂IT男返乡2年的三线楼市观察(宜昌夷陵篇)-原创
一直想写点什么,这段时间总算有空,好嘞,正好有兴致来写一写楼市相关的文章以饕读者和粉丝朋友. 宜昌?说宜昌您可能不知道,但是说三峡大坝您就知道了 最近这两年,因为小宝的降临,我多半时间待在老家宜昌陪伴 ...
- 咏南中间件随LINUX开机自动启动
咏南中间件随LINUX开机自动启动 LINUX DEAMON,LINUX也有类似WINDOWS的服务. program ynCrossServer; {$HINTS OFF} {$APPTYPE CO ...