基因id转换
DAVID网站提供了id转换的功能
- 1 选择上传gene list文件
- 2 选择上传ID的类型,我们ID-list.txt中的是Ensembl Gene ID,所以这里选ENSEMBL_GENE_ID
- 3 这个是类型,因为只做ID转换,所以选Gene List就ok了
- 4 选择你要转换的ID类型,这里我选的ENTREZ_GENE_ID
- 5 然后选择提交就ok了
-
- 1 输入文件ID类型
- 2 输出ID类型,这里的Gene ID就是指ENTREZ GENE ID
- 3 输入ID列表,点击确定。测试的时候发现输出的结果不会超过5000个ID,如果需要转换的id比较多可以考虑分割文件再转换
3.ENSEMBL biomart
ensembl的官方网站提供的工具,ID转换比较齐全,而且除了转换ID之外,还有其他有意思的功能(留给你们自己去挖掘了),缺点就是不能做大量的ID转化,不过2000应该能行吧。
- 1 选择数据库:Ensembl Gene 86,Homo sapiens就ok
- 2,3 过滤,主要是输入要转换的ID,选择Ensembl Gene ID,将ID-list.txt导进去,如果想获取这个物种所有的对应关系,那么久什么都不用选;
- 4 attribute,主要是选择输出的内容,这里作为ID转换,输出就是Ensembl Gene ID和ENTREZ GENE ID就行。
- 5 设置完了以后最后点击results就会返回结果了。
4 从NCBI下载Gene ID 对应Ensemble ID的文件,写脚本进行转换ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/
Ensembl的Gene ID想要得到它的GENE Symbol的时候,一转换之后就有些对应不上了,有的Ensembl Gene ID对应不上Gene Symbol了,其实这是正常的,因为Ensembl属于EMBL-EBI,也就是欧洲生物信息学中心,NCBI属于美国生物信息学中心,他们对于基因组注释肯定是不同的,但是比较公认的一个观点是Ensembl Gene ID的注释更加详细,所以会出现一个Ensembl Gene ID对应几个Entrez Gene ID(Gene Symbol),或者一个Entrez Gene ID对应几个Ensembl Gene ID也是可能的,而我在对测序数据进行注释的时候几乎都是选用Ensembl提供的参考序列以及注释文件,一般不用NCBI的。
参考博客:http://blog.163.com/bioinfo_wen/blog/static/234301034201610510153827/
基因id转换的更多相关文章
- org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID,symbol等之间的转换)
1)安装载入 ------------------------------------------- if("org.Hs.eg.db" %in% rownames(install ...
- 常用Gene ID转换工具--转载
在自己的研究工作中,经常会遇到一些需要对Gene ID进行转换的情况.目前存在着大量的生物信息数据库,每个数据库都有自己定义的ID命名规则,转换起来实在是一个很大的工作.举个例子,之前构建的Human ...
- 微博mid和id转换
mid为62进制编码,id为常见的10进制编码. id从低位到高位,7个数字为一组,转换为62进制,并顺序合并,即转换为mid. mid从地位到高位,4个字母为一组,转换为10进制,并右移7位,计算和 ...
- 字符串ID转换成字符串名字
select U.CnName+',' from f_splitstr('1828,1055333,1,1035681,752,494,22549,219,23860,478,23453,677, ...
- 基因id
每个物种都有一个对应的Taxonomy ID: 9606 :人类 10090 :小鼠
- 有基因ID或者基因名,如何拿到对应的KEGG通路图?
1.https://www.kegg.jp/kegg/tool/map_pathway2.html 2.如下图,筛选出基因所在的通路,并标上不同的颜色. 3.结果页面如下,有些基因会找不到对应的通路, ...
- ABAP 将SAP用户ID转换成用户名
FORM frm_coverted_name USING usrid TYPE sy-uname CHANGING name TYPE adrp-name ...
- KEGG and Gene Ontology Mapping in Bioinformatic Method
使用KOBAS进行KEGG pathway和Gene Ontology分析 Article from Blog of Alfred-Feng http://blog.sina.com.cn/u/170 ...
- NCBI之gene系列
1.基因系列中的data索引 2.基因ID之间的转换 对于生信,依托于别人的工具不如自己动手,由于研究发表的滞后性,往往很多工具提供的转换并不是最新的,况且开发者水平也参差不齐,理解原理才能让你来去自 ...
随机推荐
- 2019暑期金华集训 Day7 动态规划
自闭集训 Day7 动态规划 LOJ6395 首先发现这个树的形态没啥用,只需要保证度数之和是\(2n-2\)且度数大于0即可. 然后设\(dp_{i,j}\)表示前\(i\)个点用了\(j\)个度数 ...
- 割点 —— Tarjan 算法
由于对于这一块掌握的十分不好,所以在昨天做题的过程中一直困扰着我,好不容易搞懂了,写个小总结吧 qwq~ 割点 概念 在无向连通图中,如果将其中一个点以及所有连接该点的边去掉,图就不再连通,那么这个点 ...
- Pytest权威教程17-安装和使用插件
目录 安装和使用插件 在测试模块或conftest文件中要求/加载插件 找出哪些插件是可用的 按名称取消/取消注册插件 返回: Pytest权威教程 安装和使用插件 本节讨论如何安装和使用第三方插件. ...
- CAS5.3服务器搭建及SpringBoot整合CAS实现单点登录
1.1 什么是单点登录 单点登录(Single Sign On),简称为 SSO,是目前比较流行的企业业务整合的解决方案之一.SSO的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的 ...
- 安卓开发实战之app之版本更新升级(DownloadManager和http下载)完整实现
转载: https://blog.csdn.net/u013278099/article/details/52692008 前言 本文将讲解app的升级与更新.一般而言用户使用App的时候升级提醒有两 ...
- ubuntu之路——day11.3 不匹配数据划分的偏差和方差
在11.2中,我们提到了一种数据划分的方法,那么怎么衡量这种数据划分方法中的误差呢? 来看一个例子:有20w条各种领域的语音识别数据,2w条汽车语音定位数据 train+dev+test,其中trai ...
- T-MAX组--项目冲刺(第三天)
THE THIRD DAY 项目相关 作业相关 具体描述 所属班级 2019秋福大软件工程实践Z班 作业要求 团队作业第五次-项目冲刺 作业正文 T-MAX组--项目冲刺(第三天) 团队名称 T-MA ...
- np.vstack()和np.hstack()
本文链接:https://blog.csdn.net/m0_37393514/article/details/79538748在这里我们介绍两个拼接数组的方法: np.vstack():在竖直方向上堆 ...
- You are using the runtime-only build of Vue where the template compiler is not available. Either pre
在升级脚手架到vue-cli3.0版本的时候出现了这个报错: [Vue warn]: You are using the runtime-only build of Vue where the tem ...
- android: Android水波纹点击效果
Android API 21及以上新增了ripple标签用来实现水波纹的效果.我们可以通过设置ripple背景来实现一些View点击效果. 该水波纹效果有两种:一种是有界的(点击后类似于一个矩形向四周 ...