GO 和 KEGG 的区别 | GO KEGG数据库用法 | 基因集功能注释 | 代谢通路富集
一直都搞不清楚这两者的具体区别。
其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库。
建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别。
以下以一个案例来详细说明两者的区别:
推荐一个没有任何基础的人都能使用的gene set注释工具
http://www.webgestalt.org/option.php
GCLC
TFPI
HSPB6
TSPOAP1
ITGA2B
OSBPL7
BAIAP2L1
NOS2
PAX6
CD4
PIK3C2A
PRICKLE3
RGPD5
PLEKHB1
EHD2
RRAGD
FAS
PNPLA6
ATP6V1H
RRM2B
FSTL4
LAMA3
SYNE2
SLC2A3
PSD
DGAT2
SEZ6
SLC6A16
CHI3L2
GSTO2
SEC61A2
TLE2
SLC9A7
ZMYND12
NGEF
METTL22
RASGRP2
PITX1
GAL
DRD4
PTPN3
MYO3B
LNX1
ACAP1
PANX2
LLGL2
CLCN4
FMO4
TPD52
NMRK2
MAP2
RBFOX1
MYH7B
RAPGEF3
RFX3
IGSF9B
CROCCP3
OVGP1
SNX10
HSD17B2
HSD17B14
FTL
MT3
LPCAT2
TESC
LYZ
GOLGA3
EFNB1
MYO15A
ZFHX4
JAK2
ERMP1
HSD17B7P2
CATSPERG
PICK1
ACR
PVALB
PROCR
SGK2
EEF1A2
SIRPB1
MROH8
LIPG
LAMA1
NOL4
GPR143
把以上gene copy到txt里,命名为gene.txt
选项如下:

提交。。。
结果如下:

这是一种GO的分析结果,可以看到我们的基因被归类到一个一个的叫GO term的东西里。
GO数据库是一个树状的结构,顶层有三个根节点,分别问:BP,MF和CC。(具体是啥百度一下即可知)
同样我们把 Select Functional Database 改成 “pathway”,选“KEGG”就可以做道谢通路富集了。

KEGG数据库是网状的,由很多张以下的图组成,都是人工注释的。

以上使用的都是ORA方法,还有一种著名的工具叫做GSEA (Select Method of Interest里选择)。
GSEA 还可以利用每个基因的 rank 信息,来做富集分析。
总结一下:
GO数据库的基础就是一个一个的GO term,它们是树状的结构,存在冗余。GO database的root node有三个,分别为BP、CC、MF。KEGG就是人工注释的一张又一张代谢通路,是网状的。
GO term是一个纯粹的基因集,没有定义里面基因的相互关系;KEGG不仅有基因集,还定义了基因和代谢物之间的复杂的相互关系,所以才能叫做pathway。
论相似性,从纯基因集的角度,GO的BP和KEGG有较高的相似性。
进阶推荐:
想用R做GO和KEGG注释的可以看我的其他文章。
R获取指定GO term和KEGG pathway的gene list基因集
GSEA - Gene set enrichment analysis 基因集富集 | ORA - Over-Representation Analysis
参考:
GO 和 KEGG 的区别 | GO KEGG数据库用法 | 基因集功能注释 | 代谢通路富集的更多相关文章
- R获取指定GO term和KEGG pathway的gene list基因集
clusterProfiler没有显性的接口,但是可以直接扣取clusterProfiler里的函数. 核心函数就是get_GO_data GO_DATA <- get_GO_data(&quo ...
- Hbase总结(一)-hbase命令,hbase安装,与Hive的区别,与传统数据库的区别,Hbase数据模型
Hbase总结(一)-hbase命令 下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称 命令表达式 创建表 create '表名称', ...
- Vc数据库编程基础MySql数据库的表查询功能
Vc数据库编程基础MySql数据库的表查询功能 一丶简介 不管是任何数据库.都会有查询功能.而且是很重要的功能.上一讲知识简单的讲解了表的查询所有. 那么这次我们需要掌握的则是. 1.使用select ...
- SharePoint 2010/2013/2016内容数据库与网站集的关系
总得来说,内容数据库和网站集的关系是: 一个内容数据库里可以有多个网站集,但是一个网站集只能存在于一个内容数据库. 那么问题来了 问题1:我能否在创建网站集时指定内容数据库呢?或者说我能在指定的内容数 ...
- NoSQL数据库Mongodb副本集架构(Replica Set)高可用部署
NoSQL数据库Mongodb副本集架构(Replica Set)高可用部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. MongoDB 是一个基于分布式文件存储的数据库.由 C ...
- 【问题&解决】还原数据库提示“介质集有2个介质簇,但只提供了1个。必须提供所有成员”的解决办法
今天在对数据库备份与还原的过程中,我遇到一个问题“介质集有2个介质簇,但只提供了1个.必须提供所有成员”,下面详细的介绍一下遇到问题的经过与问题解决的方法! 一.备份与还原遇到的问题描述与解决方法: ...
- HashMap,Hashset,ArrayList以及LinkedList集合的区别,以及各自的用法
基础内容 容器就是一种装其他各种对象的器皿.java.util包 容器:Set, List, Map ,数组.只有这四种容器. Collection(集合) 一个一个往里装,Map 一对一对往里装. ...
- 数据库SQL Server 2016“功能选择”详细说明及精简安装选择
前言 在平时大家安装数据库的时候,一般默认功能选择都会选择全选.但是前两天公司同事问我:"那么多功能为什么都能用到嘛?"顿时,我思考了一下确实没有详细了解每个功能的详细作用,于是花 ...
- 11g RAC 集群数据库不能跟随集群启动
1.查看集群资源详细情况 [oracle@rac01-+ASM1 ~]$ crsctl stat res -p 2.修改集群资源ora.rac.db的auto_start属性改为always [ora ...
随机推荐
- VS2010/MFC编程入门之四十四(MFC常用类:定时器Timer)
前面一节鸡啄米讲了CTime类和CTimeSpan类的使用,本节继续讲与时间有关的定时器.定时器并不是一个类,主要考虑到,提起时间的话就不能不说定时器,所以就把它放到CTime和CTimeSpan之后 ...
- ROS知识(2)----理解ROS系统结构
学习新事物,方法高于技术本身,如果没有把握"BIG PICTURE"的话很难理解进去.通过以下几点进行理解ROS: ROS实际上不是操作系统,他只是一个通信的框架,一个代码管理的架 ...
- python webdriver操作浏览器句柄
断言 assert self.driver.title.find(u"搜狗搜索引擎")>=0, "assert error" 浏览器后退,前进,前进前要先 ...
- http协议/获得请求/中文参数处理/访问数据库
# 1. http协议(了解)## (1)什么是http协议?一种网络应用层协议,规定了浏览器与web服务器之间如何通信以及相应的的数据包的结构.注:tcp/ip协议:保证数据可靠的传递.(UDP不可 ...
- bzoj1651 / P2859 [USACO06FEB]摊位预订Stall Reservations
P2859 [USACO06FEB]摊位预订Stall Reservations 维护一个按右端点从小到大的优先队列 蓝后把数据按左端点从小到大排序,顺序枚举. 每次把比右端点比枚举线段左端点小的数据 ...
- bzoj1654 / P2863 [USACO06JAN]牛的舞会The Cow Prom
P2863 [USACO06JAN]牛的舞会The Cow Prom 求点数$>1$的强连通分量数,裸的Tanjan模板. #include<iostream> #include&l ...
- Android 深入理解Activity 页面Intent跳转
- SVC(STM32)
这两个都是 system level service,有什么区别呢?…… 手册上说 SVC 这个指令是同步的,而 PendSV 是异步的,请问是什么意思呢?…… 高手路过尽请留言啊
- c++builder ZIP文件解压与压缩(ZLIB DLL调用)(转载 )
转载:http://blog.csdn.net/goodai007/article/details/7414512 头文件:ZipAndFile.h //----------------------- ...
- Python3基础 os mkdir 创建一层文件夹 在有父目录的情况下创建子目录
Python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 Conda ...