GO | KEGG的注释是怎么来的？

但凡是做过基因表达数据分析的（芯片、RNA-seq，scRNA-seq），肯定是跑过基因集功能注释和通路富集的，因为它是研究未知基因集的利器。

但跑过之后老板肯定会给反馈，通常得到的注释都是没有太多意义的，偶尔能随缘得到一些满意的注释，所以常见的注释数据库是有显而易见的缺点的。

而往往我们是在验证时才使用注释，这种拿不准确数据来验证新的数据的方法确实值得思考。

那么GO和KEGG常见注释库到底有些什么缺点呢？

那就不得不去了解GO、KEGG是怎么来的

The Gene Ontology Consortium (GOC) uses two further evidence codes to describe experimental support for an annotation:

IMP (Inferred by mutant phenotype),

and IPI (Inferred by physical interaction).

The consortium uses other evidence codes to describe inferences used in annotations that are not supported by direct experimental evidence, but these will not be considered in this discussion (http://www.geneontology.org/GO.evidence.shtml).

First, each KO record is re-examined and associated with protein sequence data used in experiments of functional characterization.

Second, the GENES database now includes viruses, plasmids, and the addendum category for functionally characterized proteins that are not represented in complete genomes.

Third, new automatic annotation servers, BlastKOALA and GhostKOALA, are made available utilizing the non-redundant pangenome data set generated from the GENES database.

我的答案：

显然生物体内的所有基因表达是一个动态的网络

像GO这种静态的树状结构是会丢失大部分信息，树结构和网络结构有天壤之别。

像KEGG这种虽然是网状结构，但是也只是一个小的局部静态网络，必然会丢失一些全局的、动态的信息。

也就是对基因的划分不能静态，实际上我们也很难真正研究一个基因的功能，因为牵一发而动全身，这就是为什么仅仅敲除一个基因会带来如此大的连锁效应！

看文章：Gene Ontology annotations: what they mean and where they come from

KEGG as a reference resource for gene and protein annotation

GO | KEGG的注释是怎么来的？的更多相关文章

GO 和 KEGG 的区别 | GO KEGG数据库用法 | 基因集功能注释 | 代谢通路富集
一直都搞不清楚这两者的具体区别. 其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库. 建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别. (抱歉之前没讲清 ...
【R】clusterProfiler的GO/KEGG富集分析用法小结
前言关于clusterProfiler这个R包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做GO和KEGG的功能富集及其可视化.简单总结下用法,以后用时可直接找来用. 首先考虑一个问题: ...
使用GEO数据库来筛选差异表达基因，KOBAS进行KEGG注释分析
前言本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquiti ...
KEGG注释
在 KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号.通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号. 截止到 2015 年 6 月 12 日,KEGG 数据库中共收录了 ...
R包对植物进行GO，KEGG注释
1.安装,加载所用到到R包用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocMa ...
AnnotationHub, clusterProfiler 进行GO，KEGG注释
️ AnnotationHub 目前最新的工具包叫做AnnotationHub,顾名思义,就是注释信息的中装站.通过它,能找到了几乎所有的注释资源.如果没有,你还可以根据已有的数据用它提供的函数进行构 ...
KEGG数据库的使用方法与介绍
KEGG数据库的使用方法与介绍 KEGG的数据 KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系:基因组信息主要是从NCBI等数据库中 ...
kegg-kass注释--转载
在注释KEGG的时候,一直用到kaas,具体kaas是个什么东东,简单的总结一下吧. KEGG是由日本人搞的一个代谢图,收录基因和基因组的数据库,数据库可以分为 3大部分,基因数据库, 化学分 ...
KEGG数据库
参考:KEGG数据库中文教程 - 博奥 &[学习笔记]KEGG数据库 - 微信学习一个技能最主要的事情你必须知道,那就是能通过它来做什么? KEGG数据库里面有什么? 如何查询某一特定的代 ...

随机推荐

[07-01]http网页提示含义
出现较多的一些网页代码提示的意思: 100 - 继续. 101 - 切换协议. 110 重新启动标记答复. 120 服务已就绪,在 nnn 分钟后开始. 125 数据连接已打开,正在开始传输. 150 ...
Eclipse 00：安装教程 + 汉化 + 简单创建java项目
Java 安装教程(Eclipse) 目录: 要安装Java 要分两个步骤: 1.JDK的安装 2.Eclipse的安装 3.Eclipse汉化 4.Eclipse创建简单java项目 1和2的顺序不 ...
PTA 树的遍历
给定一棵二叉树的后序遍历和中序遍历,请你输出其层序遍历的序列.这里假设键值都是互不相等的正整数. 输入格式: 输入第一行给出一个正整数N(≤30),是二叉树中结点的个数.第二行给出其后序遍历序列.第三 ...
vivi.c框架
内核文档: V4L2-framework.txt UVC:usb video controll UVC驱动框架: system call: open read write -------------- ...
time和datetime和tzinfo
time和datetime模块还有tzinfo (时区)(一直不明白两者的区别,然后摘了两片文章(最后面的两个链接),很清晰...) 一.time模块常用函数 1. time()函数 time()函 ...
WebService简单搭建和调用
http://www.cnblogs.com/JiYF/p/6164859.html https://www.cnblogs.com/JiYF/p/6169349.html #region Invok ...
docker+elasticsearch的安装
查询镜像 [root@ elasticsearch]# docker search elasticsearch INDEX NAME DESCRIPTION STARS OFFICIAL AUTOMA ...
sql 存储过程参数为空则不作为条件
/****** Object: StoredProcedure [dbo].[GetCommonGroupByRegion] Script Date: 03/23/2017 17:31:18 **** ...
AWS是怎么改写 MySQL的?
五倍吞吐量的提升,跨可用区的六副本,低于一分钟的宕机恢复,兼容 MySQL协议,这是 AWS 推出 Aurora 数据库时给出的数据. 这种量级的提升不可能是小修小补,大都是在架构上有了变革性的突破才 ...
Django框架详细介绍---request对象
几个重要的函数 1.HttpRequest.get_host() 根据从HTTP_X_FORWARDED_HOST(如果打开 USE_X_FORWARDED_HOST,默认为False和 HTTP_H ...

GO | KEGG的注释是怎么来的？

GO | KEGG的注释是怎么来的？的更多相关文章

随机推荐

热门专题