KEGG注释

在 KEGG 数据库中，把功能相似的蛋白质归为同一组，然后标上 KO 号。通过相似性比对，可以为未知功能的蛋白序列注释上 KO 号。

截止到 2015 年 6 月 12 日，KEGG 数据库中共收录了 3,904 个完整的基因组。其中 304 个为真核生物，3,600 个为原核生物。在真核生物中，共有 299 个物种（一个物种可能不止一个基因组），分为 172 科，227 属；在原核生物中，共有 1,858 个物种，分为 809 属。

KEGG 对这些物种的基因序列构成了一个非冗余的 KEGG GENES 数据库；通过 BlastKOALA 和 GhostKOALA，可对用户提交的蛋白质序列，与 KEGG GENES 数据库分别进行 BLAST 或 GHOSTX 相似性比对，为蛋白质序列注释上 K number，即 KO 号。其中，GHOSTX 比对和 BLAST 比对类似，能够检测到分歧度较大的同源序列（remote homologues），在速度上比 BLAST 大约快 100 倍，两者的区别是：

BlastKOALA：用于注释高质量基因组，只能提交 5,000 - 10,000 条蛋白质序列。
GhostKOALA：用于注释宏基因组，文件大小为 300 M 以内。

有了 KO 号，就可以重构 KEGG 数据库中的 KEGG pathways 及其他分子网络，然后进行其他分析。

这里以 BlastKOALA 为例，对蛋白质序列进行 KO 注释。

分析步骤如下：

到这个网页：http://www.kegg.jp/blastkoala/
上传 fasta 格式的蛋白质序列

选择物种所属的分类单元，如这里选择植物“plant”
选择一个数据库进行比对。这些数据库由 KEGG GENES 分别在种、属、科水平去冗余后生成。这里选“属”水平的真核生物，如下图右表所示，上传的蛋白质序列限制为 7,500 条序列。
填写自己的邮箱地址，并提交任务，开始分析。
回跳转到这个界面，耐心等待即可。
分析完成后，会收到邮件通知。
点击链接，返回如下结果。

# 功能注释

KEGG注释的更多相关文章

使用GEO数据库来筛选差异表达基因，KOBAS进行KEGG注释分析
前言本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquiti ...
R包对植物进行GO，KEGG注释
1.安装,加载所用到到R包用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocMa ...
AnnotationHub, clusterProfiler 进行GO，KEGG注释
️ AnnotationHub 目前最新的工具包叫做AnnotationHub,顾名思义,就是注释信息的中装站.通过它,能找到了几乎所有的注释资源.如果没有,你还可以根据已有的数据用它提供的函数进行构 ...
GO 和 KEGG 的区别 | GO KEGG数据库用法 | 基因集功能注释 | 代谢通路富集
一直都搞不清楚这两者的具体区别. 其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库. 建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别. (抱歉之前没讲清 ...
KEGG Pathway Anonatation
转载于 Original 2017-06-20 liuhui 生信百科 KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号.通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号. ...
【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC
目录一.来源二.结果扁豆的染色体水平高质量组装扁豆相关农艺性状的QTL定位直系/旁系同源的演化和物种形成事件与农艺性状相关基因的直系同源物群体结构分析揭示扁豆遗传簇豆荚发育过程中的基因 ...
【Perl示例】整合多个文件
这个需求是在生信分析中几乎天天用到,各种语言都能实现,也都各有特点.这次以perl为例. 已知文件CT-VS-CON.All.xls为全部蛋白表达矩阵及其差异分析结果. 文件Homo_sapiens ...
GO | KEGG的注释是怎么来的？
但凡是做过基因表达数据分析的(芯片.RNA-seq,scRNA-seq),肯定是跑过基因集功能注释和通路富集的,因为它是研究未知基因集的利器. 但跑过之后老板肯定会给反馈,通常得到的注释都是没有太多意 ...
KEGG数据库的使用方法与介绍
KEGG数据库的使用方法与介绍 KEGG的数据 KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系:基因组信息主要是从NCBI等数据库中 ...

随机推荐

subprocess.Popen运行报错WindowsError: [Error 740]
subprocess.Popen在win10下运行报740错时使用os.popen替换,运行OK,exe程序成功启动 import subprocess import uiautomation as ...
Prefix
Prefix 南昌邀请赛的题,字典树 #include<bits/stdc++.h> using namespace std; typedef long long ll; ll A[]; ...
后端技术杂谈9：先搞懂Docker核心概念吧
本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下 ...
HTML与CSS中的文本个人分享
文本标题元素注意: 在一个HTML页面中最好只使用一个<h1>标题因为浏览器只会抓取一个多了没用示例代码: <body> <!-- 标题元素 - <h1&g ...
【数据库】一篇文章搞掂：Oracle数据库
PL/SQL的使用 1.安装使用 1.1.安装暂略 1.2.使用添加环境变量打开PL/SQL,不要登录,进入界面后,打开设置Preference 设置主目录和OCI库
Linux（RHEL7）下安装vsftp服务
1.安装vsftp(没有配置yum源的先配置yum源) yum install -y vsftpd 2.启动ftp服务 systemctl start vsftpd.service 3.打开防火墙 f ...
16/8/21_PHP-有关类函数，this，static，面向对象思想介绍
class_exists():判断某个类是否存在(定义过) interface_existe():判断接口是否存在 get_class():获取某个对象的"所属类名" get_pa ...
Altium Designer chapter3总结
绘制电路原理图中需要注意的如下: (1)元件库的操作:元件库的加载和卸载.查找元件. (2)元件操作: 1.放置元件(元件库中,place part,快捷键)中place part中的history可 ...
Git011--分支管理策略
Git--分支管理策略一.分支管理策略通常,合并分支时,如果可能,Git会用Fast forward模式,但这种模式下,删除分支后,会丢掉分支信息. 如果要强制禁用Fast forward模式,G ...
python的前景
最近几年Python编程语言在国内引起不小的轰动,有超越Java之势,本来在美国这个编程语言就是最火的,应用的非常非常的广泛,而Python的整体语言难度来讲又比Java简单的很多.尤其是在运维的应用 ...

KEGG注释

KEGG注释的更多相关文章

随机推荐

热门专题