️ AnnotationHub 目前最新的工具包叫做AnnotationHub,顾名思义,就是注释信息的中装站.通过它,能找到了几乎所有的注释资源.如果没有,你还可以根据已有的数据用它提供的函数进行构建. 1. 加载AnnotationHub library(AnnotationHub) ##获取数据库 ah = AnnotationHub() 2. 搜索自己所需数据库并下载 res <- query(ah,"Spinacia oleracea") spinach_org <…
前言 本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional network during muscle atrophy.[pubmed:25858807] 作者通过将FoxO1-3-4-floxed小鼠(FoxO1,3,4 f / f)与表达Cre重组酶的转基因系…
前言 关于clusterProfiler这个R包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做GO和KEGG的功能富集及其可视化.简单总结下用法,以后用时可直接找来用. 首先考虑一个问题:clusterProfiler做GO和KEGG富集分析的注释信息来自哪里? GO的注释信息来自Bioconductor,提供了19个物种的org类型的GO注释信息,如下表所示.Bioconductor中更多的注释包可参考http://www.bioconductor.org/packages/rel…
1.安装,加载所用到到R包 用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocManager::install("clusterProfiler") library(clusterProfiler) ##富集分析library(topGO) ###画GO图library(AnnotationHub) ##获取数据库library(BiocFileCache) ##依赖包…
在 KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号.通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号. 截止到 2015 年 6 月 12 日,KEGG 数据库中共收录了 3,904 个完整的基因组.其中 304 个为真核生物,3,600 个为原核生物.在真核生物中,共有 299 个物种(一个物种可能不止一个基因组),分为 172 科,227 属:在原核生物中,共有 1,858 个物种,分为 809 属. KEGG 对这些物种的基因序列构成了一个非冗余的 KEGG…
一直都搞不清楚这两者的具体区别. 其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库. 建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别. (抱歉之前没讲清楚,甚至有可能误导大家了) 以下以一个案例来详细说明两者的区别: 推荐一个没有任何基础的人都能使用的gene set注释工具 http://www.webgestalt.org/option.php GCLC TFPI HSPB6 TSPOAP1 ITGA2B OSBPL7 BAIAP2L1 NOS…
AnnotationHub是一个包含大量注释信息的数据库,里面有很多物种,以及来源于很多数据库的注释信息. 1,安装这个包 source("https://bioconductor.org/biocLite.R") biocLite("AnnotationHub"), 2,载入这个包: library(AnnotationHub) (如有提示说需要载入其它包,比如BiocGenerics,parallel,那么就载入它们) library(BiocGenerics)…
转载于 Original 2017-06-20 liuhui 生信百科 KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号.通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号.通过KEGG数据库的注释极大的方便我们进行生物学通路的研究,可以直接查看物种某条生物学通路上基因的存在情况. 最简单的方法是看公司给的KEGG注释或者直接下载本物种每个基因的注释结果(比如,植物Phytozome:动植物Ensemble),然后对应到自己的差异基因集里面. 当然如果自己的物种没有KE…
目录 一.来源 二.结果 扁豆的染色体水平高质量组装 扁豆相关农艺性状的QTL定位 直系/旁系同源的演化和物种形成事件 与农艺性状相关基因的直系同源物 群体结构分析揭示扁豆遗传簇 豆荚发育过程中的基因表达 一.来源 Comprehensive genomic resources related to domestication and crop improvement traits in Lima bean. Nature Communications volume 12, Article nu…
这个需求是在生信分析中几乎天天用到,各种语言都能实现,也都各有特点.这次以perl为例. 已知 文件CT-VS-CON.All.xls为全部蛋白表达矩阵及其差异分析结果. 文件Homo_sapiens.ko为蛋白KEGG注释结果. 文件Homo_sapiens.fa为蛋白鉴定数据库(有的序列以多行展示). 需求 将以上三表整合为一个表,输出需要的信息. 实现 #! /usr/bin/perl -w use strict; =pod Description: combine table Autho…