GO富集分析
GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。
富集分析工具
用户可以直接从GOC网站的主页进行浓缩分析。此服务连接到PANTHER分类系统的分析工具,该分类系统使用GO注释进行最新维护。PANTHER分类系统在Mi H等人,PMID:23868073中有详细说明。支持基因ID的列表可以从PANTHER网站获得。
使用GO富集分析工具
1.粘贴或键入要分析的基因的名称,每行一个或用逗号分隔。该工具可以处理MOD特异性基因名称和UniProt ID(例如,Rad54或P38086)。
2.选择GO方面(分子功能,生物过程,细胞成分)进行分析(生物过程是默认的)。
3.选择你的基因来自的物种(默认为智人)。
4.按提交按钮。注意,在后面的步骤中,您将能够上传REFERENCE(又称“背景”)列表。
5.您将被重定向到PANTHER网站上的结果。这些结果是根据你在步骤3中选择的基因组中所有蛋白质编码基因的集合的富集度得出的。
6.(可选但强烈推荐)添加自定义引用列表并重新运行分析。在结果页面顶部的PANTHER分析摘要的“引用列表”行上按“更改”按钮,上传引用列表文件,然后按“启动分析”按钮重新运行分析。参考列表应该是选择较小分析列表的所有基因的列表。例如,在差异表达基因的列表中,参考列表应该只包含在实验中完全
解释结果表
结果页面显示一个表,该表列出了重要的共享GO术语(或GO术语的父母),用于描述用户在前一页上输入的一组基因、背景频率、样本频率、预期p值、每个术语过度/低表示的指示以及p值。此外,结果页面显示分析中使用的所有条件。任何未解决的基因名称都将列在表格的顶部。
背景频率和采样频率
背景频率是在整个背景集中注释到GO术语的基因数量,而样本频率是在输入列表中注释到GO术语的基因数量。例如,如果输入列表包含10个基因,并且富集了背景集包含6442个基因的酿酒酵母的生物过程,那么如果10个输入基因中有5个被注释为GO术语:DNA修复,那么DNA修复的样本频率将是5/10。然而,如果在所有的酿酒酵母基因组中有100个基因被注释为DNA修复,那么背景频率将是100/6442。
被高估或被低估
符号+和-表示一个术语的过度或低度表示。
P值
P值是指在注释到特定GO术语的列表中的总n个基因中,考虑到注释到该GO术语的基因在整个基因组中的比例,至少看到x个基因的概率或机会。也就是说,将用户列表中的基因共享的GO术语与注释的背景分布进行比较。p值越接近零,与基因组相关联的特定GO术语就越显著(即,观察到的特定GO术语对一组基因的注释偶然发生的可能性越小)。
换言之,当搜索过程本体时,如果一个组中的所有基因都与“DNA修复”相关,这个术语将是有意义的。然而,由于基因组中的所有基因(带有GO注释)都间接地与顶级术语“bio._process”相关联,所以如果一个组中的所有基因都与这个非常高水平的术语相关联,那么这并不显著。
外部工具
有许多不同的工具可以提供丰富功能。其中一些是基于网络的,另一些可能需要用户下载应用程序或安装本地环境。工具使用的算法不同,执行的统计测试也不同。
浓缩工具的一些其他示例包括:
富集分析小软件---BiNGO。它是Cytoscape软件中很出色的一个插件。它提供的结果中除了文本格式的富集分析结果外,还会将结果以网络图的形式展现,非常美观。
4.1 GO富集分析的结果为“.bgo”结尾的文件,可在设置的输出结果文件夹内用txt打开查看。
x:所分析的基因富集到该GO term中的数量;
n:基因组中富集到该GO term中的数量;
X:所分析基因的总数
N:基因组中基因的总数
4.2 GO富集分析的层级网络图。每一个圈代表了一个GOterm;颜色是根据富集度即”corrp-value”进行着色的,颜色越深表示富集度越显著;箭头的方向则表示层级关系。
http://fhqdddddd.blog.163.com/blog/static/186991542010824111830376/
GO富集分析的更多相关文章
- 基因探针富集分析(GSEA)& GO & pathway
http://blog.sina.com.cn/s/blog_4c1f21000100utyx.html GO是Gene Ontology的简称,是生物学家为了衡量基因的功能而而发起的一个项目,从分子 ...
- 利用GSEA对基因表达数据做富集分析
image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a p ...
- R: 修改镜像、bioconductor安装及go基因富集分析
1.安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirr ...
- OS Tools-GO富集分析工具的使用与解读详细教程
我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍: Gene Ontology(简称G ...
- GO富集分析示例【华为云技术分享】
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...
- DAVID 进行 GO/KEGG 功能富集分析
何为功能富集分析? 功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的.换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生 ...
- webgestalt 通路富集分析
http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html
- GSEA 基因集富集分析
http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于 ...
- SNPsnap | 筛选最佳匹配的SNP | 富集分析 | CP loci
一个矛盾: GWAS得到的SNP做富集分析的话,通常都会有强的偏向性. co-localization of GWAS signals to gene-dense and high linkage d ...
随机推荐
- ES6的十大新特性(转)
add by zhj: 该文章是由国外一哥们写的,由腾讯前端团队翻译,图片中的妹子长得挺好看的,很养眼,嘿嘿.我目前在学习ES6,这篇文章把ES6的 几个主要新特性进行了归纳总结,犹如脑图一般,让人看 ...
- C# cmd bcp 导出数据
背景需求:应用系统间数据自动同步处理,要求高效无人工干预 技术实现:C#启动cmd,通过BCP命令传入必要参数,实现数据导出 /// <summary> /// cmd下,启动应用程序命令 ...
- python基础数据类型考试题
Python基础数据类型考试题 考试时间:两个半小时 满分100分(80分以上包含80分及格) 一,基础题. 1,简述变量命名规范(3分) 2,字节和位的关系 ...
- python3安装ipython 过程以及问题
由于需要再python3的环境下运行demo,因此安装了python3的ipython notebook,过程如下: sudo pip3 install ipython[all]这样就安装了pytho ...
- JavaScript学习(四)
- 20180409 Code First
many people use DB First,Today I see Code First. 这部分,百度上面有更多详细的资料,虽然不明白Migrations内部的机制,但是还是可以记录一下 打 ...
- linux下禁止root远程登录和添加新用户
https://www.cnblogs.com/jianz/p/7979250.html 一.添加和root权限一样的用户 1. adduser admin passwd admin (修改密码) ...
- PHP递归方法实现前序、中序、后序遍历二叉树
二叉树是每个节点最多有两个子树的树结构.通常子树被称作“左子树”(left subtree)和“右子树”(right subtree). class Node { public $value; pub ...
- Day1 Python基础学习——概述、基本数据类型、流程控制
一.Python基础学习 一.编程语言分类 1.简介 机器语言:站在计算机的角度,说计算机能听懂的语言,那就是直接用二进制编程,直接操作硬件 汇编语言:站在计算机的角度,简写的英文标识符取代二进制去编 ...
- 块结构在文件中的表示IOB【转载】
转自:http://www.coderjie.com/blog/43b3601e0a2411e7841d00163e0c0e36 1.块在内存中以树的形式存储,分好块的文本在文件中用IOB标记存储: ...