GSEA 基因集富集分析
http://software.broadinstitute.org/gsea/index.jsp
GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于确定是否存在这样一个基因集,能在两个生物学状态中显示出显著的一致性的差异。表达谱数据里的基因数目众多,我们需要对基因进行功能注释,看哪些基因属于同一通路,以及该通路上的上调、下调情况,这就是富集分析了。
例如2019年4月在Cancer cell(PMID 30991027)上发表的一篇文章中有一张主图,就是通过GSEA分析对RNA-seq的数据进行解读,如下
在上图中,图A是经典的GSEA富集图,图B为GSEA得到的通路上调或下调的韦恩图,图C和图D是GSEA分析的NES值,图E是GSEA通路基因表达值。
也就是说,只需要2(实验条件) X 3(生物学重复)个RNA-seq的样本,我们就可以做出上图。
做转录组分析时,大家通常会先筛选差异表达基因,然后再对这些差异表达基因进行功能富集分析。可能不少小伙伴会发现这种情况,就是因为差异基因过少而富集目标/相关的功能/通路,或者差异表达基因虽然很多,但是没有命中到感兴趣的通路或者GO功能。这种先做差异基因筛选的方式,可能由于筛选参数的设置不同,导致一些关键信息的“漏网”。
这种情况下,就可以试试GSEA分析。GSEA无需先做差异分析,会保留更多更多更全面的关键信息。可以帮助我们找到那些差异不是很明显但基因差异趋势很一致的功能基因集。
当然这两种思路没有说哪个更好,实际应用中能解决问题即可。
GSEA的分析步骤
1. GSEA软件的下载
直接通过GSEA官网进行下载
http://software.broadinstitute.org/gsea/index.jsp
2. 准备GSEA的输入文件
GSEA的输入文件有两个,分别是gct文件和cls文件。
表达谱数据文件格式如下
数据共7列,第一列为基因名,第二至七列为样本表达,分别是三个Case和三个Control
gct文件中包含表达谱数据
cls文件中包含数据比对条件
3. 运行GSEA
最终生成的结果,就是我们Case和Control两组样本相比,差异通路的结果,比如所有通路上调或者下调的情况。
或者单独通路的经典GSEA富集图
GSEA 基因集富集分析的更多相关文章
- GSEA - Gene set enrichment analysis 基因集富集 | ORA - Over-Representation Analysis 分析原理与应用
RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析. ...
- 【R】clusterProfiler的GO/KEGG富集分析用法小结
前言 关于clusterProfiler这个R包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做GO和KEGG的功能富集及其可视化.简单总结下用法,以后用时可直接找来用. 首先考虑一个问题: ...
- GO 和 KEGG 的区别 | GO KEGG数据库用法 | 基因集功能注释 | 代谢通路富集
一直都搞不清楚这两者的具体区别. 其实初学者搞不清楚很正常,因为它们的本质是相通的,都是对基因进行归类注释的数据库. 建议初学者自己使用一下这两个数据库,应该很快就能明白其中的区别. (抱歉之前没讲清 ...
- GO富集分析
GO的主要用途之一是对基因组进行富集分析.例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示). 富集分析工具 用户可以直接从GOC网站的 ...
- 利用GSEA对基因表达数据做富集分析
image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a p ...
- 基因探针富集分析(GSEA)& GO & pathway
http://blog.sina.com.cn/s/blog_4c1f21000100utyx.html GO是Gene Ontology的简称,是生物学家为了衡量基因的功能而而发起的一个项目,从分子 ...
- R: 修改镜像、bioconductor安装及go基因富集分析
1.安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirr ...
- DEPICT实现基因优化(gene prioritization)、gene set富集分析(geneset enrichment)、组织富集分析(tissue enrichment)
全基因组关联分析除了找到显著的关联位点,我们还可以做基因优化.geneset富集分析.组织富集分析,下面具体讲一讲怎么利用GWAS的summary数据做这个分析. summary数据就是关联分析的结果 ...
- OS Tools-GO富集分析工具的使用与解读详细教程
我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍: Gene Ontology(简称G ...
随机推荐
- Vert.x(vertx)发送 HTTP/HTTPS请求
Vert.x Web服务有两种协议,一种是HTTP,另外一种是使用ssl的HTTPS,请求的方式有五种,分别是get.post.put.delete.head.为了简单,服务端主要实现对HTTP协议的 ...
- docker run VS docker exec 的区别
“docker run”和“docker exec”都是 Docker 容器中用于执行的命令.然而,在不同的情况下,它们的使用有着本质上的区别. “docker run”命令 “docker run” ...
- [大数据学习研究] 错误排查,Hadoop集群部分DataNode不能启动
错误现象 不知道什么原因,今天发现我的hadoop集群启动后datanode只有一台了,我的集群本来有三台的,怎么只剩一台了呢? 用jps命令检查一下,发现果然有两台机器的DataNode没有启动. ...
- 【JVM学习笔记二】垃圾收集器与内存分配策略
1. 概述 1) GC的历史比Java久远 2) GC需要完成的三件事: | 哪些内存需要回收 | 什么时候回收 | 如何回收 3) Java内存运行时区域各个部分: | Java虚拟机栈.计数器.本 ...
- Django:RestFramework之-------分页
9.分页操作 分页,看第n页,每页显示n条数据 分页,在n个位置,向后查看n条数据. 加密分页,上一页和下一页 1.基于PageNumberPagination分页 1.路由: url(r'^(?P& ...
- C# 方法执行超时处理
封装了一个方法,用于处理一些需要判断是否执行超时了的操作 internal static T TimeoutCheck<T>(int ms, Func<T> func) { v ...
- CentOS7安装rpm包时依赖检测失败,加上--nodeps --force
安装mysql-community-server的时候,出现依赖检测失败 加上--nodeps --force后可跳过依赖检测,如下
- springboot读取静态资源文件的方式
springboot的请求路径一般会经过Controller处理,但是静态资源文件在请求之后是直接返回的.这涉及到俩个配置项. spring.mvc.static-path-pattern=/** s ...
- 【爬虫】Condition版的生产者和消费者模式
Condition版的生产者和消费者模式 threading.Condition 在没有数据的时候处于阻塞状态,有数据可以使用notify的函数通知等等待状态的线程运作 threading.Condi ...
- 转载_fread函数详解
fread函数详解 函数原型: size_t fread( void *buffer, size_t size, size_t count, FILE *strea ...