非原创

参考资料:

一文掌握GO和pathway分析 - 生物信息学讨论版 -丁香园论坛
http://www.dxy.cn/bbs/thread/34904124#34904124

GO富集
GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
Pathway
Pathway指代谢通路,对差异基因进行pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。
 
GO分析好比是将基因分门别类放入一个个功能类群的篮子,而pathway则是将基因一个个具体放到代谢网络中的指定位置。
 
 
文章案例
Identification of a novel biomarker, SEMA5A, for non-small celllung carcinoma in nonsmoking women
相关基因:SEMA5A
相关疾病:Carcinoma,Non-Small-Cell Lung;Lung Neoplasms
PMID: 20802022 影响因子3.622 GEO 相关样本:120
文章作者使用AffymetrixU133plus2.0芯片1检测了台湾地区非吸烟肺癌女性患者60对癌症和癌旁肺组织样本,利用配对T检验筛选了肿瘤组织中687个差异表达基因2,并且利用逆转录PCR和免疫组化进行了验证。如何将687个缩小范围呢?因此我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类群和代谢通路。文章作者利用IPA(IngenuityPathway Analysis)软件对差异基因进行了功能分析,筛选出了16条显著性代谢通路3。在最显著改变的三条通路中,其中两条都和轴突导向信号通路(axonguidance)相关,作者很意外,于是就选定了轴突导向信号通路,并在其中挑选了差异表达倍数最高的SEMA5A基因作为后续的研究对象。作者最后利用kaplan-Meier生存分析证明了SEMA5A基因的低表达和非吸烟女性肺癌的低生存率有关联,其可能成为非小细胞肺癌预后的一个有效的生物标志物,也可能代表台湾地区病人的性别特异性。
文章思路
1.找到差异表达基因;2.通过功能分析进一步缩小差异基因范围;3.有针对性的挑选基因;
1.目的:找到差异表达基因。方法:基因差异表达分析流程
2.目的:缩小差异基因范围。方法:功能分析(GO、KEGG分析等)
3.目的:有针对性的选基因。方法:找最显著、最常出现、差异最显著的基因,kaplan-meie生存分析。

文章分析结果

小编利用上述案例中的数据GSE19804在GCBI在线实验室首先进行差异分析(|foldchange|>2, P值<0.001Q值<0.05),得到了2202个差异基因。将差异基因分别进行GO(P值<0.01,FDR<0.01)和pathway分析(P值<0.05),富集得到351个GO term和110条pathway。结果如下图所示,表一和表二分别为部分GO富集结果和最显著的15条pathway分析结果。

GO和pathway分析结果中都得到了文章中选定的axonguidance这个结果(红框)。

结果怎么看呢?

表头各个参数的解释如下,其中,重点看三个指标,enrichment score、p值和FDR。Pathway分析主要看P值和FDR值,两者越小越好。GO分析还可看enrichmentscore,数值越大表示某个GOterm越容易受到实验因素的影响。

 

如何定位到基因呢?

将axonguidance中的差异表达基因全部挑选出来,列表如下。作者在文中挑选了显著性最高的SEMA5A作为后续的研究对象。在我们的分析中,当p值小于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。

 

Ps:因参数设置和文章中不同,结果仅供参考。

 

教程:GOpathway分析

目前有许多GO和pathway分析软件,GO分析软件有Avadis(商业软件)、BiNGO(开源java)、DAVID(基于web的工具)等,pathway分析有IPA和MetaCore(商业软件)等。

但这些软件学习成本高,且许多都是商业软件。有没有一种分析方法无门槛,直接上手就可以搞定的呢?

GCBI平台,伸手党的福音,生信分析方法直接加载了模块,你需要做的只是创建方案,拖动模块,单击运行即可。小编用样本GSE19804演示一下,倒数10min,GO富集分析,pathway分析全搞定。

1、进入GCBI网站的在线实验室https://www.gcbi.com.cn(需注册才能使用)

2、建立项目——方案,在方案界面,拖动模块,修改名字和参数,并用连接线将模块连接成一个方案,小编建立了如下差异分析和GO和pathway分析方案。

 

3、选择样本数据。

样本数据GSE19804直接来自于GCBI样本库,将样本发送到在线实验室。点击方案中样本模块,在样本分组管理中选择配对样本,选择好相应的对照组和实验组样。Lungnormal **N为对照组,Lungcancer **T为实验组。

 

4、设置各模块参数

差异分析             |fold change|>1.2 P值<0.05 , Q值<0.05

GO分析              分析类型生物功能分析p值<0.01 ,FDR<0.01

Pathway分析      p值<0.05

5、运行方案

附录:

文献技术及参数:

1、检测手段:GeneChip Human Genome U133 Plus 2.0 expression arrays (Affymetrix, Inc.)

2、差异筛选:配对t 检验 (P <10^-16)和Bonferroni 校正P值

3、pathway分析:IPA软件费希尔精确检验(fisher’s exact test) P<0.5

 
 
 
 

生信基础知识【04】GO和pathway分析的更多相关文章

  1. Android基础知识04—Activity活动之间传递数据

    ------活动之间传递数据------ 向下一个活动传递数据: Intent中提供了一系列的putExtra()方法,可以把数据暂存到Intent中,启动另一个活动的时候就可以取出来. 代码: (存 ...

  2. 生信基础概念之unique reads VS multi-mapping reads

    unique reads:在参考组上只有一个匹配点 multi-mapping reads:在参考组上有多个匹配点 下面是tophat的一个结果案例: Reads: Input : Mapped : ...

  3. 4、vueJs基础知识04

    简单的目录结构: |-index.html |-main.js 入口文件 |-App.vue vue文件(组件),官方推荐命名法(首字母大写) |-components      组件存放的文件夹 | ...

  4. python基础知识0-4

    collection 他是对字典 元组 集合 进行加工的  是计数器 无论 深 ,浅 ,赋值 拷贝 内存地址都不变 赋值也是拷贝的一种 拷贝分两类数字 字符串 另一类: 列表 字典 元组 这一类还分两 ...

  5. TCP协议基础知识及wireshark抓包分析实战

    TCP相关知识 应swoole长连接开发调研相关TCP知识并记录. 数据封包流程 如图,如果我需要发送一条数据给用户,实际的大小肯定是大于你发送的大小,在各个数据层都进行了数据的封包,以便你的数据能完 ...

  6. JAVA基础知识之JDBC——使用ResultSetMetaData分析结果集

    通过ResultSetMetaData可以对ResultSet进行分析,获取ResultSet里包含了哪些数据列,以及每个列的数据类型. ResultSet中包含了一个getMetaData()方法, ...

  7. 第一篇 网站基础知识 第7章 Tomcat分析

    7.1 Tomcat的顶层结构及启动过程 7.1.1 Tomcat的顶层结构 Tomcat中最顶层的容器叫Server,代表整个服务器,Server中包含至少一个Service,用于具体提供服务.Se ...

  8. JavaSE 基础知识(常识概念 + 基础语法)问答总结/面试题 —— 讲给应届生的 Java 开源知识项目

    写在最前面 这个项目是从20年末就立好的 flag,经过几年的学习,回过头再去看很多知识点又有新的理解.所以趁着找实习的准备,结合以前的学习储备,创建一个主要针对应届生和初学者的 Java 开源知识项 ...

  9. shell脚本基础知识

    虽然现在能在Linux系统下生存,但是自觉效率太低,和高手有很大的差距. 这就是关于Linux的知识太过匮乏,有很多事情知道该怎么做,但是就是没法在Linux下实现,为了提升工作效率,必须要接触Lin ...

随机推荐

  1. cocoa-charts 导入其依赖库TABlib 报UIKit Foundation找不到的问题

    对于应用到项目中的一些第三方类库,尤其是C/C++ 写的,里面的大部分类文件的后缀都是 .C. 解决办法: 在 build setting 里按照如图所示,进行设置: 这说明以后只要是第三方类库中使用 ...

  2. ros 使用笔记

    1. publishers/subscribers 常用指令    说明rosnode list    查看所有激活的节点rostopic list    查看所有激活的topicrostopic i ...

  3. C#中的session用法

    Session具有以下特点: (1)Session中的数据保存在服务器端: (2)Session中可以保存任意类型的数据: (2)Session默认的生命周期是20分钟,可以手动设置更长或更短的时间. ...

  4. ELK简单安装测试

    1 介绍组件 Filebeat是一个日志文件托运工具,在你的服务器上安装客户端后,filebeat会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读). Kafka是一种高吞 ...

  5. 遇到短信轰炸,别人换ip调你的短信接口怎么办

    前端开发者很容易暴露自己的请求地址和参数,我们都知道,一个h5页面,按 F12 是可以看到页面的源码的,所以经常很多人会利用这一点恶意调取别人的接口. 我们公司出现了好多次短信接口被大量调用,导致一天 ...

  6. JS之clientX,clientY,screenX,screenY,offsetX,offsetY区别

    首先需要知道clientX,clientY,screenX,screenY,offsetX,offsetY 是鼠标事件对象下的几个属性. 之前也一直对这些属性搞的稀里糊涂,看文档上说的也是不太理解,反 ...

  7. C语言-第4次作业得分

    作业链接:https://edu.cnblogs.com/campus/hljkj/CS201801/homework/2523 作业链接:https://edu.cnblogs.com/campus ...

  8. .net core+Spring Cloud学习之路 二

    前言: 原本计划这次写一下搭建eureka群集.但是发现上次写的只是服务的注册,忘了写服务的发现,所以这次先把服务发现补上去. 我们基于上篇文章,再新建两个.net core web api项目,分别 ...

  9. SQL Sever 2012版本数据库的完全安装流程

    首先安装SQL Sever 2012数据库,我们要下载好安装包.将安装包存储在磁盘中. 安装前将杀毒软件和相关安全的软件等退出,以免造成安装中的错误. 安装环境:Win7 64位操作系统 注:SQL ...

  10. MongoDB4.0 WINDOWS环境下 副本集、分片部署

    部署开始: 创建路径 D:\Program Files\MongoDB\MySet下 config Data log 文件夹 config文件夹下准备配置文件: 分片1的副本集1 storage: d ...