MetaboAnalyst是做代谢的R包,功能十分强大。也开发了web版本,代谢组学的分析这里不介绍,主要讲讲它开发的多组学分析的相关内容。

既然是做代谢的工具,即使是增加了多组学内容,肯定也是以代谢为核心。以代谢组为中心的多组学分析想想无非就是以下几点:多元变量统计分析、网络分析、pathway分析以及mGWAS或宏组学等,这个工具就有网络分析和pathway分析。下面我们一起来试试。

网络分析

我们先看看网络分析。我这里使用软件提供的demo数据,点击进去后,会有两种ID类型供选择。第一种是代谢物和基因,示例数据来自转录组和代谢组的关联分析;第二种是代谢物和KO的关联,示例数据来自mGWAS。

我们先用第一种试下。导入后,数据格式应该是这样:

提交后,数据list会和数据库中的ID进行匹配,如代谢物会和HMDB和KEGG中匹配(这就需要我们输入时提供这两种标准的代谢物ID)。



输入的基因ID可以是Symbol,ENTREZID和EnsembleID,同样地和KEGG数据库中K编号进行匹配。

输入的数据如果在数据库中信息缺失,会以灰色阴影显示;如果数据库中没有匹配,则以红色阴影显示。

再试下第二种,默认基因组是K编号,代谢组是HMDB号。

同样输入ID也要匹配到数据库中。因此两种输入方法殊途同归。



提交后,会有五种网络分析供选择。

1.KEGG Global Metabolic Network

这是啥子意思呢?其实就是映射到了ko01100(Metabolic pathway)这条基础通路中。



映射的图比较乱,因为这个通路太大了:



最上边调整图形,左上角列表是子通路及其对应的信息,左下角是选中的子通路的化合物,右边我圈出的是化合物映射在pathway中的位置。

这个图我觉得没什么太大用,看个人需求吧。

2. Metabolite-Disease Interaction Network

这个网络是研究代谢物和人类疾病的关联,关联数据是从HMDB获得的。



可以在这里下载相应的相互作用文件(.SIF),导入到Cytoscape中调节。我下载看了下,SIF文件格式是这样的:



没搞清楚pp指的是什么。继续点“Proceed”,查看下软件给我们做出的网络图。

我圈出了几块内容。界面和上面类似。化合物列表关系增加了点度中心性(degree)和中介中心性(betweenness)。从图我们可以看出,这种网络就是阐释化合物和疾病之间关系的。右边增加了一些功能探索按键,可分为上下调。

3. Gene-Metabolite Interaction Network

基因和代谢物互作网络,这是基于STITCH数据库的(专门做小分子互作网络的数据库,主要来自Pubmed)。结果和第二种网络一样,不再解释了。也有SIF文件可供下载。

4. Metabolite-Metabolite Interaction Network

代谢物和代谢物互作网络,也是基于STITCH数据库。略

5. Metabolite-Gene-Disease Interaction Network

代谢物和基因和疾病的互作网络,就是将上面的网络结合起来了。

总结:MetaboAnalyst的网络分析主要是基于已有数据库中的信息,包括和疾病以及小分子互作。没有相关性(spearman)网络分析,从输入的文件没有样本信息就可看出。不过这种网络分析比相关性网络更有生物学含义。

Pathway关联分析

下面我们看看Pathway的关联。还是使用软件提供的示例数据。可以提供多种基因ID输入,化合物仍只支持KEGG和HMDB。



检查输入ID。



参数设置如下:



  • 富集分析的方法,超几何检验和fisher精确检验都可;
  • 拓扑分析也有三种选项(点度中心性degree、接近中心性closeness和中介中心性betweenness),代谢组的富集分析要用到拓扑分析,拓扑分析旨在根据给定基因或代谢物在途径中的位置来评估其是否在生物学反应中起重要作用;
  • Pathway数据库既然是关联,我们肯定选择全部(all);
  • 整合的方法有两种:combine queries将基因和代谢物合并到一个查询列表中,以针对组合的pathway集进行富集分析(即经典富集分析)。combine p values的方法首先分别对基因和代谢物进行富集分析,然后使用Stouffer方法对各个p值进行加权合并。权重基于映射到该组学数据类型中所有路径的特征的百分比(即基于路径空间覆盖率的权重),这种方法仅适用于基因和代谢物均命中的那些pathway。所以我们最好用第一种。

    综上,我们都用默认的参数就好了。提交后,得到如下结果:



上面是图,下面是表。

首先看第一个图。典型的KEGG pathway富集气泡图。纵轴好理解,P<0.01是阈值,横轴的Pathway Impact是什么意思呢?这里代谢组的富集分析基于拓扑分析(参考MetPA),我特意查了下,Wiki中的解释是这样的https://en.wikipedia.org/wiki/Metabolomic_Pathway_AnalysisMetPA employs a number of topological assessment tools to measure centrality or “hubness” in an objective manner (called Pathway Impact). Pathway impact is a combination of the centrality and pathway enrichment results. It is calculated adding up the importance measures of each of the matched metabolites and then dividing by the sum of the importance measures of all metabolites in each pathway. 可知这里富集是按权重来分析的,虽然没有富集因子那么简单粗暴,但含义是大致一样的,值越大越好。所以这个图看来,处于右上角的pathway是最可信的。

点击图中的点或列表中的名称是可以点击进入相应的pathway,右图。不过右图显示的不是完整的pathway,而是一部分(看了几个通路,也不知具体为什么这么显示),点击图上pathway或表中KEGG,能链接到KEGG官网中。

左边是每一步过程,标色表明运行完成。中间是结果,可供下载,但生成报告貌似生成不了,可能有bug吧。右边是过程代码,有R基础的童鞋可试试。

总结:pathway的联合分析以代谢为主,富集分析方法和传统方法不同。分析还是有限的,比如表达丰度信息没有包含进去。简单使用,供参考吧。

MetaboAnalyst的多组学分析的更多相关文章

  1. 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)

    发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...

  2. 解读人:范徉,Methylome and Metabolome Analyses Reveal Adaptive Mechanisms in Geobacter sulfurreducens Grown on Different Terminal Electron Acceptors(甲基化组学和代谢组学分析发现Geobacter sulfurreducens生长在不同电子终受体中的适应机制)

    发表时间: (2019年4月) IF:3.950 单位: Fujian Provincial Key Laboratory of Soil Environmental Health and Regul ...

  3. 多组学分析及可视化R包

    最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在 ...

  4. Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adenomas 非靶向脂质组学揭示非功能人类脑垂体瘤中的特异性脂质 (解读人:胡丹丹)

    文献名:Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adeno ...

  5. 【讲座】朱正江——基于LC-MS的非靶向代谢组学

    本次课程主题为<基于LC-MS的非靶向代谢组学>,主要分为代谢组学简介.代谢组学技术简介.非靶向代谢组学方法和数据采集.非靶向代谢组学数据分析和代谢物结构鉴定几个方面. 一.代谢组简介 基 ...

  6. 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载

    转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...

  7. 组学航母----OMICtools

    OMICtools可谓是组学研究的航空母舰,其收集了基因组学.转录组学.蛋白质组学和代谢组学等分析研究常用的4400余个工具和数据库.它允许用户submit自己的工具/数据库,每一个上传的工具/数据库 ...

  8. MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性

    一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...

  9. ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

    文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...

随机推荐

  1. 264.丑数II

    题目 给你一个整数 n ,请你找出并返回第 n 个 丑数 . 丑数 就是只包含质因数 2.3 和/或 5 的正整数. 示例 1: 输入:n = 10 输出:12 解释:[1, 2, 3, 4, 5, ...

  2. LeetCode:“剑指 Offer”

    LeetCode:"剑指 Offer" 刷题小菜鸡,花了几天时间做了一遍 LeetCode 上给出的 "剑指 Offer" 在此做一下记录 LeetCode主页 ...

  3. JAVA的array中indexOf

    记得龙哥有个重构的文章里说直接判断啥的. 今天看JDK ArrayList,看到了他的 indexOf,他先判断,后进入循环,看似写了两遍for 循环,但是简单明了暴力.i like it . pub ...

  4. BUAA-OO-最后单元总结

    BUAA-OO-最后单元总结 经过一学期的魔鬼"折磨"后,OO课程终于要结束了!总体来说我对于作业的总体完成情况还是比较满意的,希望最后可以取得一个理想成绩. 一.第四单元架构设计 ...

  5. 前端大牛带你了解JavaScript 函数式编程

    前言 函数式编程在前端已经成为了一个非常热门的话题.在最近几年里,我们看到非常多的应用程序代码库里大量使用着函数式编程思想. 本文将略去那些晦涩难懂的概念介绍,重点展示在 JavaScript 中到底 ...

  6. 第07课 OpenGL 光照和键盘(2)

    下一段代码绘制贴图立方体.我只对新增的代码进行注解.如果您对没有注解的代码有疑问,回头看看第六课. int DrawGLScene(GLvoid) // 从这里开始进行所有的绘制 { glClear( ...

  7. (四)FastDFS 高可用集群架构学习---后期运维--基础知识及常用命令

    1.fastdfs 七种状态 FDFS_STORAGE_STATUS:INIT :初始化,尚未得到同步已有数据的源服务器 FDFS_STORAGE_STATUS:WAIT_SYNC :等待同步,已得到 ...

  8. Python小练习之验证“哥德巴赫猜想”

    设计内容:任何一个大于2的偶数都可以分解为两个素数之和,这就是著名的哥达巴赫猜想. 设计要求:要求输入一个大于2的偶数,程序运行后,输出两个素数,其和正好等于该偶数. 1.    实验代码(知道是你们 ...

  9. robotframework-ride快捷方式打不开

    我安装的是最新的RIDE2.0属于beta测试中,覆盖了3.8但仍不支持3.9 我的安装环境如下: 安装ride成功,启动ride的时候遇到了如下问题: 一:AttributeError: No at ...

  10. React 三大属性state,props,refs以及组件嵌套的应用

    React 三大属性state,props,refs以及组件嵌套的应用 该项目实现了一个简单的表单输入添加列表的内容 代码如下 <!DOCTYPE html> <html> & ...