一、iMetaLab简介

宏蛋白组学是个非常小众的领域,即使从事的学者也并非专门做这个,大多是作为系统生物学的延伸研究。业界有几个比较有影响力的研究团队,一是比利时根特大学的Computational Omics and Systems Biology Group(COMPOMICS) 团队,开发了有代表性的宏蛋白分析工具如UnipeptMetaProteomeAnalyzer (MPA),此外还有很多常规蛋白组的工具,如SearchGUIPeptideShakerThermo Raw File Parser 等,后面如果有机会再介绍。二是加拿大渥太华大学的Daniel Figeys团队,专注于研究人类、小鼠肠道宏蛋白组,一开始提出了经典的迭代搜库三步法(MetaPro-IQ),后面陆续也实现了一些工具,开发了从MetaPro-IQ,到MetaLab,最后到iMetaLab平台的技术路线。

Daniel Figeys介绍:https://med.uottawa.ca/bmi/people/figeys-daniel

iMetaLab有云服务器版本和桌面版本,用来分析宏蛋白数据,下游可视化绘图等分析提供了Shiny Apps,并且也有相应的Demo报告和Wiki。内容主要包括了:肽段和蛋白的鉴定及定量,物种和功能分析,数据分析及其可视化

关于收费,对于学术研究是免费的,商业用途则需要获得许可。

二、内置工具与模块

1. Data Processing module

2. Functional Analysis

  • KEGG
  • eggNOG database
  • NCBI nr database

3. R Developing environment

  • Rstudio
  • Rstudio server
  • ShinyR
  • Shiydashboard

4. R based data analysis packages

  • ggplot2, ggpairs
  • Htmlwidgets, visNetwork, d3heatmap
  • Eulerr, colourpicker, DT,shinysky, GGally, ggcorrplot, reshape2, ggfortify, mixOmics

5. Web development libraries and frameworks

  • React.js
  • D3.js

从内置工具和模块可以看出,这个平台主要处理的是DDA数据,最后得到的蛋白鉴定和定量结果就是MaxQuant产出格式的。

三、报告内容

iMetaLab分析完成后生成网页报告https://shiny.imetalab.ca/metalab_report/

对于报告结果,主要有以下五方面内容:

  • ID Summary:谱图肽段ID统计
  • Peptides Summary:肽段鉴定结果分析
  • ProteinGroups Summary:蛋白鉴定结果分析
  • Taxon Summary:物种注释结果分析
  • Function Summary:功能注释结果分析

    此外,还有一个MetaMep for Taxon Vis模块,主要是利用MetaMap软件对物种分析结果进行可视化展示和可交互式操作。

1. 谱图肽段ID统计

分析点包括了报告介绍,项目信息,谱图解析率,肽段鉴定数,汇总统计表。

  • MSMS ID Rate

    这是数据质控的一个指标,可以判断 MS run的质量,即在1%FDR条件下谱图鉴定为肽段,QE系列仪器一般能达到50%。可以判断组内重复性,以及仪器是否需要清洗,数据是否可利用等。

    展示方式:分组散点图,密度图,箱形图。
  • Peptide Sequence

    同样也是统计各样本的肽段鉴定数目分布。

    可视化:分组散点图,密度图,箱形图。

2. 肽段鉴定结果分析



上图红框内的分析,包括对肽段鉴定各方面的统计绘图,多变量统计和方差检验,到得到整洁的肽段数据。

肽段结果分析及其可视化:价态分布,长度分布,得分分布,肽段强度分布(离散和累积),各样本肽段强度箱形图,全部样本肽段的聚类热图,肽段层次PCA(2D/3D),各组间方差分析。

最后得到的过滤后的肽段表格(MaxQuant结果)是去除了来自反库和污染库的肽段,他们用的强度值是LFQ和自带的Intensity,整洁肽段表可用于后续分析,也可用作者的shiny.imetalab.ca

3. 蛋白鉴定结果分析



蛋白组层次和肽段层次的分析基本是一样的。多了一个unique peptide分布。

疑问:为什么都用方差分析?难道更多的情况不是两组吗,即便是多组,很多客户也是要求两两比较。

最后得到的也是过滤后的蛋白表格。

4. 物种分析

  • 每个样本在物种各个层级的注释统计
  • alpha多样性:计算的是种(species)层级的Shannon-Wiener index
  • beta多样性:计算的是种(species)层级的PCoA
  • 样本聚类:基于种(species)层级的丰度数据,欧氏距离ward.D聚类
  • 物种组成:各物种层级bar图(原始强度,无归一化)

5. 功能分析

  • 功能数据库注释统计:COG,NOG,KEGG,GO及其unique数目(与蛋白一对一)。
  • 分类饼图:包括COG,NOG和Pathway,饼图的扇形大小并非分类功能的数目,而是所有样本proteinGroup的强度之和。
  • 功能组成bar图:包括COG,NOG和Pathway,各样本的功能bar图(原始强度,无归一化)。
  • 功能组成热图:包括COG,NOG和Pathway,各样本的功能聚类热图。
  • PCA分析:包括COG,NOG和KEGG(这里应该也是Pathway层级)功能丰度的PCA。

疑问:一般蛋白/基因注释KEGG是到KO层级,这里都是转化到了Pathway层面,一条Pathway中多个蛋白分子强度不知他们是怎么处理的,之前我是进行加和处理的。

MetaMep for Taxon Vis

最后一个工具是对物种分析进行可视化,可交互是它的优点,而且有多种展示方式。你如果用过MEGAN的话,就知道这些展示方式也都有。当然Unipept也可实现,它这个就是嵌套了Unipept。

【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据的更多相关文章

  1. Data-independent acquisition mass spectrometry in metaproteomics of gut microbiota - implementation and computational analysis DIA技术在肠道宏蛋白质组研究中的方法实现和数据分析 (解读人:闫克强)

    文献名:Data-independent acquisition mass spectrometry in metaproteomics of gut microbiota - implementat ...

  2. 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)

    发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...

  3. 蛋白组DIA分析:Spectronaut软件使用指南

    官方文档: https://biognosys.com/media.ashx/spectronautmanual.pdf 0. 准备 Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之 ...

  4. MapReduce原理及其主要实现平台分析

    原文:http://www.infotech.ac.cn/article/2012/1003-3513-28-2-60.html MapReduce原理及其主要实现平台分析 亢丽芸, 王效岳, 白如江 ...

  5. MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性

    一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...

  6. ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

    文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...

  7. 【Hybrid App】Hybrid App开发 四大主流移平台分析

    转自http://dev.yesky.com/238/34657738.shtml Hybrid App在过去的两年中已经成为移动界的核心话题,但是作为一名Web开发者来说要如何站在移动互联网的浪潮之 ...

  8. Linux进程组调度机制分析【转】

    转自:http://oenhan.com/task-group-sched 又碰到一个神奇的进程调度问题,在系统重启过程中,发现系统挂住了,过了30s后才重新复位,真正系统复位的原因是硬件看门狗重启的 ...

  9. MCP|ZWT|Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)

    一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性, ...

随机推荐

  1. UML图 | 时序图(顺序、序列图)绘制

    上一次写过一篇 UML | 类图 相关的文章,平时规范开发会用的上,或者是写什么文档,就还是需要画图,就像毕业设计就是如此.希望能够帮助到大家. 注:本文中所用画图软件为 Microsoft Visi ...

  2. Noip模拟21(持续翻车)2021.7.20

    读题总是读错是不是没救了... T1 Median 中位数:按顺序排列的一组数据中居于中间位置的数. 能用上的高亮符号都用上了... 当时忘了就离谱.... 理解什么是中位数(真是个憨憨)后就可以开始 ...

  3. Machine learning(1-Introduction)

    1.What is machine learning Field of study that gives computers the ability to learn without being ex ...

  4. 架构师之路-redis集群解析

    引子 上篇<架构师之路-https底层原理>里我提到了上面的整体视图,文章也介绍了想要真正能在工作中及时正确解决问题的基本功:原理理解透彻.今天以redis集群解析为例介绍一个及时敏锐的发 ...

  5. [个人开源]vue-code-view:一个在线编辑、实时预览的代码交互组件

    组件简介 vue-code-view是一个基于 vue 2.x.轻量级的代码交互组件,在网页中实时编辑运行代码.预览效果的代码交互组件. 使用此组件, 不论 vue 页面还是 Markdown 文档中 ...

  6. js和jq文档操作

    JS文档操作 一.dom树结构 1.元素节点 2.文本节点 3.属性节点      不属于元素节点的子节点  4.文档节点(document) 二.处理元素节点    method    1.docu ...

  7. k8s入坑之路(13)服务迁移(定时任务 微服务 传统服务)

    定时任务迁移kubernetes 服务迁移步骤 1.安装好java 2.安装好maven 项目打包 mvn package 测试传参运行 java -cp cronjob-demo-1.0-SNAPS ...

  8. restTemple发送请求、上传文件(@LoadBalanced微服务调用及url调用)

    import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Co ...

  9. 工具篇:apache-httpClient 和 jdk11-HttpClient的使用

    关注公众号,一起交流,微信搜一搜: 潜行前行 HttpClient (apache) apache HttpClient 是 java项目里 较为常用的组件之一:对接外部服务时,各个商家提供的接口是各 ...

  10. laravel DB 类库

    DB 类操作数据库    基本用法: DB::table('tableName'); 获取操作tableName 表        增加信息        对数据库中的某个表增加数据主要有两个函数可以 ...