【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据
一、iMetaLab简介
宏蛋白组学是个非常小众的领域,即使从事的学者也并非专门做这个,大多是作为系统生物学的延伸研究。业界有几个比较有影响力的研究团队,一是比利时根特大学的Computational Omics and Systems Biology Group(COMPOMICS) 团队,开发了有代表性的宏蛋白分析工具如Unipept、MetaProteomeAnalyzer (MPA),此外还有很多常规蛋白组的工具,如SearchGUI、PeptideShaker、Thermo Raw File Parser 等,后面如果有机会再介绍。二是加拿大渥太华大学的Daniel Figeys团队,专注于研究人类、小鼠肠道宏蛋白组,一开始提出了经典的迭代搜库三步法(MetaPro-IQ),后面陆续也实现了一些工具,开发了从MetaPro-IQ,到MetaLab,最后到iMetaLab平台的技术路线。
Daniel Figeys介绍:https://med.uottawa.ca/bmi/people/figeys-daniel
iMetaLab有云服务器版本和桌面版本,用来分析宏蛋白数据,下游可视化绘图等分析提供了Shiny Apps,并且也有相应的Demo报告和Wiki。内容主要包括了:肽段和蛋白的鉴定及定量,物种和功能分析,数据分析及其可视化。
关于收费,对于学术研究是免费的,商业用途则需要获得许可。
二、内置工具与模块
1. Data Processing module
- ProteoWizard/msconvert
- Xtandem
- MaxQuant
- Spectra clustering
- Msfragger
- FlashLFQ
- Unipept
2. Functional Analysis
- KEGG
- eggNOG database
- NCBI nr database
3. R Developing environment
- Rstudio
- Rstudio server
- ShinyR
- Shiydashboard
4. R based data analysis packages
- ggplot2, ggpairs
- Htmlwidgets, visNetwork, d3heatmap
- Eulerr, colourpicker, DT,shinysky, GGally, ggcorrplot, reshape2, ggfortify, mixOmics
5. Web development libraries and frameworks
- React.js
- D3.js
从内置工具和模块可以看出,这个平台主要处理的是DDA数据,最后得到的蛋白鉴定和定量结果就是MaxQuant产出格式的。
三、报告内容
iMetaLab分析完成后生成网页报告https://shiny.imetalab.ca/metalab_report/。
对于报告结果,主要有以下五方面内容:
- ID Summary:谱图肽段ID统计
- Peptides Summary:肽段鉴定结果分析
- ProteinGroups Summary:蛋白鉴定结果分析
- Taxon Summary:物种注释结果分析
- Function Summary:功能注释结果分析
此外,还有一个MetaMep for Taxon Vis模块,主要是利用MetaMap软件对物种分析结果进行可视化展示和可交互式操作。
1. 谱图肽段ID统计

分析点包括了报告介绍,项目信息,谱图解析率,肽段鉴定数,汇总统计表。
- MSMS ID Rate
这是数据质控的一个指标,可以判断MS run的质量,即在1%FDR条件下谱图鉴定为肽段,QE系列仪器一般能达到50%。可以判断组内重复性,以及仪器是否需要清洗,数据是否可利用等。
展示方式:分组散点图,密度图,箱形图。 - Peptide Sequence
同样也是统计各样本的肽段鉴定数目分布。
可视化:分组散点图,密度图,箱形图。
2. 肽段鉴定结果分析

上图红框内的分析,包括对肽段鉴定各方面的统计绘图,多变量统计和方差检验,到得到整洁的肽段数据。
肽段结果分析及其可视化:价态分布,长度分布,得分分布,肽段强度分布(离散和累积),各样本肽段强度箱形图,全部样本肽段的聚类热图,肽段层次PCA(2D/3D),各组间方差分析。
最后得到的过滤后的肽段表格(MaxQuant结果)是去除了来自反库和污染库的肽段,他们用的强度值是LFQ和自带的Intensity,整洁肽段表可用于后续分析,也可用作者的shiny.imetalab.ca。
3. 蛋白鉴定结果分析

蛋白组层次和肽段层次的分析基本是一样的。多了一个unique peptide分布。
疑问:为什么都用方差分析?难道更多的情况不是两组吗,即便是多组,很多客户也是要求两两比较。
最后得到的也是过滤后的蛋白表格。
4. 物种分析

- 每个样本在物种各个层级的注释统计
- alpha多样性:计算的是种(species)层级的Shannon-Wiener index
- beta多样性:计算的是种(species)层级的PCoA
- 样本聚类:基于种(species)层级的丰度数据,欧氏距离ward.D聚类
- 物种组成:各物种层级bar图(原始强度,无归一化)
5. 功能分析

- 功能数据库注释统计:COG,NOG,KEGG,GO及其unique数目(与蛋白一对一)。
- 分类饼图:包括COG,NOG和Pathway,饼图的扇形大小并非分类功能的数目,而是所有样本proteinGroup的强度之和。
- 功能组成bar图:包括COG,NOG和Pathway,各样本的功能bar图(原始强度,无归一化)。
- 功能组成热图:包括COG,NOG和Pathway,各样本的功能聚类热图。
- PCA分析:包括COG,NOG和KEGG(这里应该也是Pathway层级)功能丰度的PCA。
疑问:一般蛋白/基因注释KEGG是到KO层级,这里都是转化到了Pathway层面,一条Pathway中多个蛋白分子强度不知他们是怎么处理的,之前我是进行加和处理的。
MetaMep for Taxon Vis
最后一个工具是对物种分析进行可视化,可交互是它的优点,而且有多种展示方式。你如果用过MEGAN的话,就知道这些展示方式也都有。当然Unipept也可实现,它这个就是嵌套了Unipept。

【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据的更多相关文章
- Data-independent acquisition mass spectrometry in metaproteomics of gut microbiota - implementation and computational analysis DIA技术在肠道宏蛋白质组研究中的方法实现和数据分析 (解读人:闫克强)
文献名:Data-independent acquisition mass spectrometry in metaproteomics of gut microbiota - implementat ...
- 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)
发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...
- 蛋白组DIA分析:Spectronaut软件使用指南
官方文档: https://biognosys.com/media.ashx/spectronautmanual.pdf 0. 准备 Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之 ...
- MapReduce原理及其主要实现平台分析
原文:http://www.infotech.ac.cn/article/2012/1003-3513-28-2-60.html MapReduce原理及其主要实现平台分析 亢丽芸, 王效岳, 白如江 ...
- MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性
一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...
- ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...
- 【Hybrid App】Hybrid App开发 四大主流移平台分析
转自http://dev.yesky.com/238/34657738.shtml Hybrid App在过去的两年中已经成为移动界的核心话题,但是作为一名Web开发者来说要如何站在移动互联网的浪潮之 ...
- Linux进程组调度机制分析【转】
转自:http://oenhan.com/task-group-sched 又碰到一个神奇的进程调度问题,在系统重启过程中,发现系统挂住了,过了30s后才重新复位,真正系统复位的原因是硬件看门狗重启的 ...
- MCP|ZWT|Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)
一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性, ...
随机推荐
- 提升使用Linux效率的小操作
提升使用Linux效率的小操作 保存更新? 本文记录了个人在使用Linux时觉得好用的一些快捷方式/功能: 为那种知道了能提高效率,但是的不知道也并没有影响的操作. 历史命令 该操作用于快速查看已使用 ...
- “介绍一下自己吧”——记2020BUAA软工团队介绍和采访
写在前面 项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任建) 这个作业的要求在哪里 团队作业-团队介绍和采访 团队介绍 团队名称 我们是 BUAA软软软件工程小队 ,简称 ...
- [技术博客] 利用SharedPreferences来实现登录状态的记忆功能
[技术博客] 利用SharedPreferences来实现登录状态的记忆功能 一.SharedPreferences简介 SharedPreferences是Android平台上一个轻量级的存储辅助类 ...
- SpringCloud微服务实战——搭建企业级开发框架(八):使用注解校验微服务消息参数
平时开发过程中,经常要用到参数校验,如果直接在代码逻辑里面写参数校验,代码有点冗余且用起来不是非常方便,显得代码逻辑复杂且重复代码太多,这里我们使用注解的方式进行参数校验,SpringBoot中常 ...
- Java中的位运算符 &、|、^、~、<< 和 >>
一.& 按位与运算符 5 & 3 = 1 5转换为二进制:0000 0000 0000 0000 0000 0000 0000 0101 3转换为二进制:0000 0000 0000 ...
- PCIE学习笔记--PCIe错误源详解(二)
转载地址:http://blog.chinaaet.com/justlxy/p/5100057799 这篇文章主要介绍事务(Transaction)错误.链路流量控制(Link Flow Contro ...
- (转)刚来的大神彻底干掉了代码中的if else...
一旦代码中 if-else 过多,就会大大的影响其可读性和可维护性. 首先可读性,不言而喻,过多的 if-else 代码和嵌套,会使阅读代码的人很难理解到底是什么意思.尤其是那些没有注释的代码. 其次 ...
- RocketMQ源码详解 | Broker篇 · 其三:CommitLog、索引、消费队列
概述 上一章中,已经介绍了 Broker 的文件系统的各个层次与部分细节,本章将继续了解在逻辑存储层的三个文件 CommitLog.IndexFile.ConsumerQueue 的一些细节.文章最后 ...
- lua入门之环境搭建、第一个demo
前言 前段时间因为有些项目功能需要,自己研究了下lua,今天整理下,并以一个demo为示例演示 手机上的运行效果 分为几个步骤来逐步讲解. 1.lua介绍,为什么选择它? 2.环境安装 3.撸一个简单 ...
- 截取oracle字符串中的数字
方法一:如果Oracle版本不是太低的话,使用 正则表达式函数 REGEXP_SUBSTR 处理. REGEXP_SUBSTR有5个参数,分别是: 第一个是输入的字符串 第二个是正则表达式 第三个是标 ...