文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

期刊名:Mol Cell Proteomics

发表时间:(2019年11月)

IF4.828

单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心

物种:人和小鼠

技术:ComplexBrowser

 

一、 概述:(用精炼的语言描述文章的整体思路及结果)

ComplexBrowser软件在CORUM和EBI两个测试数据集中识别了在人癌症和小鼠T细胞活化过程中已知的受调控的关键蛋白质复合物。找到了给定蛋白质列表中存在的已知蛋白质复合物,并利用定量蛋白质组数据(无标签或等分质量标签)和因子分析来总结整体研究生物条件中每个复合物的表达趋势。通过蛋白质复合物的鉴定而实现的生物学解释与基于原始研究中的GO注释得出的结论一致。该工具还对以前未在分析中考虑的带注释的蛋白质复合物进行研究,增加了新的见解。对这两个先前公布的大规模蛋白质组数据集的重新分析表明,该方法在不同生物环境中深入了解蛋白质复合物的调控具有巨大潜力。

二、 研究背景:(简要介绍研究进展动态、研究目的和意义)

蛋白质复合物是分子机器,可以执行许多重要的细胞生化关键活动,例如:复制,转录,翻译,细胞信号转导,细胞周期调控和氧化磷酸化。它们在维持细胞稳态和参与疾病发展中的作用证明了蛋白复合物表达的详细表征将有助于理解细胞中通常高度交织的过程。许多已知的蛋白质复合物是翻译和翻译后调节的,因此在细胞类型和组织之间比较时表现出共表达。然而,到目前为止,还没有开发用于分析新数据集中复杂行为的自动化和用户友好型方法。

ComplexBrowser软件可以提供蛋白质复合物表达和组成成分的交互可视化信息,以进行探索性分析,并结合了质量控制步骤,其中包括基于limma软件包的标准化和统计分析。是第一个用于自动化定量蛋白质复合物分析以进行高通量研究的工具,具有集成到科学界常用的数据分析工作流中的巨大潜力。

三、实验设计:

四、研究成果:

1、腺癌数据集使用基于LFQ强度的无标记定量方法研究了结肠癌患者健康结肠黏膜和淋巴结转移性肿瘤的福尔马林固定的石蜡包埋组织样品的蛋白表达差异。该程序的一般分析流程如图1所示。在定义分析参数(例如条件数量和重复项)后,将对数据质量进行分析并可视化。在接下来的窗口中,进行蛋白质复合物的存在和丰度变化的分析。交互式表格和图形使用户可以方便地评估分析结果。鉴定出的蛋白质列表以及定量信息将上传至软件,并设置分析参数(左图)。接下来是对所提供定量数据质量的评估(中间图)。最后,鉴定并可视化蛋白质复合物的存在和丰度变化(右图)。

2、将含有3种生物学条件,7个重复的定量蛋白质组学值的腺癌数据集数据按顺序上传到ComplexBrowser:C1 –对照,C2 –转移,C3 –癌症。对数转换强度的箱线图分析(图2A)表明,归一化对于减小强度分布之间的差异并确保样品之间的可比性是必要的;因此,进行了分位数归一化。图2B表明尽管进行了标准化,但对照,转移和癌症样品的平均CV值分别为65%,78%和77%,测量范围内的变化较大,很可能是由于样品的临床特征导致。图2C表明在腺癌数据集中,每个样品的缺失值数量从113到510不等,共占所有有效测量值的3.5%,没有显示出持久的数据偏差。PCA分析(图2D)显示对照样品良好分离,但癌与转移组织之间存在重叠。

3、T细胞数据集由四组(0、2、8和16 h)组成,具有两个重复,基于TMT的定量方法生成。ComplexBrowser生成的T细胞数据集质量控制分析可视化图3A显示出了所选样品之间蛋白质与TMT强度的相关性。越来越多的差异表达蛋白质(39、1,869和5,600)在2、4和16小时后检测到。图3B展示了由ComplexBrowser软件生成的火山图,C1,C2,C3和C4分别表示未受刺激的T细胞(0小时)和分别受刺激2小时,8小时和16小时的T细胞。

4、用CORUM和Complex Portal分析腺癌数据集的蛋白质复合物,分别鉴定了1,519和366个蛋白质复合物。图4给出了由ComplexBrowser生成的蛋白质复合物及其成分的典型可视化图。A-代表复合物组成成分在转移和对照样品之间变化的星形图,B图表示NADH泛醌氧化还原酶链6(P03923)的表达在癌症和转移组织中的表达降低,C图为呼吸链复合体I中所鉴定及定量的蛋白亚基的表达谱,D图表示三种分析条件下呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度的相关热图,E图表示A组中呈现的呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度热图; C1 –正常,C2 –癌症,C3 –转移组织。

5、图5显示了ComplexBrowser对T细胞数据集中的选定蛋白质复合物进行鉴定后的结果。发现p19-Cdk4-cyclinD2(16小时后为3.96 CFC)和与Cyclin D1相关的蛋白复合物(16小时后为2.47 CFC)是激活后8和16小时内上调程度最高的蛋白。这两个复合物参与细胞周期的调节和通过G1期的转变,它们的协同上调反映了T细胞向增殖状态的转变。这些变化伴随着各种DNA聚合酶复合物,例如DNA聚合酶表达的增加。此外,在Cd3d-Cd3g-Cd3e-Cd247复合物(1.07,-1.2,-1.36 CFC)的表达中发现了下调趋势,该复合物是T细胞共受体的一部分,其在T细胞激活期间被关闭。

五、文章亮点(结论讨论):

ComplexBrowser是第一个能够对蛋白质组学实验中的蛋白质复合物进行定量分析的自动化工具。它可以通过网络浏览器获得,不需要任何安装或编程经验。

该软件的独特功能是能够量化蛋白质复合物的丰度变化以及不同实验条件下的组成成分共表达。ComplexBrowser可以处理包含8,000多种定量蛋白质的大型蛋白质组学研究,并能够在输入数据后一分钟内显示汇总结果。交互式可视化为探索性分析和数据解释提供了直观的工具,使用户能够研究整个复合物以及单个亚基的行为。CFC(Complex fold change复合物的倍数变化)有效地帮助找到以同步方式变化表达的复合物,并且是复杂行为的一种度量。使用软件中实现的大量可视化工具,还可以轻松识别与复杂表达趋势不一致的亚基。

ComplexBrowser中呈现的方法的新颖之处在于,与GO注释和GO富集分析相比,ComplexBrowser可从手动管理的数据库(例如,数据库)中识别蛋白质复合物的成分,在其他任何软件中均不提供,它有助于蛋白质组学数据的定量分析,这是快速应用程序-FARMS算法,用于以CFC因子的形式定量测量复杂组件的变化,并以噪声的形式评估复杂亚基的协调表达。因此,ComplexBrowser为例如STRING或GO术语富集工具提供了一种补充方法。目前,ComplexBrowser最适合分析人类蛋白质。此外,数据库包含未完全注释的条目。数据库的进一步开发将改善软件提供的结果。

阅读人:张霞

ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)的更多相关文章

  1. MCP|WJ|Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)

    文献名:Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex pr ...

  2. Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Without Carrier Identification (文献分享一组-孔楠楠)

    题目:Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Wit ...

  3. 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载

    转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...

  4. Significance A and B for protein ratios

    实验设计中,一般会做三个生物学重复来确保结果的准确性,尤其在下游分析中.但有时会遇到没有生物学重复,而又需要进行差异分析的情况,这时一般建议考虑foldchange即可,因为根本无法进行T-test等 ...

  5. JIPB | 两篇连发:华中农大黄俊斌团队报道二羟基异丁酰化调控稻曲病菌致病新机制

    水稻是我国重要的粮食作物,稻曲病是水稻三大病害之一,不仅造成稻米产量损失,更重要的是稻曲球中的稻曲菌素的毒性和致畸作用,给人畜健康带来严重威胁.病原菌对植物的侵袭是由病原菌的毒力和植物免疫系统相互作用 ...

  6. 【6】蛋白质组学鉴定定量软件之MaxQuant

    目录 1.简介 2.下载安装 3.配置与运行 4.结果 5.Perseus后处理 6.小结 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQua ...

  7. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  8. Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)

    文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectr ...

  9. Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)

    文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...

随机推荐

  1. python 面向对象静态方法、类方法、属性方法、类的特殊成员方法

    静态方法:只是名义上归类管理,实际上在静态方法里访问不了类或实例中的任何属性. 在类中方法定义前添加@staticmethod,该方法就与类中的其他(属性,方法)没有关系,不能通过实例化类调用方法使用 ...

  2. Network Saboteur (DFS)

    题目: A university network is composed of N computers. System administrators gathered information on t ...

  3. <pre>标签的使用

    做做笔记.碰见了一个网站,显示代码的时候自带语法高亮,这很新鲜.它的代码被pre标签包裹,原本以为pre标签下的所有的内容会以文本原来的样式输出,特意查了查发现它依然支持html标签. 先来个菜鸟教程 ...

  4. 01.JS块级作用域与let

    1.块级作用域   什么是:         在一个代码块(括在一对花括号中的一组语句)中定义的所需变量(与let配合使用)并在代码块的外部是不可见的.   为什么:         在ES6之前,函 ...

  5. HTML标签学习总结(2)

    点我:HTLM标签学习总结(1) 11. 在网页制作过程过中,可以把一些独立的逻辑部分划分出来,放在一个<div>标签中,这个<div>标签的作用就相当于一个容器. 语法: & ...

  6. VirtualBox上使用kubeadm安装Kubernetes集群

    之前一直使用minikube练习,为了更贴近生产环境,使用VirtualBox搭建Kubernetes集群. 为了不是文章凌乱,把在搭建过程中遇到的问题及解决方法记在了另一篇文章:安装Kubernet ...

  7. windows 10 右键菜单注册表位置

    1. 查找 1.1. 打开注册表 # 1. 使用快捷键打开 “运行” win + r # 2. 在 “运行” 中输入 regedit # 3. 回车 1.2. 点击 查找 # 1. 方法 1 : 点击 ...

  8. NumPy——统计函数

    引入模块import numpy as np 1.numpy.sum(a, axis=None)/a.sum(axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组,不指定 ...

  9. sql02

    1.小练习: 一切数据都是有用的,当我们删除时只是象征性设置一个标志位: 2.SQL学习 1)创建数据库 create database DbName; 使用--注释 多行注释/**/ 2)删除数据库 ...

  10. 用table类型布局一个新闻网页

    <html><head><meta http-equiv="Content-Type" content="text/html; charse ...