ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
期刊名:Mol Cell Proteomics
发表时间:(2019年11月)
IF:4.828
单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心
物种:人和小鼠
技术:ComplexBrowser
一、 概述:(用精炼的语言描述文章的整体思路及结果)
ComplexBrowser软件在CORUM和EBI两个测试数据集中识别了在人癌症和小鼠T细胞活化过程中已知的受调控的关键蛋白质复合物。找到了给定蛋白质列表中存在的已知蛋白质复合物,并利用定量蛋白质组数据(无标签或等分质量标签)和因子分析来总结整体研究生物条件中每个复合物的表达趋势。通过蛋白质复合物的鉴定而实现的生物学解释与基于原始研究中的GO注释得出的结论一致。该工具还对以前未在分析中考虑的带注释的蛋白质复合物进行研究,增加了新的见解。对这两个先前公布的大规模蛋白质组数据集的重新分析表明,该方法在不同生物环境中深入了解蛋白质复合物的调控具有巨大潜力。
二、 研究背景:(简要介绍研究进展动态、研究目的和意义)
蛋白质复合物是分子机器,可以执行许多重要的细胞生化关键活动,例如:复制,转录,翻译,细胞信号转导,细胞周期调控和氧化磷酸化。它们在维持细胞稳态和参与疾病发展中的作用证明了蛋白复合物表达的详细表征将有助于理解细胞中通常高度交织的过程。许多已知的蛋白质复合物是翻译和翻译后调节的,因此在细胞类型和组织之间比较时表现出共表达。然而,到目前为止,还没有开发用于分析新数据集中复杂行为的自动化和用户友好型方法。
ComplexBrowser软件可以提供蛋白质复合物表达和组成成分的交互可视化信息,以进行探索性分析,并结合了质量控制步骤,其中包括基于limma软件包的标准化和统计分析。是第一个用于自动化定量蛋白质复合物分析以进行高通量研究的工具,具有集成到科学界常用的数据分析工作流中的巨大潜力。
三、实验设计:

四、研究成果:
1、腺癌数据集使用基于LFQ强度的无标记定量方法研究了结肠癌患者健康结肠黏膜和淋巴结转移性肿瘤的福尔马林固定的石蜡包埋组织样品的蛋白表达差异。该程序的一般分析流程如图1所示。在定义分析参数(例如条件数量和重复项)后,将对数据质量进行分析并可视化。在接下来的窗口中,进行蛋白质复合物的存在和丰度变化的分析。交互式表格和图形使用户可以方便地评估分析结果。鉴定出的蛋白质列表以及定量信息将上传至软件,并设置分析参数(左图)。接下来是对所提供定量数据质量的评估(中间图)。最后,鉴定并可视化蛋白质复合物的存在和丰度变化(右图)。

2、将含有3种生物学条件,7个重复的定量蛋白质组学值的腺癌数据集数据按顺序上传到ComplexBrowser:C1 –对照,C2 –转移,C3 –癌症。对数转换强度的箱线图分析(图2A)表明,归一化对于减小强度分布之间的差异并确保样品之间的可比性是必要的;因此,进行了分位数归一化。图2B表明尽管进行了标准化,但对照,转移和癌症样品的平均CV值分别为65%,78%和77%,测量范围内的变化较大,很可能是由于样品的临床特征导致。图2C表明在腺癌数据集中,每个样品的缺失值数量从113到510不等,共占所有有效测量值的3.5%,没有显示出持久的数据偏差。PCA分析(图2D)显示对照样品良好分离,但癌与转移组织之间存在重叠。

3、T细胞数据集由四组(0、2、8和16 h)组成,具有两个重复,基于TMT的定量方法生成。ComplexBrowser生成的T细胞数据集质量控制分析可视化图3A显示出了所选样品之间蛋白质与TMT强度的相关性。越来越多的差异表达蛋白质(39、1,869和5,600)在2、4和16小时后检测到。图3B展示了由ComplexBrowser软件生成的火山图,C1,C2,C3和C4分别表示未受刺激的T细胞(0小时)和分别受刺激2小时,8小时和16小时的T细胞。

4、用CORUM和Complex Portal分析腺癌数据集的蛋白质复合物,分别鉴定了1,519和366个蛋白质复合物。图4给出了由ComplexBrowser生成的蛋白质复合物及其成分的典型可视化图。A-代表复合物组成成分在转移和对照样品之间变化的星形图,B图表示NADH泛醌氧化还原酶链6(P03923)的表达在癌症和转移组织中的表达降低,C图为呼吸链复合体I中所鉴定及定量的蛋白亚基的表达谱,D图表示三种分析条件下呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度的相关热图,E图表示A组中呈现的呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度热图; C1 –正常,C2 –癌症,C3 –转移组织。

5、图5显示了ComplexBrowser对T细胞数据集中的选定蛋白质复合物进行鉴定后的结果。发现p19-Cdk4-cyclinD2(16小时后为3.96 CFC)和与Cyclin D1相关的蛋白复合物(16小时后为2.47 CFC)是激活后8和16小时内上调程度最高的蛋白。这两个复合物参与细胞周期的调节和通过G1期的转变,它们的协同上调反映了T细胞向增殖状态的转变。这些变化伴随着各种DNA聚合酶复合物,例如DNA聚合酶表达的增加。此外,在Cd3d-Cd3g-Cd3e-Cd247复合物(1.07,-1.2,-1.36 CFC)的表达中发现了下调趋势,该复合物是T细胞共受体的一部分,其在T细胞激活期间被关闭。

五、文章亮点(结论讨论):
ComplexBrowser是第一个能够对蛋白质组学实验中的蛋白质复合物进行定量分析的自动化工具。它可以通过网络浏览器获得,不需要任何安装或编程经验。
该软件的独特功能是能够量化蛋白质复合物的丰度变化以及不同实验条件下的组成成分共表达。ComplexBrowser可以处理包含8,000多种定量蛋白质的大型蛋白质组学研究,并能够在输入数据后一分钟内显示汇总结果。交互式可视化为探索性分析和数据解释提供了直观的工具,使用户能够研究整个复合物以及单个亚基的行为。CFC(Complex fold change复合物的倍数变化)有效地帮助找到以同步方式变化表达的复合物,并且是复杂行为的一种度量。使用软件中实现的大量可视化工具,还可以轻松识别与复杂表达趋势不一致的亚基。
ComplexBrowser中呈现的方法的新颖之处在于,与GO注释和GO富集分析相比,ComplexBrowser可从手动管理的数据库(例如,数据库)中识别蛋白质复合物的成分,在其他任何软件中均不提供,它有助于蛋白质组学数据的定量分析,这是快速应用程序-FARMS算法,用于以CFC因子的形式定量测量复杂组件的变化,并以噪声的形式评估复杂亚基的协调表达。因此,ComplexBrowser为例如STRING或GO术语富集工具提供了一种补充方法。目前,ComplexBrowser最适合分析人类蛋白质。此外,数据库包含未完全注释的条目。数据库的进一步开发将改善软件提供的结果。
阅读人:张霞
ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)的更多相关文章
- MCP|WJ|Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)
文献名:Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex pr ...
- Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Without Carrier Identification (文献分享一组-孔楠楠)
题目:Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Wit ...
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- Significance A and B for protein ratios
实验设计中,一般会做三个生物学重复来确保结果的准确性,尤其在下游分析中.但有时会遇到没有生物学重复,而又需要进行差异分析的情况,这时一般建议考虑foldchange即可,因为根本无法进行T-test等 ...
- JIPB | 两篇连发:华中农大黄俊斌团队报道二羟基异丁酰化调控稻曲病菌致病新机制
水稻是我国重要的粮食作物,稻曲病是水稻三大病害之一,不仅造成稻米产量损失,更重要的是稻曲球中的稻曲菌素的毒性和致畸作用,给人畜健康带来严重威胁.病原菌对植物的侵袭是由病原菌的毒力和植物免疫系统相互作用 ...
- 【6】蛋白质组学鉴定定量软件之MaxQuant
目录 1.简介 2.下载安装 3.配置与运行 4.结果 5.Perseus后处理 6.小结 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQua ...
- Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)
文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...
- Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)
文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectr ...
- Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)
文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...
随机推荐
- 是谁收购了被谷歌私藏7年之久的Zagat?
国内餐饮行业的风口似乎总是执着于"价格"上,无论是天天搞特价的外卖,还是优惠不停歇的团购网站,都将"价格"当做了竞争的杀手锏.即使是网红奶茶.甜品之类的,也是将 ...
- 如何在sublime中调试html文件
一.安装View In Browser插件 快捷键 Ctrl+Shift+P(菜单栏Tools->Command Paletter),输入 pcip选中Install Package并回车,输入 ...
- 旅游机票类专业名词---PNR
PNR: PNR是旅客订座记录,即Passenger Name Record的缩写,它反映了旅客的航程,航班座位占用的数量,及旅客信息.适用民航订座系统. 一个PNR由以下几项组成: 姓名组NM 航段 ...
- 杀入红海市场 ZUK手机底气在哪?
从越来越奢华的发布会舞台屏幕,到创意越来越烧脑的邀请函,一款新手机的发布工作变得越来越系统化.何时展示.如何亮相,都成为影响一部手机情怀,甚至销售好坏的重要因素.虽然很难以一个固定标准衡量各个手 ...
- Hexo+Git一个小时快速搭建个人博客
搭建本地环境:Hexo框架 Hexo为何物 Hexo 是一个快速.简洁且高效的博客框架.Hexo 使用Markdown解析文章,并瞬间利用靓丽的主题生成静态网页.其中,Markdown是一个用于将普通 ...
- PM2.5如何引发心脏病的?
过去的几十年里,科学家们一点一滴地积累起关于空气污染如何威胁人类健康的新认识.他们的注意力大多集中在肺部疾病,包括癌症上面.对空气污染具体危害的认识越来越多,但是对污染的控制和治理却显得举步维艰.面对 ...
- 分布式系统一致性问题与Raft算法(上)
最近在做MIT6.824的几个实验,真心觉得每一个做分布式相关开发的程序员都应该去刷一遍(裂墙推荐),肯定能够提高自己的技术认知水平,同时也非常感谢MIT能够把这么好的资源分享出来. 其中第二个实验, ...
- 7-3 jmu-python-回文数判断(5位数字) (10 分)
本题目要求输入一个5位自然数n,如果n的各位数字反向排列所得的自然数与n相等,则输出‘yes’,否则输出‘no’. 输入格式: 13531 输出格式: yes 输入样例1: 13531 输出样例1: ...
- C与ARM汇编结合实现mini2440串口uart简单程序
最近学完了ARM的一些基础知识,开始在mini2440上开发一些简单的程序,串口发送程序是一开始涉及多个寄存器的例子,稍有繁多的步骤应该是开发过程中要慢慢适应的境况 下面的程序的目的是实现mini24 ...
- python版md-to-html编辑器
用PyQt5封装python-markdown,支持自定义样式. 详情:https://blog.phyer.cn/article/4523