文献名:Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human Missing Proteins in GPM(利用SRMAtlas中的已有的蛋白质组数据验证GPM中人类缺失蛋白的存在)

期刊名:journal of proteome

发表时间:2019.10.24

IF:3.780

单位:

1、日本Niigata大学

2、开罗Al-Azhar大学

物种:人类

技术:生物信息学;LC-MS/MS

一、 概述

2012年以来,人类蛋白质组计划(HPP)致力于研究人类所有蛋白质。然而,根据neXtProt(2019−1)的最新发布,大约10%的人类基因仍然没有充分或没有实验证据证明它们在蛋白质水平上的翻译。它们被归类为缺失蛋白(PE2 - PE4)。为了进一步实现HPP的目标,开发了两步生物信息学策略,解决了如何利用与缺失蛋白相对应的SRMAtlas肽作为唯一参考,以探索它们在GPM中的天然对应物。第一步,我们在GPM中搜索与缺失蛋白相对应的SRMAtlas肽,在35个不同的蛋白质组学研究中,新发现了51个缺失蛋白。第二步,我们根据合成肽和天然肽在SRMAtlas和GPM中的谱图进行比对,验证这些新发现的缺失蛋白。结果表明,经谱图匹配验证23个缺失蛋白中含有≥2个肽段。

二、 研究背景

人类蛋白质组计划是一项旨在对人类基因组中编码的所有人类蛋白质进行编目的世界性项目,通过对每个已知的人类基因序列识别至少一种蛋白质,验证人类蛋白的存在。根据neXtProt数据库最新版本,17694个蛋白质(89.26%)在蛋白质水平上有足够的实验证据(PE1),而2129个蛋白质(10.74%)被认为是缺失的(PE2-PE4),没有实验证据。

缺乏实验证据的原因有:1、没有表达(沉默基因);2、在某些组织中没有表达;3、表达水平极低;4、具有极端的物化性质,影响蛋白的溶解和提取;5、存在未知修饰

目前对缺失蛋白的发现速度很慢。GPM(Global Proteome Machine)可重新分析与Peptide Atlas不同的LC-MS/MS数据,综合利用它们的蛋白质组数据有可能加速缺失蛋白的发现。

SRMAtlas是迄今为止人类蛋白质组中最全面的实验资源,拥有166174个肽的实验数据,几乎涵盖所有缺失蛋白,本研究的主要目的是利用与缺失蛋白相对应的SRMAtlas肽的实验数据作为参考,以探索它们在GPM中的天然对应物。

三、 实验设计

分为两步策略:1、在GPM中寻找与缺失蛋白对应的SRMAtlas肽段(基于肽段一级氨基酸序列);2、基于SRMAtlas中的合成肽段和GPM中的天然肽段的谱图匹配验证新检测到的蛋白质肽段

四、 研究成果

1、 在SRMAtlas数据库中寻找与缺失蛋白相对应的肽段,利用最新的neXtProt缺失蛋白数据库,在SRMAtlas中检索到与1764个缺失蛋白相对应的8796个肽段,。

2、 利用neXtProt中的肽段唯一性检测工具检测与缺失蛋白相对应的肽段的唯一性,结果表明与1644个缺失蛋白相对应的6736个肽是长度≥9aa的唯一性肽段(table s1),2060个肽段被过滤掉。对6736个肽段的分布研究表明超过96%的是至少含有2个肽段(fig2A),这表明SRMAtlas数据库中不同蛋白质组学的研究对验证缺失蛋白的存在是至关重要的。

3、 使用SRMAtlas数据检测和验证GPM中的人类缺失蛋白,基于氨基酸序列,编写了一个perl脚本在GPM中的1898569个肽中检索缺失蛋白对应的SRMAtlas中的肽。脚本返回匹配到的肽及其在GPM和SRMAtlas中的注释。结果是在GPM中检测到与307个缺失蛋白对应的449个肽段。89个缺失蛋白拥有至少2个天然肽段(fig2B),对89个缺失蛋白的的谱数中位数为每肽23个谱,一个肽段的最小谱数为5个谱。(fig3A)

另外,与GPM数据库中发现的缺失蛋白匹配的最佳PSMs的中位E-value是2400x10-8,最大E-value是9700x10-4(fig3B)。

4、 一些候选的PE1蛋白仅在某些蛋白质组学实验中被检出,有趣的是,观察这些蛋白在不同组织和细胞系中的分布发现(fig4A),大脑是缺失蛋白最易被检出的区域之一,在一项关于人脑的研究中有6个缺失蛋白被明确。另外4个缺失蛋白在HEK293和HEK293 T细胞中被发现,表明这些细胞系可能为缺失蛋白的表达提供了舒适的环境(fig4B)。

5、检索SRMAtlas中“PE1候选蛋白”的光谱。在SRMAtlas中,通过SRMAtlas查询工具搜索“PE1候选蛋白”对应的肽段,从不同的质谱源(QQQ、QTOF和QTRAP)检索这些肽段的片段离子。获得了123个与缺失蛋白对应的光谱。在母离子水平。我们检查了GPM和SRMAtlas的一对光谱是否与具有相同母离子电荷和相同m/ z的相同肽序列在0.01 Da差异内匹配(fig5A)。结果表明,从QTOF、QQQ和QTRAP中分别得到的65、54和73个肽段光谱与GPM中的天然对应物光谱匹配良好。在碎片离子水平,与23个缺失蛋白对应的55个多肽有≥2个多肽 (表1)。值得注意的是,所有QQQ、QTRAP和QTOF光谱中,23个缺失蛋白所对应的碎片离子中,有74%存在m/z的0.02 Da的差异。

五、 结论讨论

SRMAtlas是唯一一个含有实验数据的数据库资源,这些实验数据都是针对那些与缺失蛋白质相关的肽段。利用这些数据对缺失蛋白的发现有重要作用。在GPM中搜索SRMAtlas中与缺失蛋白对应的肽,发现了123个天然肽段,它们与51个缺失蛋白匹配。此外,通过匹配GPM和SRMAtlas之间新发现的缺失蛋白的MS/MS谱,这51个缺失蛋白中的23拥有≥2个肽段且≥9aa。最后,我们建议,挖掘更多的蛋白质组学研究以外的其他分析PeptideAtlas将帮助我们发现更多缺失蛋白

Journal of Proteome Research | Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human Missing Proteins in GPM (解读人:梁嘉琪)的更多相关文章

  1. Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)

    文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...

  2. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  3. Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)

    文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Vi ...

  4. Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)

    文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...

  5. Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)

    期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...

  6. Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)

    文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...

  7. Journal of Proteome Research | Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio) (解读人:关姣)

    文献名:Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio)(斑马鱼赖氨酸琥珀酰化的全球蛋白质组学分 ...

  8. Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)

    文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...

  9. Journal of Proteome Research | Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizobium favelukesii)的蛋白质组学分析)(解读人:丑天胜)

    文献名:Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizo ...

随机推荐

  1. python标准库-calendar 模块

    原文地址:http://www.bugingcode.com/blog/python_calendar.html calendar 模块是python实现的unix 的 cal命令.它可以以标准的模式 ...

  2. <NOIP2005提高T2>过河の思路

    emm又一道dp dp真有趣(你的良心呢?!!! Description 在河上有一座独木桥,一只青蛙想沿着独木桥从河的一侧跳到另一侧.在桥上有一些石子,青蛙很讨厌踩在这些石子上.由于桥的长度和青蛙一 ...

  3. python socket粘包及实例

    1.在linux中经常出现粘包的出现(因为两个send近靠着,造成接受到的数据是在一起的.)解决方法: 在服务端两send的中间中再添加一个recv(),客户端添加一个send(),服务端收到信息确认 ...

  4. 让git push命令不再需要密码

    最近利用jekyll写博客,为的就是博客管理方便,但是在上传博客的时候使用git push命令每次都得输入github帐号和密码特别的不方便,于是就搜了一下. 在这篇文章里提到,GitHub获得远程库 ...

  5. uniq命令使用方法

    uniq命令的作用:显示唯一的行,对于那些连续重复的行只显示一次! 接下来通过实践实例说明: [root@stu100 ~]# cat test boy took bat home boy took ...

  6. NOI Online 赛前刷题计划

    Day 1 模拟 链接:Day 1  模拟 题单:P1042 乒乓球  字符串 P1015 回文数  高精 + 进制 P1088 火星人  搜索 + 数论 P1604 B进制星球  高精 + 进制 D ...

  7. 配置VSCode的C/C++语言功能

    0. 前言 主要是在网上找的方法都没试成功过,在各种机缘巧合下终于成功了. 这篇文章基于个人经验,而且没有走寻常路. 1. 需要的软件和插件 软件: VSCode (https://code.visu ...

  8. 不要忽视Managed code stripping的副作用

    0x00 前言 Unity 2018.3之后,新的“Managed Stripping Level”选项将替换 player settings 中原有的“Stripping Level”选项. 这个新 ...

  9. moment太重? 那就试试miment--一个超轻量级的js时间库

    介绍 Miment 是一个轻量级的时间库(打包压缩后只有1K),没有太多的方法,Miment的设计理念就是让你以几乎为零的成本快速上手,无需一遍一遍的撸文档 由来 首先 致敬一下Moment,非常好用 ...

  10. Windows安装python包出现PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问的问题解决方案

    在python中安装sqlalchemy时,总是提示(当安装依赖有vs的python包时,可能会出现以下错误:) PermissionError: [WinError 32] 另一个程序正在使用此文件 ...