文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations

期刊名:Journal of Proteome Research

发表时间:(2019年12月)

IF3.86

单位:

  1. 资讯科学研究院,中央研究院,台湾

物种:

技术:蛋白质组生物信息学

 

一、 概述:(用精炼的语言描述文章的整体思路及结果)

在有关丢失蛋白(MP,missing protein)和蛋白质亚型检测的蛋白质组学研究中,蛋白水解酶的选择是实验设计时需要考虑的一个因素。为了便于蛋白水解酶的选择,本研究开发了iHPDM的网页工具,用于计算机模拟蛋白质消化过程和结果展示。在进行鸟枪法蛋白质组学实验时,iHPDM能够指导蛋白水解酶的选取,以便鉴定MPs、蛋白质亚型和单氨基酸突变肽段。

二、 研究背景:

现阶段,寻找丢失蛋白、注释蛋白质及其亚型是人类染色体蛋白质组计划(C-HPP)的两大主要目标。据统计,neXtProt数据库(2019年1月版本)收纳了20339个具有代表性的人类蛋白质,其中MPs仍有2129个。一直以来,以肽段分析为核心的鸟枪法(shotgun)蛋白质组学是鉴定MPs和蛋白质亚型的常用策略。该策略下蛋白质先经蛋白酶水解为肽段,水解后的肽段经由液相色谱分离并进行质谱检测,其中,蛋白水解酶的选择将会影响可检测肽段的种类和数目,进而限制蛋白质鉴定和蛋白质序列覆盖度。如何合理地选择蛋白水解酶是该研究关心的核心问题。

胰蛋白酶是一种最常见的蛋白水解酶,水解后肽段的质量区间近似在0.5~3 kDa,适用于鸟枪法蛋白质组学的实验流程,使用率高达96.3%。然而,胰蛋白酶对蛋白质切割活动具有一定的阻碍效应(hinder effects),这会导致蛋白质消化不完全以及漏切位点的存在,不利于MPs的鉴定。为了减少此类限制,在蛋白质组学实验中使用其他类型蛋白酶或者联合使用多种蛋白酶将是蛋白质消化的替代解决方案。这些方案有望产生更多unique肽段和更高的序列覆盖度,不仅利于MPs和蛋白质亚型的鉴定,还能够为单氨基酸变体(SAV)肽段的鉴定提供更多可检测的肽段。

为了选择合适的蛋白酶,研究人员需要借助计算机模拟蛋白质消化过程,并通过对模拟消化肽段的结果分析,设计最佳的蛋白质组学实验。目前,已经存在一些Web服务器和独立工具可用于这方面的分析,如PeptideCutter,IPEP,PeptideMass,Proteogest,PepServe和PeptideManager。但是,这些工具尚存在一些不足,主要表现在4个方面:1)展示的结果信息不够全面。如PeptideCutter和IPEP缺乏关于肽段序列唯一性和长度的信息;2)缺乏蛋白质亚型检测的功能。针对目标蛋白质亚型的检测,缺少关于蛋白酶组合适配性方面的检测分析;3)不支持对查询蛋白的消化肽段进行灵活的动态过滤;4)缺乏蛋白质消化结果的可视化审阅功能。

鉴于现有软件的不足之处,该研究构建了一个新型网络服务器工具以满足需要,并命名为iHPDM(in silico Human Proteome Digestion Map),使用地址为http://ms.iis.sinica.edu.tw/iHPDM/index.php。 iHPDM功能全面,其专业化的蛋白酶推荐功能将能够更好地指导蛋白质组学实验,推进丢失蛋白、蛋白质亚型和变异肽段鉴定的研究。

三、 iHPDM数据库资源的构建与功能

为了开发人类蛋白质组的蛋白质酶解消化图谱,iHPDM使用了neXtProt数据库中所有人类蛋白质(2019-01版,包括蛋白质亚型在内的42419个蛋白质序列)作为数据源;提取了每个蛋白的身份和属性等信息(包括neXtProt索引号、蛋白质名称、蛋白质长度、染色体位置等);支持一种或两种蛋白酶的15个组合对42419个人类蛋白质进行计算机消化(酶组合:trypsin,chymotrypsin,LysargiNase,ArgC,GluC,LysC,LysN,AspN,OmpT,KEX2,SAP9,LysC + AspN,trypsin + GluC,trypsin + LysN和trypsin + AspN)。

图1 iHPDM的主界面

从图1 iHPDM的主界面来看,它提供了3大功能模块:

(1)Protein Query模块:针对单一蛋白序列,支持15种组合酶的平行比较分析。 示例结果如图2所示。

(2)Multi-protease Comparison模块:适用于高达1000条蛋白序列的批量处理,支持至多5种组合酶的水解效率的比较评估。

(3)Isoform Digestion模块:在给定蛋白质名称和蛋白酶的情况下,提供了不同蛋白质亚型经蛋白酶消化后地图形可视化结果展示,以便选择最适蛋白酶。示例结果如图3所示。

2 关于NX_Q14390蛋白的Protein Query模块操作结果演示。

在蛋白质序列视图中,所有消化所得肽段按分子量大小归类为BUP(bottom-up proteomics,0.6-3 kDa),eBUP(extended bottom-up proteomics,3-7 kDa)或MDP(middle-down proteomics,7 -15 kDa)三类。

3 胰蛋白酶作用下三种NX_Q8N0V5蛋白质亚型的消化结果展示

五、文章亮点(结论讨论):

本文提供了一个功能全面的、可对蛋白质进行理论酶解的iHPDM网页版工具。该工具的亮点是1)支持蛋白酶的种类丰富;2)提供了交互式图形操作和可视化界面,便于分析和检查消化结果;3)不仅可以鉴定MPs和蛋白质亚型,还可以选择蛋白酶以便检测具有单氨基酸变异肽的蛋白质。

阅读人:邓亚美

原文链接:https://pubs.acs.org/doi/abs/10.1021/acs.jproteome.9b00350

DOI:10.1021/acs.jproteome.9b00350

Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)的更多相关文章

  1. Journal of Proteome Research | Current understanding of human metaproteome association and modulation(人类宏蛋白质组研究近期综述)(解读人:李巧珍)

    文献名:Current understanding of human metaproteome association and modulation(人类宏蛋白质组研究近期综述) 期刊名:J Prot ...

  2. Journal of Proteome Research | Single-Shot Capillary Zone Electrophoresis−Tandem Mass Spectrometry Produces over 4400 Phosphopeptide Identifications from a 220 ng Sample (分享人:赵伟宁)

    Title: Single-Shot Capillary Zone Electrophoresis−Tandem Mass Spectrometry Produces over 4400 Phosph ...

  3. Multi-batch TMT reveals false positives, batch effects and missing values(解读人:胡丹丹)

    文献名:Multi-batch TMT reveals false positives, batch effects and missing values (多批次TMT定量方法中对假阳性率,批次效应 ...

  4. Mol Cell Proteomics. | Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioPortal (解读人:徐洪凯)

    文献名:Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioP ...

  5. Journal of Proteome Research | Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human Missing Proteins in GPM (解读人:梁嘉琪)

    文献名:Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human ...

  6. Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)

    文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...

  7. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  8. Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)

    文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...

  9. Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)

    期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...

随机推荐

  1. openpyxl操作excel表格

    1.openpyxl 只支持打开.xlsx格式,其他excel类库基本也是 2.不能这里的工作面板直接右键新建表格,必须到文件夹下面去新建,可以把在别的目录新建的表格直接复制到当前目录下 3.从表格中 ...

  2. POJ 2226 Muddy Fields 二分图(难点在于建图)

    题意:给定一个矩阵和它的N行M列,其中有一些地方有水,现在有一些长度任意,宽为1的木板,要求在板不跨越草,用一些木板盖住这些有水的地方,问至少需要几块板子? 思路:首先想到如果没有不准跨越草的条件则跟 ...

  3. Catalan母函数法解表达式

  4. 一句话看懂redux

    一个是存储在 store 里面的 state,另一个是每一次调用 dispatch 所传进来的 action.reducer 的作用,就是对 dispatch 传进来的 action 进行处理,并将结 ...

  5. console.log添加样式及图片

    console.log在控制台打出css样式的文字及图片 谷歌开发者中心上面关于谷歌浏览器控制台console.log()的文档 Format Specifier %s Formats the val ...

  6. 阿里云ECS 实例Centos7系统磁盘扩容

    需求:一台阿里云的数据盘磁盘空间不足,需要扩容,我这里只有一个主分区,ext4文件系统. 因为磁盘扩容场景不同,阿里云的文档比较全面一些,所以先奉上阿里云的文档,下面开始我的操作步骤: 1.登录控制台 ...

  7. Android实习生 —— 屏幕适配及布局优化

    为什么要进行屏幕适配.对哪些设备进行适配?在近几年的发展当中,安卓设备数量逐渐增长,由于安卓设备的开放性,导致安卓设备的屏幕尺寸大小碎片化极为严重.从[友盟+]2016年手机生态发展报告H1中看截止1 ...

  8. 自己动手用java写一个hashMap

    入坑java很多年了,现在总结一下自己学到的东西. 1.首先我们先来聊聊什么是HashMap? 什么是hash?hash用中文的说法就叫做“散列”,通俗的讲就是把任意长度的字符串输入,经过hash计算 ...

  9. spring boot整合memcache

    1.导入memcached客户端jar包 <dependency> <groupId>com.whalin</groupId> <artifactId> ...

  10. npm项目创建初始过程详解

    npm install 就是安装模块,npm run dev  就是执行npm script中的命令.当我们执行npm命令的时候,它到哪里去找,这就要说到每个node项目中都有的核心文件package ...