文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation(SAAVpedia:蛋白质基因组解释的单氨基酸突变的识别、功能注释和检索)

期刊名:Journal of Proteome Research

发表时间:2019年10月

IF3.78

单位:

  1. 韩国基础科学研究所,生物融合分析研究中心
  2. 韩国化学技术研究所,药物信息平台中心
  3. 韩国大田忠南国立大学,分析科学与技术研究所

物种:

技术:蛋白基因组学,SAAVpedia

 

一、 概述:

新一代的基因组测序技术使得许多疾病或药物反应相关的非同义单核苷酸变异(Nonsynonymous Single Nucleotide Variants, nsSNVs)的发现成为可能,这些变异改变了蛋白质的氨基酸序列。目前已有研究试图描述致病的nsSNVs,但很少有研究在蛋白质水平上被确认为单氨基酸变异(Single Amino Acid Variants, SAAVs)。本研究开发了由四个模块(SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer)组成的SAAVpedia平台,从蛋白质组和基因组数据中识别、注释和检索致病的SAAV候选。SAAVpedia在乳腺癌和恶性胶质瘤数据分析中的应用说明其在确认基因组变体是否存在于氨基酸序列中是一个比较合适的工具。

二、 研究背景:

得益于二代测序技术,大量的可能会引起蛋白功能变化的nsSNVs被鉴定到,目前已经有了许多对其致病机理和分子机制进行预测、解释的研究,但这些方法在不同数据集之间无法充分的复现。在一些研究中,结合蛋白质组数据在蛋白质水平上鉴定到的来自nsSNVs的变异,可能在实际的疾病发生过程中扮演重要的角色。但是由于没有开发出有关鉴定SAAV的综合蛋白基因组学分析平台,目前只有很少一部分SAAV能够与疾病相关的基因组数据和功能联系起来,大多数SAAV的生物、临床和药理功能仍然是未知的,进一步确认致病的SAAV是极其困难的。

三、 实验设计:

四、研究成果:

SAAVpedia是一个从蛋白质组和基因组数据中识别、注释和检索致病SAAV候选体的平台。该平台由四个模块组成:SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer。SAAVidentifier提供了包含549,033个SAAVs的42,134个蛋白质亚型的参考数据库。SAAVannotator提供了24种信息,属于4个类别:i)基因组变异,ii)基因/转录本/蛋白,iii)生物学和iv)临床信息。它为解释特定条件下的SAAV提供了功能注释。SNV/SAAVretriever模块支持在相关条件特异性SAAVs和nsSNVs之间双向导航,具有多种基因组和蛋白组数据。最后,SAAVvisualizer根据检测到的SAAVs的功能信息提供了各种统计图。

SAAVpedia中包括三个数据库:SAAV序列数据库(SAAV Sequence Database)、SAAV参考数据库(SAAV Reference Database)以及功能信息数据库(Functional Information Database)。其中,序列数据库中包括来自neXtProt和GENCODE中所有含有变异肽段的蛋白质序列;参考数据库中包括neXtProt中全部SAAV的基因组和蛋白质组变异信息,基因组变异信息包括基因位置和来自dbSNP或COSMIC的基因组参考序列和改变的核苷酸序列,蛋白质组变异信息包括变异发生的位置,蛋白质参考序列和改变的氨基酸序列以及来自neXtProt的胰蛋白酶酶解肽段序列;功能信息数据库包括生物、临床、药理等信息。

图1. SAAVpedia平台的原理图模块。

该平台支持从蛋白质组和基因组数据中识别、注释和检索致病SAAVs。SAAVidentifier对SAAVs进行识别和质量评估。SAAVannotator通过对生物学、临床和药理信息进行注释,以解释SAAVidentifier已识别的SAAVs的功能。SNV/SAAVretriever模块自动构建具有基因组和蛋白质组变体列表的查询。它还可以双向导航相关条件特异性SAAVs和nsSNVs,具有多种表型的基因组和蛋白质组数据。SAAVvisualizer提供五类分析结果的图形可视化。除SAAVvisualizer模块外,所有模块都实现为Web应用程序、Python包和REST API。

利用CPTAC(Clinical Proteomic Tumor Analysis Consortium)乳腺癌研究中的925个LC-MS/MS数据以及Synapse中恶性胶质瘤样本的40个LC-MS/MS数据进行测试:

表1. CPTAC和NextPP搜索结果中乳腺癌和胶质母细胞瘤样本中鉴定到的SAAVs。

图2. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现乳腺癌相关的新基因和致病的SAAV候选。PPI网络由乳腺癌相关基因和SAAVs基因组成。

在8,377个基因中对82,611个乳腺癌SAAVs进行鉴定、注释以及蛋白互作分析(PPI),最终构建的PPI网络由1326个基因节点(红色节点黄色文本)和1087个一级edge构成(A)。其中共有298个基因与BRCA1、TP53、BRCA2、ERBB2、ESR1、ESR2等乳腺癌相关基因有基本联系(B, C)。

图3. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现胶质母细胞瘤相关的新基因和致病的SAAV候选。PPI网络由胶质母细胞瘤相关基因和SAAVs基因组成。共有12个基因与胶质母细胞瘤驱动基因(红)相关。节点测试颜色为紫色,表示SAAV数量为1。

 

五、文章亮点(结论讨论):

SAAVpedia可以从大规模和高通量的基因组和蛋白质组数据中鉴定、注释和检索致病性SAAVs。SAAVpedia中灵活的蛋白质基因组解释流程可以帮助描述和定位实际条件特异性的致病SAAVs,而这些是不能通过比较和分析基因组和蛋白质组数据来预测的。SAAVpedia基于功能多样的生物医学知识数据库提供了足够的信息,但是由于所访问的知识库本身信息不足,一些查询并没有返回结果。通过使用知识数据库对功能信息数据库进行一致的扩展,可以解决这一问题。通过把SAAV数据库从各种蛋白质组数据扩展到进一步的生物医学研究,SAAVpedia能够在基于大量蛋白质基因组数据的致病生物标志物发现中发挥重要的作用。

阅读人:徐洪凯

原文链接:https://pubs.acs.org/doi/10.1021/acs.jproteome.9b00366

DOI10.1021/acs.jproteome.9b00366

Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)的更多相关文章

  1. Journal of Proteome Research | Improving Silkworm Genome Annotation Using a Proteogenomics Approach (分享人:张霞)

    题目:Improving Silkworm Genome Annotation Using a Proteogenomics Approach 期刊:Journal of Proteome Resea ...

  2. Journal of Proteome Research | Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizobium favelukesii)的蛋白质组学分析)(解读人:丑天胜)

    文献名:Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizo ...

  3. Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)

    文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...

  4. Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)

    文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...

  5. Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)

    文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Vi ...

  6. Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)

    文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...

  7. Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)

    期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...

  8. Journal of Proteome Research | Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio) (解读人:关姣)

    文献名:Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio)(斑马鱼赖氨酸琥珀酰化的全球蛋白质组学分 ...

  9. Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)

    文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...

随机推荐

  1. Replace into 与Insert into on duplicate key update的区别

    前提条件:除非表有一个PRIMARY KEY或UNIQUE索引,否则,使用这2条语句没有意义.该语句会与INSERT相同 1. Replace into (1)   添加相同的主键 操作前       ...

  2. upper_bound()函数使用方法

    upper_bound( begin,end,num):从数组的begin位置到end-1位置二分查找第一个大于num的数字,找到返回该数字的地址,不存在则返回end.通过返回的地址减去起始地址beg ...

  3. Word目录生成

    之所以写这篇文章,是因为每次写报告都需要生成相应目录,但常常只记得个大概,最终还得要重新百度,十分头疼,故在此记录一下. 大概分为3个步骤 步骤1 设置标题级数 进入大纲模式 选择相应级数,这里选的是 ...

  4. 在腾讯云服务器上安装JDK+Tomcat并启动tomcat

    由于Java web项目需要使用到tomcat所以决定在腾讯云服务器(centos7.X)上安装JDK和tomcat,来部署我们的项目. 准备工具: 云服务器:centos7.x+ 本地连接服务器:X ...

  5. process.env

    官方: process.env属性返回一个包含用户环境信息的对象.

  6. JAVA学习大纲

    1.第一节 JAVA概念与JDK的安装 (1)JDK的安装和环境变量的设置: (2)相关基本概念:JDK.SDK.JRE.JVM.J2SE.J2EE.J2ME.java API.JAVA语言特点: ( ...

  7. 【Eclipse】eclipse设置,为了更简单快捷的开发

    保存时自动导包 Windows->Perferences->Java->Editor->Save Actions

  8. iNeuOS工业互联平台,.NETCore开发的视频服务组件iNeuVideo,RTSP转WebSocket

    目       录 1.      概述... 2 2.      将来集成到iNeuOS平台演示... 3 3.      iNeuVideo结构... 3 4.      iNeuVideo部署及 ...

  9. IDEA打包web项目为war,通过本地Tomcat启动war

    1.打包 ①idea的打包很简单,网上教程也很多,简单说下:project struct-->artifact-->+-->Web Application:Archive--> ...

  10. 震惊,当我运行了这条Linux命令后,服务器竟然... (Linux中的删除命令)

    震惊,当我运行了这条Linux命令后,服务器竟然... 0X00 写在前面 大家都听说过删库命令rm -rf /*,但是谁又真正实践过呢?但作为一个程序员,不看看这条命令执行后会发生什么,怎么能甘心呢 ...