Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)
文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation(SAAVpedia:蛋白质基因组解释的单氨基酸突变的识别、功能注释和检索)
期刊名:Journal of Proteome Research
发表时间:2019年10月
IF:3.78
单位:
- 韩国基础科学研究所,生物融合分析研究中心
- 韩国化学技术研究所,药物信息平台中心
- 韩国大田忠南国立大学,分析科学与技术研究所
物种:人
技术:蛋白基因组学,SAAVpedia
一、 概述:
新一代的基因组测序技术使得许多疾病或药物反应相关的非同义单核苷酸变异(Nonsynonymous Single Nucleotide Variants, nsSNVs)的发现成为可能,这些变异改变了蛋白质的氨基酸序列。目前已有研究试图描述致病的nsSNVs,但很少有研究在蛋白质水平上被确认为单氨基酸变异(Single Amino Acid Variants, SAAVs)。本研究开发了由四个模块(SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer)组成的SAAVpedia平台,从蛋白质组和基因组数据中识别、注释和检索致病的SAAV候选。SAAVpedia在乳腺癌和恶性胶质瘤数据分析中的应用说明其在确认基因组变体是否存在于氨基酸序列中是一个比较合适的工具。
二、 研究背景:
得益于二代测序技术,大量的可能会引起蛋白功能变化的nsSNVs被鉴定到,目前已经有了许多对其致病机理和分子机制进行预测、解释的研究,但这些方法在不同数据集之间无法充分的复现。在一些研究中,结合蛋白质组数据在蛋白质水平上鉴定到的来自nsSNVs的变异,可能在实际的疾病发生过程中扮演重要的角色。但是由于没有开发出有关鉴定SAAV的综合蛋白基因组学分析平台,目前只有很少一部分SAAV能够与疾病相关的基因组数据和功能联系起来,大多数SAAV的生物、临床和药理功能仍然是未知的,进一步确认致病的SAAV是极其困难的。
三、 实验设计:
四、研究成果:
SAAVpedia是一个从蛋白质组和基因组数据中识别、注释和检索致病SAAV候选体的平台。该平台由四个模块组成:SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer。SAAVidentifier提供了包含549,033个SAAVs的42,134个蛋白质亚型的参考数据库。SAAVannotator提供了24种信息,属于4个类别:i)基因组变异,ii)基因/转录本/蛋白,iii)生物学和iv)临床信息。它为解释特定条件下的SAAV提供了功能注释。SNV/SAAVretriever模块支持在相关条件特异性SAAVs和nsSNVs之间双向导航,具有多种基因组和蛋白组数据。最后,SAAVvisualizer根据检测到的SAAVs的功能信息提供了各种统计图。
SAAVpedia中包括三个数据库:SAAV序列数据库(SAAV Sequence Database)、SAAV参考数据库(SAAV Reference Database)以及功能信息数据库(Functional Information Database)。其中,序列数据库中包括来自neXtProt和GENCODE中所有含有变异肽段的蛋白质序列;参考数据库中包括neXtProt中全部SAAV的基因组和蛋白质组变异信息,基因组变异信息包括基因位置和来自dbSNP或COSMIC的基因组参考序列和改变的核苷酸序列,蛋白质组变异信息包括变异发生的位置,蛋白质参考序列和改变的氨基酸序列以及来自neXtProt的胰蛋白酶酶解肽段序列;功能信息数据库包括生物、临床、药理等信息。
图1. SAAVpedia平台的原理图模块。
该平台支持从蛋白质组和基因组数据中识别、注释和检索致病SAAVs。SAAVidentifier对SAAVs进行识别和质量评估。SAAVannotator通过对生物学、临床和药理信息进行注释,以解释SAAVidentifier已识别的SAAVs的功能。SNV/SAAVretriever模块自动构建具有基因组和蛋白质组变体列表的查询。它还可以双向导航相关条件特异性SAAVs和nsSNVs,具有多种表型的基因组和蛋白质组数据。SAAVvisualizer提供五类分析结果的图形可视化。除SAAVvisualizer模块外,所有模块都实现为Web应用程序、Python包和REST API。
利用CPTAC(Clinical Proteomic Tumor Analysis Consortium)乳腺癌研究中的925个LC-MS/MS数据以及Synapse中恶性胶质瘤样本的40个LC-MS/MS数据进行测试:
表1. CPTAC和NextPP搜索结果中乳腺癌和胶质母细胞瘤样本中鉴定到的SAAVs。
图2. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现乳腺癌相关的新基因和致病的SAAV候选。PPI网络由乳腺癌相关基因和SAAVs基因组成。
在8,377个基因中对82,611个乳腺癌SAAVs进行鉴定、注释以及蛋白互作分析(PPI),最终构建的PPI网络由1326个基因节点(红色节点黄色文本)和1087个一级edge构成(A)。其中共有298个基因与BRCA1、TP53、BRCA2、ERBB2、ESR1、ESR2等乳腺癌相关基因有基本联系(B, C)。
图3. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现胶质母细胞瘤相关的新基因和致病的SAAV候选。PPI网络由胶质母细胞瘤相关基因和SAAVs基因组成。共有12个基因与胶质母细胞瘤驱动基因(红)相关。节点测试颜色为紫色,表示SAAV数量为1。
五、文章亮点(结论讨论):
SAAVpedia可以从大规模和高通量的基因组和蛋白质组数据中鉴定、注释和检索致病性SAAVs。SAAVpedia中灵活的蛋白质基因组解释流程可以帮助描述和定位实际条件特异性的致病SAAVs,而这些是不能通过比较和分析基因组和蛋白质组数据来预测的。SAAVpedia基于功能多样的生物医学知识数据库提供了足够的信息,但是由于所访问的知识库本身信息不足,一些查询并没有返回结果。通过使用知识数据库对功能信息数据库进行一致的扩展,可以解决这一问题。通过把SAAV数据库从各种蛋白质组数据扩展到进一步的生物医学研究,SAAVpedia能够在基于大量蛋白质基因组数据的致病生物标志物发现中发挥重要的作用。
阅读人:徐洪凯
原文链接:https://pubs.acs.org/doi/10.1021/acs.jproteome.9b00366
DOI:10.1021/acs.jproteome.9b00366
Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)的更多相关文章
- Journal of Proteome Research | Improving Silkworm Genome Annotation Using a Proteogenomics Approach (分享人:张霞)
题目:Improving Silkworm Genome Annotation Using a Proteogenomics Approach 期刊:Journal of Proteome Resea ...
- Journal of Proteome Research | Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizobium favelukesii)的蛋白质组学分析)(解读人:丑天胜)
文献名:Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizo ...
- Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)
文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...
- Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)
文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...
- Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)
文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Vi ...
- Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)
文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...
- Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)
期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...
- Journal of Proteome Research | Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio) (解读人:关姣)
文献名:Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio)(斑马鱼赖氨酸琥珀酰化的全球蛋白质组学分 ...
- Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)
文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...
随机推荐
- ES7中的async和await
ES7中的async和await 在上一章中,使用Promise将原本的回调方式转换为链式操作,这就将一个个异步执行的操作串在一条同步线上了.下一次的操作必须等待当前操作的结束. 使用Promise的 ...
- nodejs+vue.js+webpack
前端: nodejs+vue.js+webpack 后台:ssb(Spring+SpringMVC + mybatis-plus) 开发工具:idea 一.前提 1.安装nodejs 2.安装完nod ...
- js 网页运行原理
当我们打开一个网页的时候,浏览器会首先创建一个窗口,这个窗口就是我所知道的window对象,也就是整个Javascript运行所依附的全局变量. 为了加载网页文档,当前窗口又需要创建一个Documen ...
- webdriver访问各个浏览器驱动下载及安装
这里首先需要查看一下自己安装的selenium版本 查看步骤: windows系统打开cmd命令行输入:pip show selenium查看结果如下: 进入到selenium官网查看版本信息 sel ...
- JDK1.8新特性Lambda表达式
/** * Lambda * @date 2019/8/2 10:03 */ public class Lamda { public static void main(String[] args){ ...
- Lego:美团点评接口自动化测试实践
概述 接口自动化概述 众所周知,接口自动化测试有着如下特点: 低投入,高产出. 比较容易实现自动化. 和UI自动化测试相比更加稳定. 如何做好一个接口自动化测试项目呢? 我认为,一个“好的”自动化 ...
- AI在自动化测试领域的应用
阿里QA导读:最近一两年随着深入学习技术浪潮的诞生,智能化测试迎来了新的发展,而AI也会引领下一代测试的新航向.Testin云测CTO陈冠诚先生的分享让我们看到AI在移动自动化测试领域里面的创新机会点 ...
- centos上安装python环境
1.安装python-pip 首先安装epel扩展源: yum -y install epel-release 更新完成之后,安装pip: yum -y install python- ...
- ARTS 第 1 周
每周一道算法.点评一篇英文技术文章.学习一个技术技巧.分享一个技术观点和思路 Algorithm 题目:两数和 给定一个整数数组,返回这两个数字的索引,使它们相加为一个指定的数. 因为是返回两个数字的 ...
- Picaso完美兼容OkHttp3.3,缓存优化两不误 - Tamic Developer"s Blog
为何在Fresco,Glide这么强大的背景下,我又想起了当初的Picasso,又为何写这篇文章?是因为最近项目采用了square公司的RxAndroid,Retrfit和OKhttp, 不得不联想到 ...