【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法
代谢是生命体内化学反应的总称,其所包含的代谢物变化规律可直接反映生命体的健康状态。非靶向代谢组学(untargeted metabolomics)可以在系统水平测量生命体内生理或病理状态下所有代谢物的含量变化,为研究其生物学机理提供依据。液相色谱-质谱联用(LC-MS)技术是代谢组学研究的主要工具之一。为了能够将采集的质谱数据信息转变为有效的生物学信息,首先就必须对代谢峰进行代谢物的结构鉴定。然而,到目前为止,在基于 LC-MS 的非靶向代谢组学中,大规模的代谢物结构鉴定仍然是一项非常具有挑战性的任务,也是代谢组学发展和应用的最大瓶颈之一。
目前最为广泛采用的代谢物结构鉴定策略是将二级质谱图(MS2谱图)与代谢物标准谱图库进行匹配进行代谢物鉴定。然而,此法严重受限于标准二级谱图的数目和覆盖度。目前标准二级质谱图库的扩充十分困难,因为小分子代谢物的标准MS2谱图必须通过采集代谢物标准品获取,但是目前大量代谢物没有标准品。此外,到目前为止还没有一个谱图库建立的标准流程,导致不同实验室和不同仪器采集的谱图互有差异。最近,也有研究者进行理论MS2谱图的预测,然而其精确度仍需提高。同时也有研究者开始利用代谢通路来进行代谢物的鉴定,如Mummichog和PIUMet。然而这些算法都基于差异代谢物富集在特定代谢通路或者代谢网络上的假设,只能鉴定差异表达的代谢特征峰,且准确度有待提高。
2019年4月3日,国际知名学术期刊《Nature Communications》杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics(https://www.nature.com/articles/s41467-019-09550-x)。在该论文中,研究人员开发了一种基于代谢反应网络的全新代谢物结构鉴定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在细胞代谢中,一个代谢物可以通过酶催化反应转变为另外一种代谢物。处在同一个代谢反应中且结构类似的两个代谢物可定义为一个反应对(reaction pair,RP)和反应对邻近代谢物(reaction-paired neighbor metabolite)。代谢物的二级质谱图依赖于其化学结构。因此,处于同一反应对的两个代谢物由于其类似的结构,其二级谱图也会有一定的相似性。基于该原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定其在代谢网络中邻近的代谢物。此原理可以迭代应用在新的鉴定出来的代谢物上,从而使MetDNA可以沿着代谢反应网络进行代谢物的循环鉴定和递归运算,直到不再能够鉴定出新的邻近代谢物,大大扩展了鉴定到的代谢物的数目。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。
研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2,000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。为了方便研究人员使用MetDNA,朱正江研究员课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台(http://metdna.zhulab.cn/)。MetDNA是一个基于网页版的软件,主页如图所示。用户需要注册登录才能使用。学术用途可以免费使用,商业用途需要联系朱正江研究员(jiangzhu@sioc.ac.cn)进行商业化授权。详细的使用方法可以查看MetDNA帮助文档(http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo数据(http://metdna.zhulab.cn/metdna/DemoDataset),供用户下载和测试。
MetDNA相关链接
- 在线网站:http://metdna.zhulab.cn/
- 原文:https://www.nature.com/articles/s41467-019-09550-x
- GitHub:https://github.com/ZhuMSLab/MetDNA
【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法的更多相关文章
- 基于LeNet网络的中文验证码识别
基于LeNet网络的中文验证码识别 由于公司需要进行了中文验证码的图片识别开发,最近一段时间刚忙完上线,好不容易闲下来就继上篇<基于Windows10 x64+visual Studio2013 ...
- 基于opencv网络摄像头在ubuntu下的视频获取
基于opencv网络摄像头在ubuntu下的视频获取 1 工具 原料 平台 :UBUNTU12.04 安装库 Opencv-2.3 2 安装编译运行步骤 安装编译opencv-2.3 参 ...
- 基于ffmpeg网络播放器的教程与总结
基于ffmpeg网络播放器的教程与总结 一. 概述 为了解决在线无广告播放youku网上的视频.(youku把每个视频切换成若干个小视频). 视频资源解析可以从www.flvcd. ...
- 基于UML网络教学管理平台模型的搭建
一.基本信息 标题:基于UML网络教学管理平台模型的搭建 时间:2013 出版源:网络安全技术与应用 领域分类:UML:网络教学管理平台:模型 二.研究背景 问题定义:网络教学管理平台模型的搭建 难点 ...
- 基于Socket网络编程
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/a2011480169/article/details/73602708 博客核心内容: 1.Sock ...
- 基于CNN网络的汉字图像字体识别及其原理
现代办公要将纸质文档转换为电子文档的需求越来越多,目前针对这种应用场景的系统为OCR系统,也就是光学字符识别系统,例如对于古老出版物的数字化.但是目前OCR系统主要针对文字的识别上,对于出版物的版面以 ...
- Raknet是一个基于UDP网络传输协议的C++网络库(还有一些其它库,比如nanomsg,fastsocket等等)
Raknet是一个基于UDP网络传输协议的C++网络库,允许程序员在他们自己的程序中实现高效的网络传输服务.通常情况下用于游戏,但也可以用于其它项目. Raknet有以下好处: 高性能 在同一台计算机 ...
- 基于SDN网络的负载均衡研究与实现
为什么需要软件定义网络 1.网络缺乏可扩展性,创新正在停滞不前. 我们最新的研究发现,几乎每两个组织中就有一个认为需要将网络功能扩展为采用SDN的主要业务触发因素,而不是其他催化剂.这一统计数据一 ...
- NASH:基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
随机推荐
- HTML中的emment
emment的优点和使用方法: 优点:Emment是前端开发者必备的工具,使用它可以大大提高前端开发效率. 使用方法:Emment的使用方法非常简单,直接在编辑器上输入HTML和CSS代码的缩写,然后 ...
- Java:基本概念小记
Java:基本概念 一些基本 Java 概念,做一个小小小小的记录 面向对象&面向过程 面向对象思想就是在计算机程序设计过程中,参照现实中事物,将事物的属性特征.行为特征抽象出来,描述成计算机 ...
- 机器学习:SVM
SVM 前言:支持向量机(Support Vector Machine, SVM),作为最富盛名的机器学习算法之一,其本身是一个二元分类算法,为了更好的了解SVM,首先需要一些前提知识,例如:梯度下降 ...
- Linux基础是零基础必须要过的关,你懂了多少
#LINUX基础学习 ##命令行下的基础知识 Linux区分英文的大小写. date :查看时间 cal:查看日历 [Tab] 热键 :可以自动补全命令名和文件名 [Ctrl]+C 热键 :可以中断正 ...
- 算法:数字推盘游戏--重排九宫(8-puzzle)
一.数字推盘游戏 数字推盘游戏(n-puzzle)是一种最早的滑块类游戏,常见的类型有十五数字推盘游戏和八数字推盘游戏等.也有以图画代替数字的推盘游戏.可能Noyes Palmer Chapman在1 ...
- .NET 5 全自动分表组件,.NET 分表方案 ,分表架构与设计
一.疑问&目的 1.1 分表使用场景 (1)可扩展架构设计,比如一个ERP用5年不卡,到了10就卡了因为数据太多了,这个时候很多人都是备份然后清空数据,这个工作大并且麻烦,以前的数据很难在使用 ...
- palindrome-partitioning leetcode C++
Given a string s, partition s such that every substring of the partition is a palindrome. Return all ...
- 记一次 php-fpm 连接 nginx 的错误。
环境: docker 中 centos 镜像下 yum 安装的php,nginx. [root@lnmp1 /]# php -v PHP 7.2.11 (cli) (built: Oct 9 2018 ...
- Kioskcached(1)之 Memcached & Redis & Kioskcached 性能测试对比
前言:本文仅仅是作者自己在学习过程中的一次实验而已,或许因为各种因素会导致实验结果与你之前的认知不太一样,因此请你带着批判的眼光看待本文(本文不具有实际环境的参考性). 一:测试目的 在了解了一些No ...
- 学习JS的第四天
一.循环 1.循环嵌套 1.一个循环内包含完整的另一个循环语句. 2.被包含的循环语句叫内循环,包含别的循环的循环语句叫外循环. 3.外循环每执行一次循环,内循环都会完全执行所有循环次数. 4.循环嵌 ...