【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法
代谢是生命体内化学反应的总称,其所包含的代谢物变化规律可直接反映生命体的健康状态。非靶向代谢组学(untargeted metabolomics)可以在系统水平测量生命体内生理或病理状态下所有代谢物的含量变化,为研究其生物学机理提供依据。液相色谱-质谱联用(LC-MS)技术是代谢组学研究的主要工具之一。为了能够将采集的质谱数据信息转变为有效的生物学信息,首先就必须对代谢峰进行代谢物的结构鉴定。然而,到目前为止,在基于 LC-MS 的非靶向代谢组学中,大规模的代谢物结构鉴定仍然是一项非常具有挑战性的任务,也是代谢组学发展和应用的最大瓶颈之一。
目前最为广泛采用的代谢物结构鉴定策略是将二级质谱图(MS2谱图)与代谢物标准谱图库进行匹配进行代谢物鉴定。然而,此法严重受限于标准二级谱图的数目和覆盖度。目前标准二级质谱图库的扩充十分困难,因为小分子代谢物的标准MS2谱图必须通过采集代谢物标准品获取,但是目前大量代谢物没有标准品。此外,到目前为止还没有一个谱图库建立的标准流程,导致不同实验室和不同仪器采集的谱图互有差异。最近,也有研究者进行理论MS2谱图的预测,然而其精确度仍需提高。同时也有研究者开始利用代谢通路来进行代谢物的鉴定,如Mummichog和PIUMet。然而这些算法都基于差异代谢物富集在特定代谢通路或者代谢网络上的假设,只能鉴定差异表达的代谢特征峰,且准确度有待提高。
2019年4月3日,国际知名学术期刊《Nature Communications》杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics(https://www.nature.com/articles/s41467-019-09550-x)。在该论文中,研究人员开发了一种基于代谢反应网络的全新代谢物结构鉴定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在细胞代谢中,一个代谢物可以通过酶催化反应转变为另外一种代谢物。处在同一个代谢反应中且结构类似的两个代谢物可定义为一个反应对(reaction pair,RP)和反应对邻近代谢物(reaction-paired neighbor metabolite)。代谢物的二级质谱图依赖于其化学结构。因此,处于同一反应对的两个代谢物由于其类似的结构,其二级谱图也会有一定的相似性。基于该原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定其在代谢网络中邻近的代谢物。此原理可以迭代应用在新的鉴定出来的代谢物上,从而使MetDNA可以沿着代谢反应网络进行代谢物的循环鉴定和递归运算,直到不再能够鉴定出新的邻近代谢物,大大扩展了鉴定到的代谢物的数目。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。
研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2,000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。为了方便研究人员使用MetDNA,朱正江研究员课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台(http://metdna.zhulab.cn/)。MetDNA是一个基于网页版的软件,主页如图所示。用户需要注册登录才能使用。学术用途可以免费使用,商业用途需要联系朱正江研究员(jiangzhu@sioc.ac.cn)进行商业化授权。详细的使用方法可以查看MetDNA帮助文档(http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo数据(http://metdna.zhulab.cn/metdna/DemoDataset),供用户下载和测试。
MetDNA相关链接
- 在线网站:http://metdna.zhulab.cn/
- 原文:https://www.nature.com/articles/s41467-019-09550-x
- GitHub:https://github.com/ZhuMSLab/MetDNA
【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法的更多相关文章
- 基于LeNet网络的中文验证码识别
基于LeNet网络的中文验证码识别 由于公司需要进行了中文验证码的图片识别开发,最近一段时间刚忙完上线,好不容易闲下来就继上篇<基于Windows10 x64+visual Studio2013 ...
- 基于opencv网络摄像头在ubuntu下的视频获取
基于opencv网络摄像头在ubuntu下的视频获取 1 工具 原料 平台 :UBUNTU12.04 安装库 Opencv-2.3 2 安装编译运行步骤 安装编译opencv-2.3 参 ...
- 基于ffmpeg网络播放器的教程与总结
基于ffmpeg网络播放器的教程与总结 一. 概述 为了解决在线无广告播放youku网上的视频.(youku把每个视频切换成若干个小视频). 视频资源解析可以从www.flvcd. ...
- 基于UML网络教学管理平台模型的搭建
一.基本信息 标题:基于UML网络教学管理平台模型的搭建 时间:2013 出版源:网络安全技术与应用 领域分类:UML:网络教学管理平台:模型 二.研究背景 问题定义:网络教学管理平台模型的搭建 难点 ...
- 基于Socket网络编程
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/a2011480169/article/details/73602708 博客核心内容: 1.Sock ...
- 基于CNN网络的汉字图像字体识别及其原理
现代办公要将纸质文档转换为电子文档的需求越来越多,目前针对这种应用场景的系统为OCR系统,也就是光学字符识别系统,例如对于古老出版物的数字化.但是目前OCR系统主要针对文字的识别上,对于出版物的版面以 ...
- Raknet是一个基于UDP网络传输协议的C++网络库(还有一些其它库,比如nanomsg,fastsocket等等)
Raknet是一个基于UDP网络传输协议的C++网络库,允许程序员在他们自己的程序中实现高效的网络传输服务.通常情况下用于游戏,但也可以用于其它项目. Raknet有以下好处: 高性能 在同一台计算机 ...
- 基于SDN网络的负载均衡研究与实现
为什么需要软件定义网络 1.网络缺乏可扩展性,创新正在停滞不前. 我们最新的研究发现,几乎每两个组织中就有一个认为需要将网络功能扩展为采用SDN的主要业务触发因素,而不是其他催化剂.这一统计数据一 ...
- NASH:基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
随机推荐
- activiti会签 多实例例子
在实际的业务中,可能存在存在这么一种情况,当流程运行到某一个环节时,可能需要同时多个人的参与,才可以完成此环节.此时就可以用到activiti的多实例来解决此问题. 一.将一个节点设置成多实例的方法: ...
- Noip模拟43 2021.8.18
T1 地一体 可以树形$dp$,但考场没写出来,只打了没正确性的贪心水了$30$ 然后讲题的时候B哥讲了如何正确的贪心,喜出望外的学习了一下 不难发现 每次士兵都会直接冲到叶子节点 从深的点再返回到另 ...
- 2021.8.13考试总结[NOIP模拟38]
T1 a 入阵曲.枚举矩形上下界,之后从左到右扫一遍.用树状数组维护前缀和加特判可以$A$,更保险要脸的做法是双指针扫,因为前缀和单调不减. $code:$ 1 #include<bits/st ...
- Machine learning(1-Introduction)
1.What is machine learning Field of study that gives computers the ability to learn without being ex ...
- C#笔记2__Char类、String类、StringBuilder类 / 正则表达式 /
Char类 String类 字符串的格式化:String类的Format方法 StringBuilder类 以上:百度 or 查手册.....
- pycharm软件安装和破解
pycharm安装 1. 进入pycharm的官网 --- 下载专业版的pycharm 2. 双击下载好的软件,下一步 3. 选择需要安装软件的路径 --- 注意: 尽量不要将软件装在C盘里 4. 默 ...
- ELK 脚本自动化删除索引
kibana有自带接口,可通过自带的API接口 通过传参来达到删除索引的目的. # 删除15天前的索引 curl -XDELETE "http://10.228.81.161:9201/pa ...
- 如何选择普通索引和唯一索引《死磕MySQL系列 五》
系列文章 一.原来一条select语句在MySQL是这样执行的<死磕MySQL系列 一> 二.一生挚友redo log.binlog<死磕MySQL系列 二> 三.MySQL强 ...
- MySql各种文件及参数
MySql各种文件及参数 参数文件 MySql实例启动时,数据库会去读一个配置参数文件,用来寻找数据库的各种文件所在位置以及指定某些初始化参数,这些参数通常定义了内存结构有多大等信息. 数据库的参数可 ...
- 如何系统学习C 语言(中)之 指针篇
谈到指针,我们可能会想到钟表上的指针,但这里的指针不是现实生活中看得见摸得着的钟表上的指针,c 语言中的指针只存在于逻辑思维中,物理上并不存在. 同时,指针也是C 语言中最精华的部分,通过灵活地运用指 ...