【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法
代谢是生命体内化学反应的总称,其所包含的代谢物变化规律可直接反映生命体的健康状态。非靶向代谢组学(untargeted metabolomics)可以在系统水平测量生命体内生理或病理状态下所有代谢物的含量变化,为研究其生物学机理提供依据。液相色谱-质谱联用(LC-MS)技术是代谢组学研究的主要工具之一。为了能够将采集的质谱数据信息转变为有效的生物学信息,首先就必须对代谢峰进行代谢物的结构鉴定。然而,到目前为止,在基于 LC-MS 的非靶向代谢组学中,大规模的代谢物结构鉴定仍然是一项非常具有挑战性的任务,也是代谢组学发展和应用的最大瓶颈之一。
目前最为广泛采用的代谢物结构鉴定策略是将二级质谱图(MS2谱图)与代谢物标准谱图库进行匹配进行代谢物鉴定。然而,此法严重受限于标准二级谱图的数目和覆盖度。目前标准二级质谱图库的扩充十分困难,因为小分子代谢物的标准MS2谱图必须通过采集代谢物标准品获取,但是目前大量代谢物没有标准品。此外,到目前为止还没有一个谱图库建立的标准流程,导致不同实验室和不同仪器采集的谱图互有差异。最近,也有研究者进行理论MS2谱图的预测,然而其精确度仍需提高。同时也有研究者开始利用代谢通路来进行代谢物的鉴定,如Mummichog和PIUMet。然而这些算法都基于差异代谢物富集在特定代谢通路或者代谢网络上的假设,只能鉴定差异表达的代谢特征峰,且准确度有待提高。
2019年4月3日,国际知名学术期刊《Nature Communications》杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics(https://www.nature.com/articles/s41467-019-09550-x)。在该论文中,研究人员开发了一种基于代谢反应网络的全新代谢物结构鉴定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在细胞代谢中,一个代谢物可以通过酶催化反应转变为另外一种代谢物。处在同一个代谢反应中且结构类似的两个代谢物可定义为一个反应对(reaction pair,RP)和反应对邻近代谢物(reaction-paired neighbor metabolite)。代谢物的二级质谱图依赖于其化学结构。因此,处于同一反应对的两个代谢物由于其类似的结构,其二级谱图也会有一定的相似性。基于该原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定其在代谢网络中邻近的代谢物。此原理可以迭代应用在新的鉴定出来的代谢物上,从而使MetDNA可以沿着代谢反应网络进行代谢物的循环鉴定和递归运算,直到不再能够鉴定出新的邻近代谢物,大大扩展了鉴定到的代谢物的数目。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。
研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2,000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。为了方便研究人员使用MetDNA,朱正江研究员课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台(http://metdna.zhulab.cn/)。MetDNA是一个基于网页版的软件,主页如图所示。用户需要注册登录才能使用。学术用途可以免费使用,商业用途需要联系朱正江研究员(jiangzhu@sioc.ac.cn)进行商业化授权。详细的使用方法可以查看MetDNA帮助文档(http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo数据(http://metdna.zhulab.cn/metdna/DemoDataset),供用户下载和测试。
MetDNA相关链接
- 在线网站:http://metdna.zhulab.cn/
- 原文:https://www.nature.com/articles/s41467-019-09550-x
- GitHub:https://github.com/ZhuMSLab/MetDNA
【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法的更多相关文章
- 基于LeNet网络的中文验证码识别
基于LeNet网络的中文验证码识别 由于公司需要进行了中文验证码的图片识别开发,最近一段时间刚忙完上线,好不容易闲下来就继上篇<基于Windows10 x64+visual Studio2013 ...
- 基于opencv网络摄像头在ubuntu下的视频获取
基于opencv网络摄像头在ubuntu下的视频获取 1 工具 原料 平台 :UBUNTU12.04 安装库 Opencv-2.3 2 安装编译运行步骤 安装编译opencv-2.3 参 ...
- 基于ffmpeg网络播放器的教程与总结
基于ffmpeg网络播放器的教程与总结 一. 概述 为了解决在线无广告播放youku网上的视频.(youku把每个视频切换成若干个小视频). 视频资源解析可以从www.flvcd. ...
- 基于UML网络教学管理平台模型的搭建
一.基本信息 标题:基于UML网络教学管理平台模型的搭建 时间:2013 出版源:网络安全技术与应用 领域分类:UML:网络教学管理平台:模型 二.研究背景 问题定义:网络教学管理平台模型的搭建 难点 ...
- 基于Socket网络编程
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/a2011480169/article/details/73602708 博客核心内容: 1.Sock ...
- 基于CNN网络的汉字图像字体识别及其原理
现代办公要将纸质文档转换为电子文档的需求越来越多,目前针对这种应用场景的系统为OCR系统,也就是光学字符识别系统,例如对于古老出版物的数字化.但是目前OCR系统主要针对文字的识别上,对于出版物的版面以 ...
- Raknet是一个基于UDP网络传输协议的C++网络库(还有一些其它库,比如nanomsg,fastsocket等等)
Raknet是一个基于UDP网络传输协议的C++网络库,允许程序员在他们自己的程序中实现高效的网络传输服务.通常情况下用于游戏,但也可以用于其它项目. Raknet有以下好处: 高性能 在同一台计算机 ...
- 基于SDN网络的负载均衡研究与实现
为什么需要软件定义网络 1.网络缺乏可扩展性,创新正在停滞不前. 我们最新的研究发现,几乎每两个组织中就有一个认为需要将网络功能扩展为采用SDN的主要业务触发因素,而不是其他催化剂.这一统计数据一 ...
- NASH:基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
随机推荐
- 好好编程BUAA_SE(组/团队) Scrum Meeting 博客汇总
好好编程BUAA_SE(组/团队) Scrum Meeting 博客汇总 一.Scrum Meeting 1. Alpha Alpha阶段 第一次Scrum Meeting Alpha阶段 第二次Sc ...
- Noip模拟21(持续翻车)2021.7.20
读题总是读错是不是没救了... T1 Median 中位数:按顺序排列的一组数据中居于中间位置的数. 能用上的高亮符号都用上了... 当时忘了就离谱.... 理解什么是中位数(真是个憨憨)后就可以开始 ...
- Linux入门需要搞清楚的思路问题
很多同学接触linux不多,对linux平台的开发更是一无所知. 而现在的趋势越来越表明,作为一个优秀的软件开发人员,或计算机it行业从业人员,="" 掌握linux是一种很重要的 ...
- 21.6.29 test
\(NOI\) 模拟赛 \(T1\) 正解是个题解难以理解的数论,结果是组合数相加.暴力分拿满了,尝试打了 \(20*20\) 的表,最后大概打出了个三角形的表,并且帮我找到了一些性质.\(45\)p ...
- linux命令中find, which、whereis、locate,有什么区别?
whatis 用于查询一个命令执行什么功能,并将查询结果打印到终端上 which 查看可执行文件的位置 whereis 查看文件的位置 man Linux提供了丰富的帮助手册,当你需要查看某个命令的参 ...
- 像素设定 牛客网 程序员面试金典 C++ Python
像素设定 牛客网 程序员面试金典 题目描述 有一个单色屏幕储存在一维数组中,其中数组的每个元素代表连续的8位的像素的值,请实现一个函数,将第x到第y个像素涂上颜色(像素标号从零开始),并尝试尽量使用最 ...
- hdu 2176 取(m堆)石子游戏 (裸Nim)
题意: m堆石头,每堆石头个数:a[1]....a[m]. 每次只能在一堆里取,至少取一个. 最后没石子取者负. 先取者负输出NO,先取胜胜输出YES,然后输出先取者第1次取子的所有方法.如果从有a个 ...
- systemd-nspawn以及container的学习
container的分类 目前container可以分为两大类,一类是Privileged container,一类是Unprivileged container. Privileged contai ...
- 第2章-7 产生每位数字相同的n位数 (30分)
第2章-7 产生每位数字相同的n位数 (30分) 读入2个正整数A和B,1<=A<=9, 1<=B<=10,产生数字AA-A,一共B个A 输入格式: 在一行中输入A和B. 输出 ...
- 多层pcb线路板的制作流程
PCB制作第一步是整理并检查pcb多层线路板布局(Layout).电路板制作工厂收到PCB设计公司的CAD文件,由于每个CAD软件都有自己独特的文件格式,所以深圳PCB板厂会转化为一个统一的格式Ger ...