Mol Cell Proteomics. | MARMoSET – Extracting Publication-ready Mass Spectrometry Metadata from RAW Files
本文是马克思普朗克心肺研究所的三名研究者Marina Kiweler、Mario Looso和Johannes Graumann发表在8月刊的MCP的一篇文章。
由于Omics实验经常涉及数百个数据文件,元数据信息对于结果的评估和再现至关重要;然而数据通常以二进制或专有文件格式存在,元数据信息提取过程繁琐。以Thermo Fischer Scientific质谱仪生产的RAW文件为例,除了光谱数据之外,还包括了仪器设置,这都是实验评估和结果再现所必需的。目前提取RAW文件信息的方法是使用特定供应商的Xcalibur软件手动打开RAW文件并且复制所需信息,然而手动提取容易出错并且存在访问量过大的问题。迄今为止没有软件能够解决将大量RAW文件或其他元数据简化成具有共识参数的报告的问题。通过供应商提供的RAWFileReader应用程序的API接口,作者基于R的基础架构编写了一个工具,可以从元数据中提取并生成用于实验室质量控制的数据报告。

图1 MARMoSET处理过程概览
MARMoSET分为两部分,第一部分是C#应用程序,它的作用是从Thermo Fischer Scientific RAW文件中提取元数据信息为JSON文件。通过RAWFileReader API访问的RAW文件格式包含了多个层次的元数据信息。固定标题包括日期,原始文件名和样本信息等信息。标题后面是一个列表,其中包含使用的仪器模块以及它们各自的方法作为字符串。API还为检测器相关数据(如紫外分光光度法或质谱法)提供单独的入口点。MARMoSET目前仅实现对MS数据的访问。使用RAWFileReader API中的“IRAW DataPlus”接口,在使用EASY-nLC超高压液相色谱仪器(Thermo Fisher Scientific)的液相色谱/质谱(LC / MS)的背景下,LC参数可在方法串中获得,并由MARMoSET提取和分析。根据提供的是单个RAW文件还是文件目录的路径,MARMoSET可以判断作用于单个文件或迭代目录中的RAW文件集合,并根据计算机的硬件资源作并行化处理。在第一步中,分别从每个RAW文件收集信息。第二步,为了将来自多个文件的数据减少为描述整个集合的最小参数集,所得到的数据结构是在字典中评估和排序过后的哈希码。然后,此信息用于将RAW文件分类为可以共享所有相关参数的组。最后编写成可以连接到相应RAW文件名的JSON文件。为了方便直观地处理JSON文件中的结构化数据,作者又同时提供了一个名为MARMoSET的R包。它能够根据预先定义的日志文件创建表格,此外还支持通过单独选择参数来过滤数据。

图2 MARMoSET处理过程
在windows操作系统上,通过直接运行C#命令行工具,可以生成JSON文件,基于R包中自带的术语匹配表,使用函数“match_terms()”可以提取对应参数的子集并生成日志特定要求的表格,然后使用函数“save_all_groups”导出表格。元数据的标准化报告对于实验的评估和再现极为重要,MARMoSET工具套件的诞生填补了其空白,生成了面向机器可读的JSON文件和面向人类可读的txt或excel文件。
一方面解决了Omics实验高吞吐量元数据的处理问题,另一方面R包所提供的自定义参数设置可以灵活满足不同实验的要求,过滤不必要的信息。
MARMoSET C#应用程序:https://github.molgen.mpg.de/loosolab/MARMoSET_C
MARMoSET R包:https://github.molgen.mpg.de/loosolab/MARMoSET
解读人:马臻
文章引用:10.1074/mcp.TIR119.001505
文章连接:https://www.mcponline.org/content/18/8/1700
Mol Cell Proteomics. | MARMoSET – Extracting Publication-ready Mass Spectrometry Metadata from RAW Files的更多相关文章
- Mol Cell Proteomics. |胡丹丹| 雷公藤红素通过SIRT1-FXR 信号通路保护胆汁淤积性肝损伤
期刊:Mol Cell Proteomics 题目:Celastrol protects from cholestatic liver injury though modulation of SIRT ...
- Mol Cell Proteomics. | 粪便微生物蛋白质的组成与饮食诱导肥胖倾向的关联研究
题目:Associations of the Fecal Microbial Proteome Composition and Proneness to Diet-induced Obesity 期刊 ...
- Mol Cell Proteomics. | Elevated Hexokinase II Expression Confers Acquired Resistance to 4-Hydroxytamoxifen in Breast Cancer Cells(升高的己糖激酶II表达使得乳腺癌细胞获得对他莫昔芬的抗性)(解读人:黄旭蕾)
文献名:Elevated Hexokinase II Expression Confers Acquired Resistance to 4-Hydroxytamoxifen in Breast Ca ...
- Mol Cell Proteomics. | A Targeted Mass Spectrometry Strategy for Developing Proteomic Biomarkers: A Case Study of Epithelial Ovarian Cancer(利用靶向质谱策略进行上皮性卵巢癌病例的蛋白质组生物标志物研究) (解读人:王聚)
文献名:利用靶向质谱策略进行上皮性卵巢癌病例的蛋白质组生物标志物研究 期刊名:Molecular & Cellular Proteomics 发表时间:(2019年7月) IF:5.41 单位 ...
- Mol Cell Proteomics. |彭建祥| 人胃肠道间质瘤亚群蛋白质组图谱
大家好,本周分享的是发表在Molecular & Cellular Proteomics 上的一篇关于人胃肠道间质瘤亚群蛋白质组图谱的文章,题目是Proteomic maps of human ...
- Mol Cell Proteomics. | Mapping Spatio-temporal Microproteomics Landscape in Experimental Model of Traumatic Brain Injury Unveils a link to Parkinson’s Disease
期刊:Molecular & Cellular Proteomics 发表时间:June 16, 2019 通讯作者:Michel Salzet,Isabelle Fournier 一. 概 ...
- Mol. Cell. Proteomics | 癌细胞衍生的小细胞外囊体通过促进HGF-Met途径促进受体细胞转移
题目:Cancer cell derived small extracellular vesicles contribute to recipient cell metastasis through ...
- Mol Cell Proteomics. |马臻| psims-一个用于编写HUPO-PSI标准下的mzML和mzIdentML的python库
大家好,本周分享的是发表在MCP(MOLECULAR&CRLLULAR PROTEOMICS)上的一篇关于质谱数据处理和识别的文章,题目是psims - A Declarative Write ...
- Mol Cell Proteomics. |赵赟| 全面地分析个人尿蛋白质组学的变化揭示出不同的性别变化
大家好,本周分享的是发表在Molecular & Cellular Proteomics上的一篇关于人的尿蛋白质组学的文章,题目是Comprehensive analysis of indiv ...
随机推荐
- JavaScript 中事件对象参数:clientX、clientY、offsetX、offsetY、screenX、screenY
JavaScript 中一些概念理解 :clientX.clientY.offsetX.offsetY.screenX.screenY clientX 设置或获取鼠标指针位置相对于窗口客户区域的 x ...
- [PHP] 报错和“@” - 工作
以下几点关于报错和@的关系理解 在PHP中使用@加在某个语句前面,可以抑制错误在脚本的执行过程中输出到IO: 如果在某个语句上使用了@,则可以将语句内的各种嵌套的脚本可能存在的报错都会被抑制住: 如果 ...
- annoy超平面多维近似向量查找工具
需求:有800万的中文词向量,要查询其中任意一个词向量对应的k个与其最邻近的向量.通常情况下如果向量集比较小的话,几十万个向量(几个G这种),我们都可以用gensim的word2vec来查找,但是88 ...
- javascript中this的四种用法
javascript中this的四种用法 投稿:hebedich 字体:[增加 减小] 类型:转载 时间:2015-05-11我要评论 在javascript当中每一个function都是一个对象,所 ...
- mongodb 4.0配置认证模块
use admin db.createUser({user:"root",pwd:"xxx",roles:[{role:"root",db: ...
- 纯JS实现KeyboardNav(学习笔记)一
纯JS实现KeyboardNav(学习笔记)一 这篇博客只是自己的学习笔记,供日后复习所用,没有经过精心排版,也没有按逻辑编写 GitHub项目源码 预览地址 最终效果 KeyboardNav使用指南 ...
- vue项目打包后打开空白解决办法
1.记得改一下config下面的index.js中bulid模块导出的路径.因为index.html里边的内容都是通过script标签引入的,而你的路径不对,打开肯定是空白的.先看一下默认的路径. a ...
- [每日一题系列] LeetCode 1071. 字符串的最大公因子
题目 对于字符串 S 和 T,只有在 S = T + ... + T(T 与自身连接 1 次或多次)时,我们才认定 "T 能除尽 S". 返回最长字符串 X,要求满足 X 能除尽 ...
- form里面文件上传并预览
其实form里面是不能嵌套form的,如果form里面有图片上传和其他input框,我们希望上传图片并预览图片,然后将其他input框填写完毕,再提交整个表单的话,有两种方式! 方式一:点击上传按钮的 ...
- Redis系列四 - 分布式锁的实现方式
前言 分布式锁一般有3中实现方式: 数据库乐观锁: 基于Redis的分布式锁: 基于ZooKeeper的分布式锁. 以下将详细介绍如何正确地实现Redis分布式锁. 可靠性 首先,为了确保分布式锁的可 ...