1.简介

2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸张地说,MaxQuant是业界良心,它的横空出世沉重地打击了深恶痛绝的质谱厂商们的嚣张气焰。

主要特点:

  • 支持多种质谱仪厂商产生原始数据,如raw/wiff;
  • 免费不开源,基于Andromeda搜索引擎;;
  • 支持标记定量和非标定量,如labelfree(优势)/ICAT/SILAC/TMT/iTRAQ等;
  • 蛋白鉴定数多,定量准确性高(主要是因为非线性质量校正和Match Between Runs);
  • 有较完整的结果查看和分析界面;
  • 主要部署在Windows系统(Linux需要mono,MacOS需借助Parallels或Bootcamp);
  • 有配套的结果后处理软件Perseus。

2.下载安装

官网:https://www.maxquant.org/

MQ的下载需要用邮箱注册,并填写注册码。

依赖.NET Framework(基于.net框架编写,有些没安装的电脑需要安装) 和MSFileReader(识别质谱raw文件)。

解压后无需安装,点击MaxQuant.exe即可使用。

3.配置与运行

MaxQuant使用很简单,参数界面设置也不像PD那么凌乱。

6大参数配置模块,我这里只选一些重要的参数,大部分默认就好:

  • Raw files:导入原始数据和设计实验,包括组分和样本,Group(指不同的实验,如label/SILAC同时进行即为2个Group0和Group1,一般跑一个就好);
  • Group-specific parameters:Group参数的设置,一般只是Group0;
  • Global parameters:全局参数配置;
  • Performance:显示正在运行的具体步骤和动态;
  • Viewer:数据可视化模块, 能在labelfree定量中呈现三维图形。我认为没啥用,无需设置,拖慢速度;
  • Andromeda configuration:用于配置修饰、酶,以及数据库ID规则设置等,一般无额外需求,无需设置。

所以,实际需要配置的就是前面三项,我这里以Labelfree定量为例,写下Group-specific parameters和Global parameters中一些重要的参数:

模块 选项 值或动作
Group-specific parameters Variable modifications 增加Deamidation(NQ)、Gln->pyro-Glu
Label-free quantification 选LFQ
Global parameters Fasta files 添加数据库文件(可加入多个)
Match between runs 打勾
iBAQ 打勾
Min.unique peptides 1

其他选项基本上用默认就好,具体项目具体分析。配置完后设置线程数,点击Start。(若中间暂停,可在Partial processing选中中间步骤运行。

MQ的主要运行步骤如下:

  • feature信息的提取(定量信息)
  • 最初的搜库(first search)
  • 质量校正
  • 搜库鉴定(main search)
  • 峰处理
  • 第二次搜库(second peptide search)
  • 定量和鉴定结果合并
  • 导出结果

更多参数可查看官方文档:http://coxdocs.org/doku.php?id=maxquant:start

也可以查看我分享的两个文档:MaxQuant_Infos_and_Tutorial_07(中间每个参数都介绍得很详细)

MaxQuant_Introduction_112409

4.结果

如果参数中路径没有额外设置,那么在原始数据同级目录下会得到搜库结果:



combined文件夹包含了搜库结果,如果是DIA建库,导入的即是这个文件夹。里面包含了txt文件夹,即鉴定和定量的全部结果。

mqpar.xml是所有参数配置文件,若二次搜库,可直接导入MaxQuant中,无需重复设置。所以,一般建议保留下来,这样也可对结果的设置进行追溯。

在combined/proc/#runningTimes.txt中包含了每一步运行的时间。

combined文件夹中的txt文件夹包含很多结果:

msms.txt、peptides.txt、proteinGroups.txt即为谱图、肽段和蛋白结果文件。其他比较重要的文件如evidence.txt,summary,modificationSpecificPeptides等。每个表都很大,样品数多的话可达上百列。每个文件的每一列(即表头)在tables.pdf文档中都有详细解释。


Linux运行

需要mono调用MQ,参数配置文件mqpar.xml同Windows系统,注意输入原始文件(谱图和数据库)的路径。一般是先通过Windows生成mqpar.xml,再来Linux运行。但这样的话,又需要在两个系统间来回转移原始数据,非常低效。所以现在也有一些小工具来专门生成mqpar.xml。MaxQuant的Linux试运行

/path/to/bin/mono /path/to/MaxQuant/bin/MaxQuantCmd.exe mqpar.xml

5.Perseus后处理

Perseus也是上面两位大佬开发的软件,发在nature methods上。一开始是专门针对MQ数据处理的。后来对所有矩阵类型的表达数据,甚至是多组学数据都适合。

对于蛋白质组学常规的统计分析和可视化(不太友好)都能实现,而且大佬团队也持续开发了基于调用本地R或Python解释器的插件,使得功能更加丰富。

这里不做过多介绍了。因为我如果不是有授课的需求的话,也不会用这个软件。为有需要的朋友提供了一些教程可参考:

MQ团队几乎每年都会举办暑期学校,Youtube上很多视频。不过中文教程近乎于无。

6.小结

蛋白质组学鉴定和定量系列软件说明到此结束,还有很多没有介绍的,比如国产软件pFind,MSFragger,OMSSA,SEQUEST等都是常用的蛋白鉴定软件。有些我自己也没用过,也没必要一一使用,适合自己的才是好的。而且,目前也有很多平台是整合了多个鉴定软件的综合结果,比如SearchGUI,PeptideShaker,TPP等等。


蛋白质组学鉴定定量系列软件总结:

【1】蛋白鉴定软件之X!Tandem

【2】蛋白鉴定软件之Comet

【3】蛋白鉴定软件之Mascot

【4】蛋白质组学鉴定软件之MSGFPlus

【5】蛋白质组学鉴定定量软件之PD

【6】蛋白质组学鉴定定量软件之MaxQuant

【6】蛋白质组学鉴定定量软件之MaxQuant的更多相关文章

  1. 【5】蛋白质组学鉴定定量软件之PD

    目录 1.简介 2.安装与配置 3.分析流程 4.结果 1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲 ...

  2. 【4】蛋白质组学鉴定软件之MSGFPlus

    目录 1.简介 2.安装运行 3.结果 1.简介 MSGF+也是近年来应用得比较多的蛋白鉴定软件.java写的,2008年初次发表JPR,2014年升级发表NC,免费开源,持续更新维护,良心软件.而且 ...

  3. 【3】蛋白鉴定软件之Mascot

    目录 1.简介 2.配置 2.1在线版本 2.2 服务器版本 3.运行 3.1 在线版本 3.2 服务器版本 4.结果 1.简介 Mascot是非常经典的蛋白鉴定软件,被Frost & Sul ...

  4. 【2】蛋白鉴定软件之Comet

    目录 1.简介 2.下载安装 3.软件使用 4.结果 1.简介 官网:http://comet-ms.sourceforge.net/ 1993年开发,持续更新,免费开源 适用Windows/Linu ...

  5. 【1】蛋白鉴定软件之X!Tandem

    目录 1. 简介 2.下载安装 3. 软件试用 4. 结果 5. FAQ 1. 简介 X!Tandem是GPM:The Global Proteome Machine(主要基于Web的开源用户界面,用 ...

  6. 无标定量|有标定量|谱图计数|XIC|AMT数据库|RT对对齐|母离子|子离子|SILVER|SRM|iBAQ|APEX|差异蛋白筛选|MaxQuant|PANDA|C-HPP

    生物医学大数据-蛋白质定量 现今肽段定量效率存在巨大差异.比如相同质量蛋白质,但是肽段和蛋白信号不均一,在物理条件一致时,仅有70%的重复率,并且当重复次数变多时,overlapping在变少. 无标 ...

  7. 蛋白质组DIA深度学习之谱图预测

    目录 1. 简介 2. 近几年发表的主要工具 1.DeepRT 2.Prosit 3. DIANN 4.DeepDIA 1. 简介 基于串联质谱的蛋白质组学大部分是依赖于数据库(database se ...

  8. 【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据

    目录 一.iMetaLab简介 二.内置工具与模块 1. Data Processing module 2. Functional Analysis 3. R Developing environme ...

  9. Deep Protein Methylation Profiling by Combined Chemical and Immunoaffinity Approaches Reveals Novel PRMT1 Targets (结合层析法和免疫沉淀法的蛋白甲基化的深度检测技术发现了PRMT1新的靶标蛋白)

    题目:Deep Protein Methylation Profiling by Combined Chemical and Immunoaffinity Approaches Reveals Nov ...

随机推荐

  1. MySQL 8.0安装 + 配置环境变量 + 连接 cmd

    MySQL 安装教程 搜索 MySQL,进入官网,找到 download 点击适用于 window community 版本,点击图中第二个 450.7 M 的安装包进行下载 这里有五个选项,选择第二 ...

  2. 热身训练2 GCD

    题目描述 简要题意:  n个数字,a1,a2,...,an m次询问(l,r),每次询问需回答 1.gcd(al,al+1,al+2,...,ar);2.gcd(ax,ax+1,ax+2,...,ay ...

  3. 大厂面试题分享:如何让(a===1&&a===2&&a===3)的值为true?

    当我第一次看到这一题目的时候,我是比较震惊的,分析了下很不合我们编程的常理,并认为不大可能,变量a要在同一情况下要同时等于1,2和3这三个值,这是天方夜谭吧,不亚于哥德巴赫1+1=1的猜想吧,不过一切 ...

  4. 面试官问:说说你对Java函数式编程的理解

    常见的面试问题 总结一下,在Java程序员的面试中,经常会被问到类似这样的问题: Java中的函数式接口是什么意思? 注解 @FunctionalInterface 的作用是什么? 实现一个函数式接口 ...

  5. linux中的strip命令简介

    转载:https://blog.csdn.net/qq_37858386/article/details/78559490 strip:去除,剥去     一.下面是man strip获得到的信息,简 ...

  6. Hdu P1394 Minimum Inversion Number | 权值线段树

    题目链接 题目翻译: 约定数字序列a1,a2,...,an的反转数是满足i<j和ai>aj的数对(ai,aj)的数量. 对于给定的数字序列a1,a2,...,an,如果我们将第1到m个数字 ...

  7. 记一次线上环境 ES 主分片为分配故障

    故障前提 ElasticSearch 版本:5.2 集群节点数:5 索引主分片数:5 索引分片副本数:1 线上环境ES存储的数据量很大,当天由于存储故障,导致一时间 5个节点的 ES 集群,同时有两个 ...

  8. 黑客是如何利用DNS域传送漏洞进行渗透与攻击的?

    一.DNS域传送 DNS :Domain Name System 一个保存IP地址和域名相互映射关系的分布式数据库,重要的互联网基础设施,默认使用的TCP/UDP端口号是53 常见DNS记录类型: 1 ...

  9. Java测试开发--sts安装Lombok(七)

    1.sts安装Lombok的步骤: 下载最新的lombok.jar包,进入cmd窗口,切到Lombok下载的目录,运行命令: java -jar lombok.jar,会出现如下界面: 已经默认选好了 ...

  10. OpenYurt 与 FabEdge 集成验证——云边数据面通信初试

    作者|浙江大学 SEL 实验室:晋晨.博云:耿浩涛 审核&校对:海珠 编辑&排版:雯燕 背景 在近几年的产业环境下,传统云计算能力已无法支撑起规模日趋庞大且异地分散的数据处理与计算需求 ...