【3】蛋白鉴定软件之Mascot
1.简介
Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图检索,只能体验一下。大规模的蛋白组搜索必须使用它们的服务器。简述下特点:
- 支持目前主流的三种检索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或复杂MALDI的MS/MS Ion Search,以及Sequence Query功能进行分子量和碎片离子信息联合搜库。
- 特有的基于随机匹配概率的打分方法(另一种是经典的SEQUEST 2次打分算法),支持标准统计显著性检验分析
- 整合FDR阈值选项及Percolator大规模数据检索质量控制算法
- 可检索各种类型数据库,包括序列库和谱图库,也可自定义
- 支持几乎所有常用的质谱仪输出的数据格式
- 支持Web浏览器,给出概述性和详细的结果报告
mascot官网包含的东西很多,除了产品,它还提供了training的资料,blog和help文档,对于蛋白质组学入门者而言,可以多浏览了解了解。
2.配置
Mascot服务器蛋白搜库功能:
2.1在线版本
这里主要介绍串联质谱检索方法MS/MS Ions Search。点击进入Perform search
对主要的参数进行配置,比如数据库,物种,酶切,漏切,可变修饰,固定修饰,一二级误差及其单位,肽段价态,上传文件及格式,是否构建反库等。以下是一个简单的配置示例,仅供参考:
2.2 服务器版本
如果mascot部署已部署在本地服务器(如我们厂搭建在了集群上),需要通过服务器端口对酶、修饰、物种数据库等参数进行配置,然后在Linux环境中运行。mascot配置界面如下:
例如对物种数据库进行配置Databasea Maintenance
当然,如果你已经建好了库,下次可以从中选择继续用就行。建好库的标志就是在MASCOT search status page中显示In use
,在Linux中则出现seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats
等文件
mascot服务器在Linux中的搭建和配置是比较复杂的,安装和配置指南我提供了一个文件供参考:
链接: https://pan.baidu.com/s/1IXkPqQ5k-Q-Y0bvvDga6mw
提取码: 5m1a
3.运行
3.1 在线版本
上传mgf谱图文件,点击start search
即可进行在线检索,但这个检索支持的谱图数非常有限,体验一下即可。
PS:第一次提交不会立即执行,会发送消息到邮件需要你验证,然后再配置运行。
3.2 服务器版本
Linux服务器版本,配置好数据库及其他参数后,可调用以下命令:
nph-mascot.exe 1 -commandline -f test.dat < test.asc
得到mascot鉴定结果,并通过mascot提供的解析脚本export_dat.pl,得到进一步的详细结果:
perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 > test.csv
4.结果
一般而言,mascot得到的鉴定结果是.dat
文件(当然也导出其他格式)。dat源文件比较复杂,常人是看不懂的(截取部分):
这时就有很多其他软件来对dat进行解析处理或者可视化。
对于官网提供的在线版本,mascot将结果生成了一份在线报告形式,清晰易懂。我这里就对结果不进行过多解释,不明白的地方也可查看help。
当然,我们也可以将dat文件导入如iQuant软件进行标记定量,或者导入PDV等谱图可视化软件来进行鉴定结果查看。
Ref:
http://www.cloudscientific.com/plus/view.php?aid=11
https://www.bio-equip.com.cn/show1equip.asp?equipid=439471
蛋白质组学鉴定定量系列软件总结:
【1】蛋白鉴定软件之X!Tandem
【2】蛋白鉴定软件之Comet
【3】蛋白鉴定软件之Mascot
【4】蛋白质组学鉴定软件之MSGFPlus
【5】蛋白质组学鉴定定量软件之PD
【6】蛋白质组学鉴定定量软件之MaxQuant
【3】蛋白鉴定软件之Mascot的更多相关文章
- 【2】蛋白鉴定软件之Comet
目录 1.简介 2.下载安装 3.软件使用 4.结果 1.简介 官网:http://comet-ms.sourceforge.net/ 1993年开发,持续更新,免费开源 适用Windows/Linu ...
- 【1】蛋白鉴定软件之X!Tandem
目录 1. 简介 2.下载安装 3. 软件试用 4. 结果 5. FAQ 1. 简介 X!Tandem是GPM:The Global Proteome Machine(主要基于Web的开源用户界面,用 ...
- 【4】蛋白质组学鉴定软件之MSGFPlus
目录 1.简介 2.安装运行 3.结果 1.简介 MSGF+也是近年来应用得比较多的蛋白鉴定软件.java写的,2008年初次发表JPR,2014年升级发表NC,免费开源,持续更新维护,良心软件.而且 ...
- 【6】蛋白质组学鉴定定量软件之MaxQuant
目录 1.简介 2.下载安装 3.配置与运行 4.结果 5.Perseus后处理 6.小结 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQua ...
- 【5】蛋白质组学鉴定定量软件之PD
目录 1.简介 2.安装与配置 3.分析流程 4.结果 1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲 ...
- 蛋白质修饰|phosphors|mascot+X|
生物医学大数据 重点:蛋白质定量 新蛋白可以是全新的蛋白质,也可以是知结构但未知功能的蛋白质,也可以是知道结构有新功能的蛋白质. 新蛋白鉴定可以使用以下方法. 基于基因组,可以基因组中的coding区 ...
- MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性
一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...
- 【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据
目录 一.iMetaLab简介 二.内置工具与模块 1. Data Processing module 2. Functional Analysis 3. R Developing environme ...
- Journal of Proteomics Research | 自动的、可重复的免疫多肽数据分析流程MHCquant
题目:MHCquant: Automated and reproducible data analysis for immunopeptidomics 期刊:Journal of Proteome R ...
随机推荐
- echart3 力引导布局实现节点的提示和折叠
最近在项目中需要开发一个图表来显示人员的各种属性,类似于一种树形的结构进行显示数据.如果多个人员有同一个属性,那么需要将相同的属性进行连线,即关联起来.即形成一个关系图,由于我自身对echarts稍微 ...
- 2021.8.24考试总结[NOIP47]
T1 prime 发现只需筛小于等于$mid(\sqrt r,k)$的质数,之后用这些质数筛掉区间内不合法的数即可. $code:$ 1 #include<bits/stdc++.h> 2 ...
- gdal注册nsdtfDEM格式驱动配置
一.关于nsdtf格式 *.dem是一种比较常见的DEM数据格式,其有两种文件组织方式,即NSDTF-DEM和USGS-DEM . NSDTF-DEM NSDTF-DEM是一种明码的中国国家标准空间数 ...
- [CSP-S2021] 回文
链接: P7915 题意: 给出一个长度为 \(2n\) 的序列 \(a\),其中 \(1\sim n\) 每个数出现了 2 次.有 L,R 两种操作分别是将 \(a\) 的开头或末尾元素加入到初始为 ...
- 『学了就忘』Linux基础 — 7、补充:安装Linxu系统时设置硬盘挂载说明
目录 (1)新建一个/home分区 (2)再创建一个/boot分区. (3)创建一个swap分区 (4)最后剩余的空间全部分给根目录 (5)总结 上一篇在VMwar虚拟机中安装Linux操作系统中ht ...
- 转:Modelsim和Vcs+Verdi使用技巧(Linux)
Modelsim脚本自动仿真 1.创建文件 run.do,"#"为注释符号 quit -sim #退出上次仿真 .main clear #清除上次仿真所有文件以及打印信息 vlib ...
- 树形DP 枚举祖宗的例题
这类题目是真的很头疼....其实这类题目的特征也很明显,叶子结点贡献答案时和其所在链的祖宗有关,也就是说要想得知其贡献必须知道他的所有祖宗的贡献,其实处理方法也不是太难,就是在dfs枚举时顺便把祖宗的 ...
- Oracle 11G单机 无网络环境静默安装
参考文章https://blog.csdn.net/xiaoyu19910321/article/details/89856514 环境centos 7.6最小化安装 1,关闭防护墙selinux,配 ...
- SpringBoot配置文件自动映射到属性和实体类(8)
一.配置文件加载 1.Controller中配置并指向文件 @Controller @PropertySource(value = { "application.properties&quo ...
- 设置IDEA启动,不要自动打开上次使用时的项目
打开idea时自动加载最近编辑的项目,很费时间,关闭设置如下