蛋白组DIA分析:Spectronaut软件使用指南
官方文档: https://biognosys.com/media.ashx/spectronautmanual.pdf
0. 准备
Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之一,优点是定量准确,缺点是高额收费,window版本,速度慢。一起来简单了解下用法。

这是它的界面。只要理解了DIA流程,用法其实很简单,首先构建谱图库,或者导入已建好的DDA谱图库,再导入DIA原始文件,配置好参数,最后run即可。
一开始需要准备的是各种数据,包括:DIA的rawdata,DDA的rawdata,DDA的database(若有,需加入iRT序列进行校正),DDA的搜库鉴定结果。如果样本数多的话,这些原始文件会非常大,刚也提到该软件只支持windows系统,转移数据很麻烦,随便一个项目就能达到500G,所以必须要用很大的内存和硬盘。转移数据往往要花费很长时间。
1. 谱图库构建
首先进入Library,导入谱图库。Generate Library from Pulsar...是说用Spectronaut构建谱图库;Generate Spectral Library from...是说从别的搜库软件构建好的谱图库导入,支持常见的搜库软件结果文件:

Import/Exprot Spectral Library是导入导出谱图库,这里的谱图库是说已经在Spectronaut中完成了的库。
我们通常是自己导入搜库软件的结果文件来构建谱图库。
若导入MaxQuant构建的谱图库:
导入MaxQuant结果,只需指定combined文件夹导入,软件会自动关联相对应的原始数据(DDA的rawdata,关联也需要一段时间),若原始数据与搜库结果不在同一个文件夹内,可能会导致关联失败,可以通过“Assign Shotgun Files”的方式来指定相应的原始数据(见下图);关联后,在FASTA Files一栏选择相应的数据库文件(数据库要右击上传,然后点击左边倒三角);点击”Load”后加载Ion library,导入谱图库需要一段时间。



导入成功后,左边Spectral Libraries会显示出来。点击左侧spectral libraries的名字,更改为相应的项目编号;右侧显示的为spectral library的详细信息。

若导入Mascot结果作为谱图库:
Mascot的结果通常是dat文件,每一个rawdata对应一个dat。但是Spectronaut要求dat文件名与对应的raw文件同名,即使Assign shotgun files指定rawdata路径,也会关联不到,而且要将所有的dat构建一个谱图库(这是我们想要的)需要将不同的dat文件整合到同一目录下,实际上,一个样本往往多个fraction,同个样本的多个dat文件一般放在一个目录中,所以我们要拷贝出来,重命名。如果样本数多,也是件麻烦的事情。
比如原来每个样本的6个fraction是这样的结构:


最后需要在同级目录下同时存在:

然后导入全部dat文件,会自动关联对应的rawdata,上传数据库,设置参数即可构建谱图库了。
常见参数如下,一般默认就好。

另外还有一点,根据上传的数据库类型进行解析。主要是要注意fasta序列的ID及其后面的描述信息等,因为不同来源的数据库,规则会不同。


导入的数据库格式需要是fasta后缀,fa后缀会识别不了。对于蛋白组来说,大部分数据库类型都是uniprot(软件已经给你制定好了,无需定制),若是其他的类型,导入后,根据数据库制定规则,不会的可以点击后面的小问号,最后add rule。

import数据库后,记得打勾选中。

最后点击右下角的load,即导入谱图库,导库的过程可能需要话一段时间。构建谱图库的过程可以在日志文件中查看:

以下是完成后谱图库的信息:

2. DIA解析
旧版本可能是切换到“Review”界面,点击“Load Raw from File”后导入DIA数据。新的版本是Analysis界面,然后点击set up a DIA analysis from file,将DIA原始数据导入:

然后选择谱图库:

后面的参数默认就好,一步一步点击next。直到要设置condition实验设计这一步。需要注意的是圈出来的这几部分,对照组及重复设置。当然也可以设置好后导入。

设置condition和replicate的参数来判断是成对还是非成对,原则是:相同的实验对象Replicate编号一致,不同的实验对象Replicate编号务必不同。如下:

一直点到最后finish,然后一个数据一个数据的开始提峰。

数据量大的话,提峰很慢,因为要解卷积混合谱图。可能要默默等上个几天。
3. 结果导出
提峰完成后,首先是保存工程文件,以sne为后缀。注意是右击下面这个地方,然后save as:

Spectronaut一旦关闭,完成的结果便会丢失,通过保存工程文件,后续如有重新查看的需求,只需导入工程文件即可,无需重新运行spectronaut。
然后是结果的保存。切换到Report标签界面。

你的软件可能没有配置好的如下导出结果格式,这个主要是为后续定量分析的软件使用准备,如R包MSstat。

一般只有BGS factory report,这时需要自己设置格式。可以对columns进行选择,也可以filters过滤一些蛋白。当然你也可以全部选中,导出后再处理。
可以对新建立的格式做保存,下次就可以直接用啦。比如下面我对所有列都做了选中(打勾),再save as,命名,点ok:

最后,export report导出:

对于MSstats R包,需要导出2种格式文件,一是如下:

二是蛋白定量文件,导出并命名为PG_Report.xls:

当然也可以导入或导出制定好的格式,比如我导入:

不过有个小问题,貌似自己制定的和外部导入是由不同的,也就是说这个蓝色阴影和打勾效果不一样,导入的格式和BGS factory report似乎是同一级别的,而上面新建格式只是在BGS factory report的子文件而已。


根据导出的结果看,自己新建的好像不行(这里没有探究清楚)。
不论如何,我们导出结果。
最后的导出的文件包含如下,包含了工程文件、结果文件、参数及日志等:

重新导出结果
如果需要重新加载提峰的结果,可以在“Analysis”界面(旧版Review界面)选择“Load a spectronaut Experiment”,选择相应的sne文件进行加载。

蛋白组DIA分析:Spectronaut软件使用指南的更多相关文章
- 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)
发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...
- 【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据
目录 一.iMetaLab简介 二.内置工具与模块 1. Data Processing module 2. Functional Analysis 3. R Developing environme ...
- MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性
一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...
- ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...
- 《移山之道:VSTS软件开发指南》读书笔记
这两天看了<移山之道:VSTS软件开发指南>,对团队软件开发又有了新的认识.也许对于我们这些软件开发的新手来说,最重要的是具体技术与应用框架,但读了这本书后我感觉到,实际团队项目中工具的使 ...
- MCP|ZWT|Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)
一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性, ...
- MetaboAnalyst的多组学分析
MetaboAnalyst是做代谢的R包,功能十分强大.也开发了web版本,代谢组学的分析这里不介绍,主要讲讲它开发的多组学分析的相关内容. 既然是做代谢的工具,即使是增加了多组学内容,肯定也是以代谢 ...
- 多组学分析及可视化R包
最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在 ...
- Windows 2003】利用域&&组策略自动部署软件
Windows 2003]利用域&&组策略自动部署软件 转自 http://hi.baidu.com/qu6zhi/item/4c0fa100dc768613cc34ead0 ==== ...
随机推荐
- 第二次Alpha Scrum Meeting
本次会议为Alpha阶段第二次Scrum Meeting会议 会议概要 会议时间:2021年4月24日 会议地点:线上会议 会议时长:30min 会议内容简介:本次会议主要由每个人展示自己目前完成的工 ...
- zip和flatMap没有生效
在Reactor 中flatMap和zip等没有生效 1.一个简单的示例代码如下: 2.示例运行结果 3.得到结论 最近在项目中使用了 Project Reactor ,但发现代码在写着写着有些地方没 ...
- Noip模拟15 2021.7.14
T1 夜莺与玫瑰 题目越发的变态起来... 这题刚开始看超级像仪仗队,好不容易码完欧拉函数后尝试×2后输出但不对!! 于是选择了跳过.... 正解居然是莫比乌斯函数....我也是醉了 预处理完就剩下$ ...
- mipi csi接口,1条lane支持多少像素,200w像素需要几条lane,为什么,怎么计算出来的?谢谢!
按帧频FRAME=60HZ, 分辨率480*800来计算;以WVGA 显示分辨率,24BIT图片,60幁为例,在理想状态下(未包含RGB信号前后肩宽度),总传输速率最小为:480*800*8BIT*3 ...
- Less-5闯关失败
进行第五关的通关还是用之前的方式进行测试以及判断是什么类型的注入.通过判断我们不难发现是字符型注入.但是出了问题,我们会发现按照原来的步骤进行注入都会返回"You are in " ...
- MVC下垃框的使用
--------------模型-------------------- /// <summary> /// 状态 /// =0 下架 =1 上架 /// </summary> ...
- cf13B Letter A(分类+简单计算几何,,)
题意: 给三个线段(每个线段的两个端点的坐标),问这三个线段能否组成字母A. 组成字母A的条件: 1.两个线段有公共端点. 2.这两个线段夹角小于等于90度. 3.第三个线段的两个端点分别在这两个线段 ...
- 攻防世界 Misc 新手练习区 gif Writeup
攻防世界 Misc 新手练习区 gif Writeup 题目介绍 题目考点 仔细联想 字符转换 Writeup 下载附件并打开 104张黑白图 发现是一堆黑色和白色的图片,按某种规律排列,猜想flag ...
- PTA 7-1 邻接矩阵表示法创建无向图 (20分)
PTA 7-1 邻接矩阵表示法创建无向图 (20分) 采用邻接矩阵表示法创建无向图G ,依次输出各顶点的度. 输入格式: 输入第一行中给出2个整数i(0<i≤10),j(j≥0),分别为图G的顶 ...
- 快速排序平均时间复杂度O(nlogn)的推导
快速排序作为随机算法的一种,不能通过常规方法来计算时间复杂度 wiki上有三种快排平均时间复杂度的分析,本文记录了一种推导方法. 先放快速排序的伪代码,便于回顾.参考 quicksort(int L, ...