SAINT的介绍

SAINT(Significance Analysis of INTeractome)是一种概率方法,用于在亲和纯化-质谱(AP-MS)实验中对阴性对照的诱饵-猎物相互作用进行打分,从而获取与靶向蛋白具有可能互作关系的蛋白。

SAINTexpress是SAINT的改进版,具有更简单的统计模型和更快的评分算法,显著提高了计算速度和评分的敏感性,下面简单介绍一下这个软件的使用。

SAINTexpress的使用

下载与安装

wget https://sourceforge.net/projects/saint-apms/files/SAINTexpress_v3.6.3__2018-03-09.tar.gz
tar xf SAINTexpress_v3.6.3__2018-03-09.tar.gz
cd SAINTexpress_v3.6.3__2018-03-09 && make

输入文件的准备

主要有三个输入文件

  • Bait file

    第一列是 IP name IP蛋白的名称,可以理解为具体的

    第二列是 bait name 靶向蛋白的名称 我的理解为第一列是具体

    第三列是 标识分组的 T标识test C 标识control

  • Prey file

    第一列是 prey name 蛋白的名称 可以为GI号或者Uniprot号

    第二列是 prey protein length 蛋白的长度

    第三列是 prey gene name 基因的名称 可以与蛋白名称一样

  • Interaction file

    第一列是 IP name

    第二列是 bait name

    第三列是 prey name

    第四列是 spectral counts

软件的运行与参数

SAINTexpress-spc [OPTIONS] <interaction data> <prey data> <bait data>

-L 用来设置虚拟的对照值。例如,如果我们想获得对照的最大的4个光谱值

SAINTexpress-spc –L4 inter.dat prey.dat bait.dat

-R 设置计算时每一个baits使用重复的数量。当一些baits的重复多余其他的baits时,这个参数很有用,默认为100

合并已知交互关系的数据

可以输入一个GO格式的文件计算一个TopoAvgP的得分,需要提供包含两列的交互数据库文件,如下图的GO.txt文件。

第一列是GO id 应该可以为其他的id

第二列是属于这个GO term的基因id 用空格分隔开,id名称与prey file的第一列一样

SAINTexpress-spc –L4 inter.dat prey.dat bait.dat GO.txt

输出文件格式

输出的文件有16列,每一列的具体解释如下

Bait: bait identifier bait 文件里面的第二列

Prey: prey identifier 蛋白的名称

PreyGene: additional prey identifier 蛋白对应的基因名

**Spec: **spectral counts for the bait-prey pair 每一个样的光谱定量值

SpecSum: sum of the spectral counts 定量的和

AvgSpec: average spectral counts over replicates 平均定量值

NumReplicate: number of replicate purifications for the given bait 重复数

ctrlCounts: spectral counts in the negative controls 阴性对照的定量值

AvgP: main probability score 主要的打分值

**MaxP: **maximal probability score of the interaction over replicates 基于重复互作的最大概率得分

TopoAvgP: topology-aware probability score incorporating known interaction data 包含已知交互数据的拓扑感知概率得分

TopoMaxP: topology-aware maximal probability score over replicates 基于拓扑感知的重复最大概率得分

**SaintScore: **larger of AvgP and TopoAvgP AvgP和TopoAvgP中的较大值

**FoldChange: **average spectral count in test interaction divided by the average in controls 处理的平均光谱值处理对照的平均光谱值

Boosted_by: indicates which known interactors of the same bait contributed to TopoAvgP 基于同一诱饵的已知互作关系得到的一个TopoAvgP共享值,具体不太清楚,需要使用GO.txt文件才会得到这个值

FDR: Bayesian false discovery rate 矫正值

logOddsScore: 得分值,应该是指示互作的概率?一般取log

SAINT学习笔记的更多相关文章

  1. AU3学习笔记

    目录 1. AU3是什么?能做什么? 2. 乱学AU3中的命令(语言相关)? 3. 通过简单示例学习AU3? 4. 正则表达式的学习(对大小写敏感) 5.对于GUI的相关学习 1.        AU ...

  2. [Python学习笔记]文件的读取写入

    文件与文件路径 路径合成 os.path.join() 在Windows上,路径中以倒斜杠作为文件夹之间的分隔符,Linux或OS X中则是正斜杠.如果想要程序正确运行于所有操作系统上,就必须要处理这 ...

  3. js学习笔记:webpack基础入门(一)

    之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...

  4. PHP-自定义模板-学习笔记

    1.  开始 这几天,看了李炎恢老师的<PHP第二季度视频>中的“章节7:创建TPL自定义模板”,做一个学习笔记,通过绘制架构图.UML类图和思维导图,来对加深理解. 2.  整体架构图 ...

  5. PHP-会员登录与注册例子解析-学习笔记

    1.开始 最近开始学习李炎恢老师的<PHP第二季度视频>中的“章节5:使用OOP注册会员”,做一个学习笔记,通过绘制基本页面流程和UML类图,来对加深理解. 2.基本页面流程 3.通过UM ...

  6. 2014年暑假c#学习笔记目录

    2014年暑假c#学习笔记 一.C#编程基础 1. c#编程基础之枚举 2. c#编程基础之函数可变参数 3. c#编程基础之字符串基础 4. c#编程基础之字符串函数 5.c#编程基础之ref.ou ...

  7. JAVA GUI编程学习笔记目录

    2014年暑假JAVA GUI编程学习笔记目录 1.JAVA之GUI编程概述 2.JAVA之GUI编程布局 3.JAVA之GUI编程Frame窗口 4.JAVA之GUI编程事件监听机制 5.JAVA之 ...

  8. seaJs学习笔记2 – seaJs组建库的使用

    原文地址:seaJs学习笔记2 – seaJs组建库的使用 我觉得学习新东西并不是会使用它就够了的,会使用仅仅代表你看懂了,理解了,二不代表你深入了,彻悟了它的精髓. 所以不断的学习将是源源不断. 最 ...

  9. CSS学习笔记

    CSS学习笔记 2016年12月15日整理 CSS基础 Chapter1 在console输入escape("宋体") ENTER 就会出现unicode编码 显示"%u ...

随机推荐

  1. .Net Core实战教程(三):使用Supervisor配置守护进程

    安装Supervisor yum install python-setuptools easy_install supervisor 配置Supervisor mkdir /etc/superviso ...

  2. 基于vue+springboot+docker网站搭建【五】部署vue前端项目

    部署vue前端项目  一.下载项目到本地   https://github.com/macrozheng/mall-admin-web 二.npm install 三.修改api配置,改为你接下来要部 ...

  3. python高级编程——网络编程(一)

    计算机网络基础 概念:计算机网络就是把各个计算机连接到一起,让网络中的计算机可以互相通信.网络编程就是如何在程序中实现两台计算机的通信.而网络编程就是开发计算机网络应用程序 计算机的通信协议 概念:计 ...

  4. Python——EM(期望极大算法)教学(附详细代码与注解)

    今天,我们详细的讲一下EM算法. 前提准备 Jupyter notebook 或 Pycharm 火狐浏览器或谷歌浏览器 win7或win10电脑一台 网盘提取csv数据 需求分析 实现高斯混合模型的 ...

  5. 设计模式:单例(Sigleton)模式

    题目:设计一个类,我们只能生成该类的一个实例. 只能生成一个实例的类是实现了Singleton(单例)模式的类型. 相关知识: 这种模式涉及到一个单一的类,该类负责创建自己的对象,同时确保只有单个对象 ...

  6. ubuntu16.04 共享文件夹之后 /mnt/hgfs目录下没有显示共享的文件夹

    root权限执行: apt-get install open-vm-tools vmhgfs-fuse .host:/ /mnt/hgfs

  7. centos 查看硬盘情况

    lsblk                                                                             查看分区和磁盘 df -h     ...

  8. django crm2

    1.模糊查询 由于Q的可以传递字符串属性,可以进行拼接__contains 进行搜索 2.未报名筛选,未报名的存储在models的 enroll_status_choices中,存储的是 enroll ...

  9. Bootstrap基础学习 ---- 系列文章

    [Bootstrap基础学习]05 Bootstrap学习总结 [Bootstrap基础学习]04 Bootstrap的HTML和CSS编码规范 [Bootstrap基础学习]03 Bootstrap ...

  10. JMeter【第五篇】关联:5种方法

    前几天在Q群里看到群友发的最近10年性能测试工具使用率的统计,最近的2018年,jmeter+loadrunner占了93%的使用率,说明这两个是主流,其中,jmeter的使用率逐年提升,现在已经超过 ...