Significance A and B for protein ratios

实验设计中，一般会做三个生物学重复来确保结果的准确性，尤其在下游分析中。但有时会遇到没有生物学重复，而又需要进行差异分析的情况，这时一般建议考虑foldchange即可，因为根本无法进行T-test等统计学方法嘛。但是如果必须要算一个P值（个人觉得没啥必要。。。），那么不同组学有各自处理的方法（虽然并不是靠谱），比如NGS的转录组的一些软件会预估一个离散度做校正，而质谱的蛋白组则是用Significance A/B算法，这篇文章主要讲下Significance A/B是怎么来的

一般在网上搜Significance A/B是很难搜到相关信息的，因为这个是特定用于蛋白组学的一种统计学方法，而且现在来说用的也比较少了；那当初为何提出这分析方法，个人觉得可能是因为那时蛋白组学成本过高。以前一直只知道有这一分析方法，但是不知其原理，最近在搜索中无意发现一个帖子What statistical methods for ITRAQ with two biological replication?，其中提到一篇文章中有对Significance A/B的介绍

Significance A/B最先是发表于2008年Nature Biotechnology期刊上，MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification，这篇文章主要是介绍Maxquant这款用于蛋白组定量分析软件的，非常有名，而其附录中作者提到了如何通过protein ratio来计算显著性（P值）

代码实现

了解了上述的Significance A/B的计算过程，那么我们就可以用代码将其实现，下面我用R写了个函数来计算Significance A，而Significance B从上述可知，只要对protein分bin后再用Significance A计算即可（这里不重复展示了），输入为ratio向量

get_significance <- function(ratio){

  ratio <- log2(as.numeric(ratio))

  order_ratio <- ratio[order(ratio)]

  quantiletmp <- quantile(order_ratio, c(0.1587,0.5,0.8413))

  rl <- as.numeric(quantiletmp[1])      #对应公式中的r-1

  rm <- as.numeric(quantiletmp[2])      #对应公式中的r0

  rh <- as.numeric(quantiletmp[3])      #对应公式中的r1

  p <- unlist(lapply(ratio, function(x){

    if (x > rm){

      z <- (x-rm)/(rh-rm)

      pnorm(z,lower.tail = F)

    }else{

      z <- (rm-x)/(rm-rl)

      pnorm(z,lower.tail = F)

    }

  }))

}

p <- get_significance(data)

http://www.bioinfo-scrounger.com

Significance A and B for protein ratios的更多相关文章

USACO 3.2 ratios 高斯消元
题目原意很简单,就是解一个三元一次方程组直接高斯消元解方程组,枚举最后一列的倍数(k) 注意double的精度,有很多细节需要处理 /* PROB:ratios LANG:C++ */ #inclu ...
洛谷P2729 饲料调配 Feed Ratios
P2729 饲料调配 Feed Ratios 36通过 103提交题目提供者该用户不存在标签USACO 难度普及/提高- 提交讨论题解最新讨论暂时没有讨论题目背景农夫约翰从来只用调 ...
USACO Section 3.2: Feed Ratios
直接暴力搜 /* ID: yingzho1 LANG: C++ TASK: ratios */ #include <iostream> #include <fstream> # ...
USACO3.24Feed Ratios
直接枚举到100水过 /* ID: shangca2 LANG: C++ TASK: ratios */ #include <iostream> #include<cstdio> ...
（转）protein 数据库
最早关注蛋白质互作网络,是在来GDMC第一年的时候,中间停了半年看互作-各种算法,网络分析停滞不前,没想到搞到最后,还是和网络碰到了一起,我总是会潜意识走近给自己第一印象不错的object,包括人.用 ...
ggplot的boxplot添加显著性 | Add P-values and Significance Levels to ggplots | 方差分析
参考:Add P-values and Significance Levels toggplots 多组比较,挑选感兴趣的显示显著性. data("ToothGrowth") he ...
Amber TUTORIAL B5: Simulating the Green Fluorescent Protein
Section 1: Preparing the PDB file 1EMA是本次教程所用的pdb,可以在PDB数据库下载. pdb4amber -i 1EMA.pdb -o gfp.pdb --dr ...
3.The significance of Books 书本的意义
3.The significance of Books 书本的意义 (1)A bookless life is an imcomplete life.Books influence the depth ...
Alpha Level (Significance Level)
1.Alpha Level (Significance Level,显著水平): What is it? 显著性水平α是指当零假设是正确的,但做出了错误决策的概率(即一类错误的概率).Alpha水平( ...

随机推荐

PostgreSQL的架构
是最先进的数据库.他的第一个版本在1989年发布,从那时开始,他得到了很多扩展.根据db-enginers上的排名情况,PostgreSQL目前在数据库领域排名第四. 本篇博客,我们来讨论一下Post ...
php 网页内容抓取
最近抓的2个网站内容的代码列表页抓取:第一种使用phpquery插件,可以快速获取,第二种它是api,所以直接获取 load_third("phpQuery.php"); /** ...
css的书写位置+元素分类
1.css的书写位置 1>行内样式: <span style="color:red;">haha</span> 2>内部样式在style标签中 ...
Jmeter分布式测试笔记
在性能测试过程中,如果要求并发数较大时(例如1000+),单机配置cpu与内存等无法支持,则需要使用Jmeter的分布式测试方法. 一.一般什么情况下需要分布式 1.前辈经验:比如机器i5双核的cpu ...
java 异常捕获小记
java 中异常捕获常用的为: try{ //业务代码 }catch(Exception e){ //异常捕获 }finally{ // 不管有无异常, 最后都会执行到这里 } 在方法体内如果想要把异 ...
javaWeb-监听器Listener
监听器Listener (一)监听器Listener javaEE包括13门规范在课程中主要学习 servlet技术和 jsp技术其中 servlet规范包括三个技术点:servlet lis ...
org.apache.ant实现压缩和解压
<dependency> <groupId>org.apache.ant</groupId> <artifactId>ant</artifactI ...
威胁快报|首爆新型ibus蠕虫，利用热门漏洞疯狂挖矿牟利
一.背景近日阿里云安全团队发现了一起利用多个流行漏洞传播的蠕虫事件.黑客首先利用ThinkPHP远程命令执行等多个热门漏洞控制大量主机,并将其中一台“肉鸡”作为蠕虫脚本的下载源.其余受控主机下载并运 ...
【html、CSS、javascript-12】jquery-效果
一.jQuery 效果- 隐藏和显示通过 jQuery,您可以使用 hide() 和 show() 方法来隐藏和显示 HTML 元素: $("#hide").click(func ...
js &&操作符解析
转载自:http://www.cnblogs.com/huchaoheng/p/4066473.html 前几天看到一个函数,百思不得其解,今天早上醒来看了本js的书,正好讲到操作符的用法,给大家分享 ...

Significance A and B for protein ratios

代码实现

Significance A and B for protein ratios的更多相关文章

随机推荐

热门专题