ASE又走到了关键的一步  要生成能决定是否有差异表达的table.

准备借鉴一下cuffdiff和edgeR 的结果

cuffdiff对差异表达基因的描述:

一共十四列:

第一列, test_id

a unique identifer describing the transcript, gene, primary transcript, or CDS being tested.

eg XLOC_000003

第二列,gene_id

eg XLOC_000003

第三列, gene

第四列, locus

genomic coordinates for easy browsing to the genes or transcripts being tested.

eg contig_23646:3511-3922

第五列, sample1

label (or number if no labels provided) of the first sample being tested

eg Sample_E

第六列, sample2

label (or number if no labels provided) of the second sample being tested

eg Sample_FHM

第七列, status

can be one of OK(test successful), NOTEST(not enough alignments for testing), LOWDATA(too many fragments in locus), or FAIL, when an ill-conditioned covariance matrix or other numerical exception prevents testing

eg OK

第八列 value_1

FPKM of the gene in sample 1

eg 339.567

第九列 value_2

FPKM of the gene in sample 2

eg 465.939

第十列 log2(fold change)

the (base 2 ) log of the fold change 1/2

eg 0.456447

第十一列 test stat

the value of the test statistic used to compute significance of the observed change in FPKM

不懂什么意思 估计要去翻统计书的节奏了

eg 0.361712

第十二列 p_value

the uncorrected p-value of the test statistic

eg 0.4849

第十三列 q_value

the FDR-adjusted p-value of the test statistic

eg 0.756741

第十四列 significant

can be either 'yes' or 'no' , depending on whether p is greater than the FDR after Benjamini-Hochberg correction for multiple-testing

eg no

The FPKM value represents the concentration of a transcript in your samples, normalized for observed read counts and gene length. Thus fields 7,8 represent measurements for your samples and field 9 is simply a ratio of the two. You might look up FPKM or RPKM values if you're unsure what they represent. Fields 11 and 12 are p-value and q-value. These are values associated with the measured variation or uncertainty when you make repeated measurements of something. You should look up what a p-value and an "adjusted p-value" are (the adjusted one is important for you to understand if you're going to do any genomic data analysis). The 13th field is simply a flag based on whether the value in field 11 or 12 is less than 0.05 (I forget which one, but you could figure it out by exploring your data).

edge R 结果对差异表达基因的描述:

Differential expression analysis of RNA-seq and digital gene expression profiles with biological replication.  Uses empirical Bayes estimation and exact tests based on the negative binomial distribution.  Also useful for differential signal analysis with other types of genome-scale count data.(貌似两者采用的分布模型是不一样的哦~~)

by freemao

FAFU

free_mao@qq.com

cuffdiff 和 edgeR 对差异表达基因的描述的更多相关文章

  1. RNA-seq差异表达基因分析之TopHat篇

    RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...

  2. 使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析

    前言 本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquiti ...

  3. 使用Trinity拼接以及分析差异表达一个小例子

    使用Trinity拼接以及分析差异表达一个小例子  2017-06-12 09:42:47     293     0     0 Trinity 将测序数据分为许多独立的de Brujin grap ...

  4. 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌

    使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...

  5. Differential expression analysis for paired RNA-seq data 成对RNA-seq数据的差异表达分析

    Differential expression analysis for paired RNA-seq data 抽象背景:RNA-Seq技术通过产生序列读数并在不同生物条件下计数其频率来测量转录本丰 ...

  6. RNA-Seq differential expression analysis: An extended review and a software tool RNA-Seq差异表达分析: 扩展评论和软件工具

    RNA-Seq differential expression analysis: An extended review and a software tool   RNA-Seq差异表达分析: 扩展 ...

  7. 差异基因分析:fold change(差异倍数), P-value(差异的显著性)

    在做基因表达分析时必然会要做差异分析(DE) DE的方法主要有两种: Fold change t-test fold change的意思是样本质检表达量的差异倍数,log2 fold change的意 ...

  8. edgeR使用学习【转载】

    转自:http://yangl.net/2016/09/27/edger_usage/ 1.Quick start 2. 利用edgeR分析RNA-seq鉴别差异表达基因: #加载软件包 librar ...

  9. Sensitivity, specificity, and reproducibility of RNA-Seq differential expression calls RNA-Seq差异表达调用的灵敏度 特异性 重复性

    Sensitivity, specificity, and reproducibility of RNA-Seq differential expression calls RNA-Seq差异表达调用 ...

随机推荐

  1. ext afteredit

    ext afteredit详解 grid.on("afteredit",afterEidt,grid); function(obj) { obj.row;;//修改过的行从0开始 ...

  2. redhat enterprixe 5.0 NFS服务配置与管理

    一.了解NFS Samba 是主要用于实现Linux和Windows操作系统之间文件共享的协议,而NFS则是实现UNIX和Linux操作系统之间文件共享的协议. NFS可以把网络上远程的文件挂载到本机 ...

  3. 浅谈C++源码的过国内杀软的免杀

    以下只是简单的思路和定位.也许有人秒过,但是不要笑话我写的笨方法.定位永远是过期不了的. 其实这里废话一下 , 本人并不是大牛 ,今天跟大家分享下 .所以写出这篇文章.(大牛飘过) 只是个人实战的经验 ...

  4. HDU 4405 Aeroplane chess 概率DP 难度:0

    http://acm.hdu.edu.cn/showproblem.php?pid=4405 明显,有飞机的时候不需要考虑骰子,一定是乘飞机更优 设E[i]为分数为i时还需要走的步数期望,j为某个可能 ...

  5. JSON.NET 教程(一)

    下载地址:http://www.newtonsoft.com/json 参考官网文档:http://www.newtonsoft.com/json/help/html/SerializingJSON. ...

  6. python下的复杂网络编程包networkx的安装及使用

    由于py3.x与工具包的兼容问题,这里采用py2.7 1.python下的复杂网络编程包networkx的使用: http://blog.sina.com.cn/s/blog_720448d30101 ...

  7. jsp:useBean标准动作

    1.bean法则 JavaBean和企业JavaBean是完全不相干的两个东西.普通的非企业JavaBean需要满足一定的规范才能被JSP和servlet使用: 1)必须有一个无参数的公共构造函数: ...

  8. POJ 2296 二分+2-sat

    题目大意: 给定n个点,给每个点都安排一个相同的正方形,使这个点落在正方形的下底边的中间或者上底边的中间,并让这n个正方形不出现相互覆盖,可以共享同一条边,求 这个正方形最大的边长 这里明显看出n个点 ...

  9. 合理利用 vs2013的性能分析跟诊断

    选择对应的项目==> 我正常是选择采样 就包括里面的一些耗时.  挺好用的. 可以根据热路径 还有访问的占比.知道哪个环节占用的访问时间 还有性能耗能多. 可以点进去 跟踪跟修改

  10. JavaScript之document对象使用

    1.document 对象常用的有三种: A.document.getElementById:通过html元素的Id,来获取html对象.适用于单个的html元素. B.document.getEle ...