火山图 Volcano plot
在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化。由于它的形成像火山喷发的样子,所以被称为火山图。和上文讲的曼哈顿图类似。
 
火山图基本元素
火山图也有很多种样式,在生物学高通量测序结果中,常见有的X和Y轴分别为aboundance 和 fold-change,或p-value和fold-change两种样式。如上图中为p-value versus fold-change的样式,,先此为例进行图中基本元素解读:
- X轴:通常为两组基因表达或OTU相对丰度比较的变化倍数取2的对数log2(Fold change)。 取log2的原因:由于两数相比,倍数取值范围为0 - 正无穷,上调的倍数为1 - 正无穷,比较容易理解;而下调倍数为0-1很难理解。如果取对数可将倍数以1为中心左右对称,取2的对数是因为经验上2倍差异比较常用,故取log2变换既可以使上调或下调数据对称(上、下调的目标同等重要,无偏好),而且坐标轴1个单位刻度的变化即为2倍差异(方便快速筛选足够差异的点);
- Y轴:两组基因表达或OTU相对丰度相比统计上的显著性Pvalue值,通常取负对数10变换 -log10(P-value)。取负对数与转换下调表达数值原理类似,将0-1范围pvalue数据变为0-正无穷,且将越小越显著的P-vale转换为与显著性正相关,方便观察显著差异目标。Pvalue取负对数10转换后,坐标轴数值2,3对应0.01和0.001的显著阈值,便于理解。有时也用-ln或-log2对Pvalue值进行转换。
- 图中点:代表每个基因或OTU在两组相比时差异倍数和显著性的值;通常将显著变化并且差异倍数大于指定阈值的点规定为显著差异的结果,常用颜色高亮显示(图中绿色点)。有些重点关注的点可以添加箭头或标签进一步突出显示(图中绿色箭头)。有时还会有点大小代表相关丰度,点的形状代表其它一些属性,如物种分类信息等。
 
火山图绘制
常用R语言的ggplot2绘制。接一来的统计和绘图课会有详细源代码和分析实例。
 
看图实战(Result)
 
示例1. 各比较组间上/下调显著差异OTU的数量
这篇文章分析了水稻根不同区域的细菌组成,16S分析文章较系统的作品,两年被引用147次,推荐阅读
图2.A 水稻根不同生态位相对于土壤中显著差异的OTU
1. 图中元素解释:不同于上面例子,此图为Fold change versus Average Abundance样式,大家注意一下,常见就这两种。
- X轴标签为Log10(Average Abundance),是相对丰度平均值 取10的对数,这里用X轴展示了OTU的丰度,而不是pvalue值。其实作者X标题可能将Log2错写为了Log10,因为OTU相对丰度分析常用百分、千分和百万分数,即使是最大的百万分数取Log10最大值仅为6,而不会坐标轴刻度至15,这种0-15的刻度是典型的Log2(RPM)百万分数的数据。
- Y轴标签为Log10(Fold Change)是指两组间比较差异倍数经10的对数变换;标签也可能是错误的,因为想让倍数对称必须取负对数,而且通常用-Log2,Log10的值是10时就有上百亿倍,扩增子不可能有这么大的差异或深度(扩增子差异倍数为了防止分母为零需要加某值,因此也减小了差异倍数,不会有非常大的情况;扩增子测序深度一般只有几千至几十万,不可能有上亿的量)。
- 图中的每个点代表一个OTU,其中图上部有颜色的点为显著富集(enriched)的OTU,下部有颜色的点为显著下降(depleted)的OTU,黑灰色的点为没有显著差异的OTU;图中标记的数字为显著富集或下降的OTU的数量;
2. 图表结果:图中展示了从根际、根表到根内与土壤相比,所有OTU的相对丰度和差异倍数,其中高亮显示显著富集或下降差异OTU和数量;
3. 图表结论和规律:从根际-根表-根内,从外到内,显著差异的OTU总数量是逐渐上升的,代表变化越来越大;其中根际有较多富集的OTU,而根表和根内则较多为下降的OTU;
4. 经验和技巧:本图虽然有X/Y轴标签描述有待商榷,但许多优点值得学习;
1. 大家经常看到的看火山图都是竖起的,左、右部分高亮的为差异OTU,而作者将图像放倒(顺时针旋转90度),以Y轴零刻度为分界面,上部为富集OTU,下部为下降OTU也很直观,而且耳目一新;
2. 图中差异OTU的数量标出,不用读者自己去估计,直接明了,感觉信息量更丰富;
3. 三组图并排且变化明显,不用多説,读者自然会去比较差异,引导读者参与分析比较和规律发现。

扩增子图表解读5火山图:差异OTU的数量及变化规律的更多相关文章

  1. 扩增子图表解读3热图:差异菌、OTU及功能

    热图是使用颜色来展示数值矩阵的图形.通常还会结合行.列的聚类分析,以表达实验数据多方面的结果.  热图在生物学领域应用广泛,尤其在高通量测序的结果展示中很流行,如样品-基因表达,样品-OTU相对丰度矩 ...

  2. 扩增子图表解读6韦恩图:比较组间共有和特有OTU或分类单元

    韦恩图 Venn Diagram Venn Diagram,也称韦恩图.维恩图.文氏图,用于显示元素集合重叠区域的图示.   韦图绘制工具 常用R语言的VennDiagram包绘制,输出PDF格式方便 ...

  3. 扩增子图表解读4曼哈顿图:差异分类级别Taxonomy

    曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点.它得名源于样式与曼哈顿天际线相似(如下图 ...

  4. 扩增子图表解读8网络图:节点OTU或类Venn比较

    网络图 Network 网络图虽然给人高大上的感觉,但是由于信息太多,无法给读者提供读有效的可读信息或是读者不知道该理解什么,总是让人望尔却步.那是因为大家太不了解网络,自己读不懂网络想表达的意思及其 ...

  5. 扩增子图表解读1箱线图:Alpha多样性

    箱线图 箱形图(Box-plot)又称为盒须图.盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图.因形状如箱子而得名.在宏基因组领域,常用于展示样品组中各样品Alpha多样性的分布 第一种情 ...

  6. 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)

    散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...

  7. 扩增子分析解读6进化树 Alpha Beta多样性

    分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息.   接下来我们学习对OTU序列的 ...

  8. 扩增子分析解读5物种注释 OTU表操作

    本节课程,需要先完成<扩增子分析解读>系列之前的操作 1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 4去嵌合体 非细菌序列 ...

  9. 扩增子分析解读4去嵌合体 非细菌序列 生成代表性序列和OTU表

    本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类   先看一下扩增子分析的整体流程,从下向上逐层分析 分 ...

随机推荐

  1. 条款39: 避免 "向下转换" 继承层次

    基类指针不能调用派生类的独有的成员,即使基类指针指向派生类对象,因为编译器是根据指针的静态类型来确定调用对象在内存中占据的空间的.此时可以使用static_cast来转换,但不要这么做,因为向下转换难 ...

  2. Python基础--高速改造:字符串

    Python的字符串值得一说. 先看: >>>"Hello world!" 'Hello world!' 我们写是双引號,可是打印出来后是单引號. 差别何在? 答 ...

  3. iOS中的成员变量,实例变量,属性变量

    在ios第一版中: 我们为输出口同时声明了属性和底层实例变量,那时,属性是oc语言的一个新的机制,并且要求你必须声明与之对应的实例变量,例如: 注意:(这个是以前的用法) @interface MyV ...

  4. 数学之路-python计算实战(1)-ubuntu安装pypy

    Get the source code. The following packages contain the source at the same revision as the above bin ...

  5. BestCoder Round #61 (div.2) C.Subtrees dfs

    Subtrees   问题描述 一棵有N个节点的完全二叉树,问有多少种子树所包含的节点数量不同. 输入描述 输入有多组数据,不超过1000组. 每组数据输入一行包含一个整数N.(1\leq N\leq ...

  6. UVA 1640(DFS)

    题意:给你a,b两个数 问你a b区间中0 9出现的次数 其实就是求1-n中0-9出现的次数 ans[n]   答案就是ans[b]-ans[a-1] 怎么求的话看代码吧 #include<io ...

  7. vuejs 中如何优雅的获取 Input 值

    http://www.sunzhongwei.com/how-to-get-input-value-in-vuejs

  8. Kubernetes 集群中使用 Helm 搭建 Spinnaker

    在我们部署Spinnaker之前,我们需要一个YAML格式的配置文件,它会包含了一些配置信息.可以从Spinnaker Helm Chart repository[2]获得这个文件. $curl -L ...

  9. 9.9 NOIP模拟题

    9.9 NOIP模拟题 T1 两个圆的面积求并 /* 计算圆的面积并 多个圆要用辛普森积分解决 这里只有两个,模拟计算就好 两圆相交时,面积并等于中间两个扇形面积减去两个三角形面积 余弦定理求角度,算 ...

  10. 像素缓冲区对象PBO 记录

    像素缓冲区对象PBO 记录 和所有的缓冲区对象一样,它们都存储在GPU内存中,我们可以访问和填充PBO,方法和其他的缓冲区一样. 当一个PBO被绑定到GL_PIXEL_PACK_BUFFER,任何读取 ...