火山图 Volcano plot
在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化。由于它的形成像火山喷发的样子,所以被称为火山图。和上文讲的曼哈顿图类似。
 
火山图基本元素
火山图也有很多种样式,在生物学高通量测序结果中,常见有的X和Y轴分别为aboundance 和 fold-change,或p-value和fold-change两种样式。如上图中为p-value versus fold-change的样式,,先此为例进行图中基本元素解读:
- X轴:通常为两组基因表达或OTU相对丰度比较的变化倍数取2的对数log2(Fold change)。 取log2的原因:由于两数相比,倍数取值范围为0 - 正无穷,上调的倍数为1 - 正无穷,比较容易理解;而下调倍数为0-1很难理解。如果取对数可将倍数以1为中心左右对称,取2的对数是因为经验上2倍差异比较常用,故取log2变换既可以使上调或下调数据对称(上、下调的目标同等重要,无偏好),而且坐标轴1个单位刻度的变化即为2倍差异(方便快速筛选足够差异的点);
- Y轴:两组基因表达或OTU相对丰度相比统计上的显著性Pvalue值,通常取负对数10变换 -log10(P-value)。取负对数与转换下调表达数值原理类似,将0-1范围pvalue数据变为0-正无穷,且将越小越显著的P-vale转换为与显著性正相关,方便观察显著差异目标。Pvalue取负对数10转换后,坐标轴数值2,3对应0.01和0.001的显著阈值,便于理解。有时也用-ln或-log2对Pvalue值进行转换。
- 图中点:代表每个基因或OTU在两组相比时差异倍数和显著性的值;通常将显著变化并且差异倍数大于指定阈值的点规定为显著差异的结果,常用颜色高亮显示(图中绿色点)。有些重点关注的点可以添加箭头或标签进一步突出显示(图中绿色箭头)。有时还会有点大小代表相关丰度,点的形状代表其它一些属性,如物种分类信息等。
 
火山图绘制
常用R语言的ggplot2绘制。接一来的统计和绘图课会有详细源代码和分析实例。
 
看图实战(Result)
 
示例1. 各比较组间上/下调显著差异OTU的数量
这篇文章分析了水稻根不同区域的细菌组成,16S分析文章较系统的作品,两年被引用147次,推荐阅读
图2.A 水稻根不同生态位相对于土壤中显著差异的OTU
1. 图中元素解释:不同于上面例子,此图为Fold change versus Average Abundance样式,大家注意一下,常见就这两种。
- X轴标签为Log10(Average Abundance),是相对丰度平均值 取10的对数,这里用X轴展示了OTU的丰度,而不是pvalue值。其实作者X标题可能将Log2错写为了Log10,因为OTU相对丰度分析常用百分、千分和百万分数,即使是最大的百万分数取Log10最大值仅为6,而不会坐标轴刻度至15,这种0-15的刻度是典型的Log2(RPM)百万分数的数据。
- Y轴标签为Log10(Fold Change)是指两组间比较差异倍数经10的对数变换;标签也可能是错误的,因为想让倍数对称必须取负对数,而且通常用-Log2,Log10的值是10时就有上百亿倍,扩增子不可能有这么大的差异或深度(扩增子差异倍数为了防止分母为零需要加某值,因此也减小了差异倍数,不会有非常大的情况;扩增子测序深度一般只有几千至几十万,不可能有上亿的量)。
- 图中的每个点代表一个OTU,其中图上部有颜色的点为显著富集(enriched)的OTU,下部有颜色的点为显著下降(depleted)的OTU,黑灰色的点为没有显著差异的OTU;图中标记的数字为显著富集或下降的OTU的数量;
2. 图表结果:图中展示了从根际、根表到根内与土壤相比,所有OTU的相对丰度和差异倍数,其中高亮显示显著富集或下降差异OTU和数量;
3. 图表结论和规律:从根际-根表-根内,从外到内,显著差异的OTU总数量是逐渐上升的,代表变化越来越大;其中根际有较多富集的OTU,而根表和根内则较多为下降的OTU;
4. 经验和技巧:本图虽然有X/Y轴标签描述有待商榷,但许多优点值得学习;
1. 大家经常看到的看火山图都是竖起的,左、右部分高亮的为差异OTU,而作者将图像放倒(顺时针旋转90度),以Y轴零刻度为分界面,上部为富集OTU,下部为下降OTU也很直观,而且耳目一新;
2. 图中差异OTU的数量标出,不用读者自己去估计,直接明了,感觉信息量更丰富;
3. 三组图并排且变化明显,不用多説,读者自然会去比较差异,引导读者参与分析比较和规律发现。

扩增子图表解读5火山图:差异OTU的数量及变化规律的更多相关文章

  1. 扩增子图表解读3热图:差异菌、OTU及功能

    热图是使用颜色来展示数值矩阵的图形.通常还会结合行.列的聚类分析,以表达实验数据多方面的结果.  热图在生物学领域应用广泛,尤其在高通量测序的结果展示中很流行,如样品-基因表达,样品-OTU相对丰度矩 ...

  2. 扩增子图表解读6韦恩图:比较组间共有和特有OTU或分类单元

    韦恩图 Venn Diagram Venn Diagram,也称韦恩图.维恩图.文氏图,用于显示元素集合重叠区域的图示.   韦图绘制工具 常用R语言的VennDiagram包绘制,输出PDF格式方便 ...

  3. 扩增子图表解读4曼哈顿图:差异分类级别Taxonomy

    曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点.它得名源于样式与曼哈顿天际线相似(如下图 ...

  4. 扩增子图表解读8网络图:节点OTU或类Venn比较

    网络图 Network 网络图虽然给人高大上的感觉,但是由于信息太多,无法给读者提供读有效的可读信息或是读者不知道该理解什么,总是让人望尔却步.那是因为大家太不了解网络,自己读不懂网络想表达的意思及其 ...

  5. 扩增子图表解读1箱线图:Alpha多样性

    箱线图 箱形图(Box-plot)又称为盒须图.盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图.因形状如箱子而得名.在宏基因组领域,常用于展示样品组中各样品Alpha多样性的分布 第一种情 ...

  6. 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)

    散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...

  7. 扩增子分析解读6进化树 Alpha Beta多样性

    分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息.   接下来我们学习对OTU序列的 ...

  8. 扩增子分析解读5物种注释 OTU表操作

    本节课程,需要先完成<扩增子分析解读>系列之前的操作 1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 4去嵌合体 非细菌序列 ...

  9. 扩增子分析解读4去嵌合体 非细菌序列 生成代表性序列和OTU表

    本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类   先看一下扩增子分析的整体流程,从下向上逐层分析 分 ...

随机推荐

  1. sql 分组取每组的前n条或每组的n%(百分之n)的数据

    sql 分组取每组的前n条或每组的n%(百分之n)的数据 sql keyword: SELECT * ,ROW_NUMBER() OVER(partition by b.UserID order by ...

  2. 深入理解MVC C#+HtmlAgilityPack+Dapper走一波爬虫 StackExchange.Redis 二次封装 C# WPF 用MediaElement控件实现视频循环播放 net 异步与同步

    深入理解MVC   MVC无人不知,可很多程序员对MVC的概念的理解似乎有误,换言之他们一直在错用MVC,尽管即使如此软件也能被写出来,然而软件内部代码的组织方式却是不科学的,这会影响到软件的可维护性 ...

  3. HDU 1159 Common Subsequence (动规+最长公共子序列)

    Common Subsequence Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Other ...

  4. python 文档生成 字符串替换

    替换 fnr, fnr_source, fnw = 'my.py.html', '产品清单.txt', 'my.py.res.html'd_source = {}with open(fnr_sourc ...

  5. java SWing事件调用的两种机制

      Java(91)  /** * java swing中事件调用的两种机制: * (一)响应机制 * (二)回调机制 */ package test; import java.awt.*; impo ...

  6. vs2010打开vs2012项目

    修改.sln文件的前两行 修改前: Microsoft Visual Studio Solution File, Format Version 12.00 # Visual Studio 2012 修 ...

  7. PCB SQL SERVER 发送邮件(异步改同步)

    采用SQL SERVER发送邮件是队列方式(异步)发送邮件,所以在我们执行发送邮件后,无法立即获取到邮件是否发送成功了,而在PCB行业实际应用中是需要立即获取发送邮件是否成功的状态来决定下一步逻辑该如 ...

  8. PCB genesis Slot槽转钻孔(不用G85命令)实现方法

    PCB钻Slot槽一般都采用G85命令钻槽孔,而采用G85命令工程CAM无法准确的知道Slot槽钻多少个孔,并不能决定钻槽孔的顺序,因为采用G85命令钻孔密度与钻槽顺序由钻机本身决定的.在这里介绍一种 ...

  9. poj3264Balanced Lineup(倍增ST表)

    Balanced Lineup Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 52328   Accepted: 24551 ...

  10. Kafka详解与总结(五)

    Kafka持久化 1. 概述 Kafka大量依赖文件系统去存储和缓存消息.对于硬盘有个传统的观念是硬盘总是很慢,这使很多人怀疑基于文件系统的架构能否提供优异的性能.实际上硬盘的快慢完全取决于使用它的方 ...