最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下:

1. mixOmics

应该是在多组学领域知名度最高的一个R包,有专门的团队,做了十余年了,引用量也比较高。

官网:http://mixomics.org/

文章:mixOmics: An R package for ‘omics feature selection and multiple data integration

Github:https://github.com/mixOmicsTeam/mixOmics

Bookdown:https://mixomicsteam.github.io/Bookdown/

特点:

  • 组学数据广,基因/转录/蛋白/代谢都有涉及(是我的榜样);
  • 独特的多变量降维分析和可视化方法(我统计没学好,所以不做太多统计方法,重点在于可视化,包括多种关联角度的展示方式)。

主要内容:

统计方法:PCA/IPCA/CCA/PLS/PLS-DA/MixMC/MINT/DIABLO

可视化:2D和3D散点图/相关性网络/聚类/相关性圈图/箭头图/DIABLO圈图/载荷图

此外,这个包还自带了不少demo数据,具体可看官方文档。

2. tRanslatome

2014年就发表了,好在一直都有维护。

文章:tRanslatome: an R/Bioconductor package to portray translational control

Bioconductor:https://bioconductor.org/packages/release/bioc/html/tRanslatome.html

作者博客:http://www.mybiosoftware.com/tag/translatome

Github:https://github.com/tomateba/tRanslatome(五年前的源码)

特点:

  • 组学:主要是针对基因表达量的关联,包括转录组、翻译组和蛋白组;
  • 统计方法:Rank Product, Translational Efficiency, t-test, Limma, ANOTA, DESeq, edgeR
  • 可视化:scatterplots, histograms, MA plots, standard deviation (SD) plots, coefficient of variation (CV) plots

3. OmicsARules

最近新出的一个R包,创建了一种新的关联方法。

文章:OmicsARules: a R package for integration of multi-omics datasets via association rules mining

Github:https://github.com/BioinformaticsSTU/OmicsARules

特点:

  • 主要针对基因组和转录组数据,包括基因突变位点和非编码RNA;
  • 发明一种Lamda3的度量方法创建关联规则,可视化不是重点。

4. iCluster / iClusterPlus

十年前开发的iCluster算法(联合潜在变量模型),针对癌症数据多组学聚类。去年的时候又开发了一个新的iClusterPlus包,做了一些升级。

文章1:Integrative clustering of multiple genomic data types using a joint latent variable model with application to breast and lung cancer subtype analysis

Github:https://github.com/cran/iCluster

Bioconductor:https://bioconductor.org/packages/release/bioc/html/iClusterPlus.html

文章2:A fully Bayesian latent variable model for integrative clustering analysis of multi-type omics data

这种基于模型算法的工具我只能望洋兴叹,会用就不错了。

5. integrOmics

十多年的工具,虽然当年发了Bioinformatics,后面没有维护更新,废了。

文章:integrOmics: an R package to unravel relationships between two omics datasets

Github:https://github.com/cran/integrOmics

6. moCluster

这也是一种算法,和icluster类似,主要整合数据聚类,用于细胞或疾病分子分型等。应用场景相对比较单一。

7. MCIA

这个包又可称omicade4: Multiple co-inertia analysis of omics datasets,即多元协惯量分析。一种多元统计分析方法,类似于PCA的展示吧,比较有限。

Bioconductor:http://bioconductor.org/packages/release/bioc/html/omicade4.html

Github:https://github.com/aedin/omicade4

8. 其他

其他还有不少R包做组学数据整合,或是基于新的算法,或是仅针对基因突变和基因表达关系等方面进行关联,相对而言比较冷门,如:

  • CNAmet
  • PLRS
  • NuChart
  • MOO
  • Mergeeomics(这个包主要做GWAS/TWAS/EWAS/eQTL等,有点意思)

除了以上常用的R包,更多的多组学工具和方法可参考这一篇综述:https://jme.bioscientifica.com/view/journals/jme/62/1/JME-18-0055.xml

多组学分析及可视化R包的更多相关文章

  1. MetaboAnalyst的多组学分析

    MetaboAnalyst是做代谢的R包,功能十分强大.也开发了web版本,代谢组学的分析这里不介绍,主要讲讲它开发的多组学分析的相关内容. 既然是做代谢的工具,即使是增加了多组学内容,肯定也是以代谢 ...

  2. 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)

    发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...

  3. 解读人:范徉,Methylome and Metabolome Analyses Reveal Adaptive Mechanisms in Geobacter sulfurreducens Grown on Different Terminal Electron Acceptors(甲基化组学和代谢组学分析发现Geobacter sulfurreducens生长在不同电子终受体中的适应机制)

    发表时间: (2019年4月) IF:3.950 单位: Fujian Provincial Key Laboratory of Soil Environmental Health and Regul ...

  4. R包MetaboAnalystR安装指南(Linux环境非root)

    前言 这是代谢组学数据分析的一个R包,包括用于代谢组学数据分析.可视化和功能注释等众多功能.最近有同事在集群中搭建蛋白和代谢流程,安装这个包出现了问题,于是我折腾了一上午. 这个包的介绍在:https ...

  5. Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adenomas 非靶向脂质组学揭示非功能人类脑垂体瘤中的特异性脂质 (解读人:胡丹丹)

    文献名:Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adeno ...

  6. 可视化数据包分析工具-CapAnalysis

    可视化数据包分析工具-CapAnalysis 我们知道,Xplico是一个从pcap文件中解析出IP流量数据的工具,本文介绍又一款实用工具-CapAnalysis(可视化数据包分析工具),将比Xpli ...

  7. R包 randomForest 进行随机森林分析

    randomForest 包提供了利用随机森林算法解决分类和回归问题的功能:我们这里只关注随机森林算法在分类问题中的应用 首先安装这个R包 install.packages("randomF ...

  8. 【GS模型】使用R包sommer进行基因组选择的GBLUP和RRBLUP分析?

    目录 简介 GS示例代码 简介 R包sommer内置了C++,运算速度还是比较快的,功能也很丰富,可求解各种复杂模型.语法相比于lme4包也要好懂一些. 建议查看文档:vignette("v ...

  9. maftools|TCGA肿瘤突变数据的汇总,分析和可视化

    本文首发于公众号“生信补给站”,https://mp.weixin.qq.com/s/WG4JHs9RSm5IEJiiGEzDkg 之前介绍了使用maftools | 从头开始绘制发表级oncoplo ...

随机推荐

  1. [对对子队]Alpha阶段项目展示博客

    Alpha阶段项目展示博客 1 团队成员的简介和个人博客地址 成员 头像 岗位 博客 个人介绍 黄贤昊 PM 17373253 喜欢玩游戏和做游戏,项目经验基本都和游戏相关,擅长摸鱼,偶尔敬业. 刘子 ...

  2. Flutter的环境配置以及一些常见问题

    flutter & AndroidStudio flutter的下载与配置 flutter是Google推出的基于Dart语言开发的跨平台开源UI框架,能够支持安卓与iOS. flutter框 ...

  3. the Agiles Scrum Meeting 11

    会议时间:2020.4.20 20:00 1.每个人的工作 在这次例会上,我们对上周完成的工作进行了总结. 本周已完成的工作 个人结对项目增量开发组 tq: 创建广播功能 修复纯英文数字可能溢出bug ...

  4. FastAPI 学习之路(五十六)将token存放在redis

    在之前的文章中,FastAPI 学习之路(二十九)使用(哈希)密码和 JWT Bearer 令牌的 OAuth2,FastAPI 学习之路(二十八)使用密码和 Bearer 的简单 OAuth2,Fa ...

  5. 2021.9.21考试总结[NOIP模拟58]

    T1 lesson5! 开始以为是个无向图,直接不懂,跳去T2了. 之后有看了一眼发现可暴力,于是有了\(80pts\). 发现这个图是有拓扑序的,于是可以用拓扑排序找最长路径.先找原图内在最长路径上 ...

  6. 关于linux的fork的一点学习总结

    最近操作系统的实验要用到fork,于是去搜索了一下资料,很幸运地在博客中找到一篇深度好文: http://blog.csdn.net/jason314/article/details/5640969 ...

  7. 第11课 OpenGL 飘动的旗帜

    飘动的旗帜: 这一课从第六课的代码开始,创建一个飘动的旗帜.我相信在这课结束的时候,你可以掌握纹理映射和混合操作. 大家好!对那些想知道我在这里作了些什么的朋友,您可以先按文章的末尾所列出的链接,下载 ...

  8. JDK源码阅读(5):HashTable类阅读笔记

    HashTable public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, ...

  9. 01 | let 和 const语法 | es6

    01 | let 和 const语法 ES6新增了let命令,用来声明变量.它的用法类似于var,但也有区别 let 和 var 1.作用范围不同 var声明的变量在全局范围内都有效,所以全局只有一个 ...

  10. Linux(kali)基础设置

    本笔记的友情链接 常用目录介绍 boot 存放启动文件 dev 存放设备文件 etc 存放配置文件 home 普通用户家目录,以/home/$username的方式存放 media 移动存储自动挂载目 ...