MetaPhlAn 2:宏基因组进化分析
描述
MetaPhlAn是分析从物种水平分辨率宏基因组鸟枪法测序数据的微生物群落(细菌,古细菌,真核细胞和病毒)的组成的计算工具。从版本2.0,MetaPhlAn还能够确定具体的菌株(在将样品含有先前测序的菌株的不那么频繁的情况下),并跟踪跨越样品菌株的所有物种。
MetaPhlAn 2依靠〜1M唯一的特定分支,标记基因(标记信息文件可以在SRC / utils的/ markers_info.txt.bz2或在这里找到)从〜17000的参考基因组鉴定(〜13500细菌和古细菌,3500〜病毒,和〜110真核),使得:
- 明确的分类任务;
- 有机体相对丰度的准确估计;
- 对于细菌,古细菌,真核生物和病毒种级别分辨率;
- 菌种鉴定和跟踪
- 幅度的加速比的订单相比现有的方法。
- 宏基因组应变水平的人口基因组学
先决条件
MetaPhlAn需要Python 2.7版或更高argparse,临时文件和numpy的安装库(除了为numpy的,他们通常与蟒蛇分布一起安装)。现在还支持Python3。
如果提供的SAM输出BowTie2作为输入,没有额外的前提条件。
如果您想使用BowTie2集成在MetaPhlAn,你需要有BowTie2版本2.0.0或更高版本和Perl安装(bowtie2需要在与执行系统路径和读权限)
如果使用“utils的/ metaphlan_hclust_heatmap.py”的剧本绘制和聚类多MetaPhlAn异形样本,还需要以下Python库:matplotlib,SciPy的,pylab(如果不与MatPlotLib一起安装)。
如果要产生输出为“BIOM”文件,你还需要BIOM安装
MetaPhlAn不紧密地与先进的热图密谋整合hclust2和进化树可视化GraPhlAn。如果使用这样的可视化工具,请参考他们的先决条件。
安装: clone https://bitbucket.org/biobakery/metaphlan2
基本用法:
========== MetaPhlAn 2 分支- 丰 估计 =================
========== MetaPhlAn 2 株 跟踪 ============================
INPUT_FILE 的 输入 文件 可以 是:
* 一个 FASTQ 文件 包含 宏基因组 读取
或
* 一个 BowTie2 产生的 SAM 文件。
OR
* 一个 中介 映射 文件 中 的 宏基因组 产生 由 一个 先前 MetaPhlAn 运行
如果 该 输入 文件 的 丢失, 该 脚本 假定 是 在 输入 时 提供 使用 的 标准
输入, 或 命名 管道。
重要提示: 该 类型 的 输入 需要 到 被 指定 与 - INPUT_TYPE
OUTPUT_FILE 的 选项卡- 分隔 输出 文件 中 的 预测 分类群 的相对 丰度
[ stdout中 ,如果 不 存在] 必需的 参数:
- mpa_pkl MPA_PKL 的 元数据 腌制 MetaPhlAn 文件
- INPUT_TYPE { FASTQ ,FASTA ,multifasta ,multifastq ,bowtie2out ,SAM }
设置 是否 该 输入 是 在 multifasta 文件 的 宏基因组 读取 或
将 SAM 文件 中 的 映射 中 的 读取 反对 在 MetaPhlAn 分贝。
[ 默认的 “ 自动” , 我。Ë 。 该 脚本 将 尝试 以 猜测 的 输入 格式]
MetaPhlAn 2:宏基因组进化分析的更多相关文章
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...
- 【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因
Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...
- 【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
英文名:Genetic architecture of artemisinin-resistant Plasmodium falciparum 中文名:疟原虫青蒿素抗药性的全基因组关联分析 期刊:Na ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- WeakSelf宏的进化(转载)
我们都知道在防止如block的循环引用时,会使用__weak关键字做如下定义: __weak typeof(self) weakSelf = self; 后来,为了方便,不用每次都要写这样一句固定代码 ...
- 内核中container_of宏的详细分析【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637597.html 内核中container_of宏的详细分析 16年2月28日09:00:37 内核中 ...
- 基因组表达分析:如何选择RNA-seq vs. 芯片
基因组表达分析:如何选择RNA-seq vs. 芯片 发布日期:2017-03-29 10:00 DNA 芯片(上图左侧)由附着在表面的核酸探针组成.首先,从样品中提取 RNA 并转化为互补 DNA( ...
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
随机推荐
- C library function - rewind()
Description The C library function void rewind(FILE *stream) sets the file position to the beginning ...
- 深入浅出设计模式——抽象工厂模式(Abstract Factory)
模式动机在工厂方法模式中具体工厂负责生产具体的产品,每一个具体工厂对应一种具体产品,工厂方法也具有唯一性,一般情况下,一个具体工厂中只有一个工厂方法或者一组重载的工厂方法.但是有时候我们需要一个工厂可 ...
- 转{QQ浏览器X5内核问题汇总}
转自https://www.qianduan.net/qqliu-lan-qi-x5nei-he-wen-ti-hui-zong/ 常常被人问及微信中使用的X5内核的问题,其实我也不是很清楚,只知道它 ...
- 【转】IP分片和TCP分段
ZC: 由于 TCP中 MSS 的关系,TCP 不会造成 IP分片和TCP分段 ! 1.http://zhidao.baidu.com/link?url=YCnR8B-1EN4-cgauRtwa-iV ...
- hdu4758Walk Through Squares(ac自动机+dp)
链接 dp[x][y][node][sta] 表示走到在x,y位置node节点时状态为sta的方法数,因为只有2个病毒串,这时候的状态只有4种,根据可走的方向转移一下. 这题输入的是m.N,先列后行, ...
- TCP短连接TIME_WAIT问题解决方法大全
tcp连接是网络编程中最基础的概念,基于不同的使用场景,我们一般区分为“长连接”和“短连接”,长短连接的优点和缺点这里就不详细展开了,有心的同学直接去google查询,本文主要关注如何解决tcp短连接 ...
- remount failed: Operation not permitted ,怎么办呢?
remount failed: Operation not permitted ,怎么办呢? 1. 确定是否正确连接手机了$ adb devices 2. 进入shell$ adb shell 3. ...
- English Literature
The website links of English Literature,which I wanno recommend to U is based on following. 数据结构 - 知 ...
- Node.js 快速了解
最近在学习目前非常火的Node.js 写了一份精简易懂的笔记用于快速了解Node.js技术.如有不对的地方还请多多指教. 注:此篇博文不断更新中. 第一部分:快速了解 1.Node.js是什么? No ...
- 回车键转tab键解决方案一
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...