MetaPhlAn 2:宏基因组进化分析
描述
MetaPhlAn是分析从物种水平分辨率宏基因组鸟枪法测序数据的微生物群落(细菌,古细菌,真核细胞和病毒)的组成的计算工具。从版本2.0,MetaPhlAn还能够确定具体的菌株(在将样品含有先前测序的菌株的不那么频繁的情况下),并跟踪跨越样品菌株的所有物种。
MetaPhlAn 2依靠〜1M唯一的特定分支,标记基因(标记信息文件可以在SRC / utils的/ markers_info.txt.bz2或在这里找到)从〜17000的参考基因组鉴定(〜13500细菌和古细菌,3500〜病毒,和〜110真核),使得:
- 明确的分类任务;
- 有机体相对丰度的准确估计;
- 对于细菌,古细菌,真核生物和病毒种级别分辨率;
- 菌种鉴定和跟踪
- 幅度的加速比的订单相比现有的方法。
- 宏基因组应变水平的人口基因组学
先决条件
MetaPhlAn需要Python 2.7版或更高argparse,临时文件和numpy的安装库(除了为numpy的,他们通常与蟒蛇分布一起安装)。现在还支持Python3。
如果提供的SAM输出BowTie2作为输入,没有额外的前提条件。
如果您想使用BowTie2集成在MetaPhlAn,你需要有BowTie2版本2.0.0或更高版本和Perl安装(bowtie2需要在与执行系统路径和读权限)
如果使用“utils的/ metaphlan_hclust_heatmap.py”的剧本绘制和聚类多MetaPhlAn异形样本,还需要以下Python库:matplotlib,SciPy的,pylab(如果不与MatPlotLib一起安装)。
如果要产生输出为“BIOM”文件,你还需要BIOM安装
MetaPhlAn不紧密地与先进的热图密谋整合hclust2和进化树可视化GraPhlAn。如果使用这样的可视化工具,请参考他们的先决条件。
安装: clone https://bitbucket.org/biobakery/metaphlan2
基本用法:
========== MetaPhlAn 2 分支- 丰 估计 =================
========== MetaPhlAn 2 株 跟踪 ============================
INPUT_FILE 的 输入 文件 可以 是:
* 一个 FASTQ 文件 包含 宏基因组 读取
或
* 一个 BowTie2 产生的 SAM 文件。
OR
* 一个 中介 映射 文件 中 的 宏基因组 产生 由 一个 先前 MetaPhlAn 运行
如果 该 输入 文件 的 丢失, 该 脚本 假定 是 在 输入 时 提供 使用 的 标准
输入, 或 命名 管道。
重要提示: 该 类型 的 输入 需要 到 被 指定 与 - INPUT_TYPE
OUTPUT_FILE 的 选项卡- 分隔 输出 文件 中 的 预测 分类群 的相对 丰度
[ stdout中 ,如果 不 存在] 必需的 参数:
- mpa_pkl MPA_PKL 的 元数据 腌制 MetaPhlAn 文件
- INPUT_TYPE { FASTQ ,FASTA ,multifasta ,multifastq ,bowtie2out ,SAM }
设置 是否 该 输入 是 在 multifasta 文件 的 宏基因组 读取 或
将 SAM 文件 中 的 映射 中 的 读取 反对 在 MetaPhlAn 分贝。
[ 默认的 “ 自动” , 我。Ë 。 该 脚本 将 尝试 以 猜测 的 输入 格式]
MetaPhlAn 2:宏基因组进化分析的更多相关文章
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...
- 【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因
Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...
- 【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
英文名:Genetic architecture of artemisinin-resistant Plasmodium falciparum 中文名:疟原虫青蒿素抗药性的全基因组关联分析 期刊:Na ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- WeakSelf宏的进化(转载)
我们都知道在防止如block的循环引用时,会使用__weak关键字做如下定义: __weak typeof(self) weakSelf = self; 后来,为了方便,不用每次都要写这样一句固定代码 ...
- 内核中container_of宏的详细分析【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637597.html 内核中container_of宏的详细分析 16年2月28日09:00:37 内核中 ...
- 基因组表达分析:如何选择RNA-seq vs. 芯片
基因组表达分析:如何选择RNA-seq vs. 芯片 发布日期:2017-03-29 10:00 DNA 芯片(上图左侧)由附着在表面的核酸探针组成.首先,从样品中提取 RNA 并转化为互补 DNA( ...
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
随机推荐
- Deep Learning Papers Reading Roadmap
Deep Learning Papers Reading Roadmap https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadm ...
- 《BI那点儿事—数据的艺术》理解维度数据仓库——事实表、维度表、聚合表
事实表 在多维数据仓库中,保存度量值的详细值或事实的表称为“事实表”.一个按照州.产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似. Sate Product Mouth U ...
- 从ASP了解Http Buffer
he Buffer property specifies whether to buffer the output or not. When the output is buffered, the s ...
- javascript事件代理(Event Delegation)
看了几篇文章,放上来供参考 司徒正美的文章,Event Delegation Made Easy --------------------------------------------------- ...
- PCA理论与实践
PCA作用: 降维,PCA试图在力保数据信息丢失最少的原则下,用较少的综合变量代替原本较多的变量,而且综合变量间互不相关,减少冗余以及尽量消除噪声. PCA数学原理: 设 是维向量 想经过线性变换 ...
- Yii 检查输入的数据是否已经存在
只需要在对应的Model文件中的rules方法里面加入 array('username', 'unique', 'message'=>'{attribute}已存在'),//username是需 ...
- Queue的push和front操作
#include <queue> #include <cstdlib> using namespace std; int main(){ queue<int> qu ...
- uva 1151(最小生成树,枚举子集)
题意:平面上有n个点(1<=N<=1000),你的任务是让所有n个点连通,为此,你可以新建一些边,费用等于两个端点的欧几里得距离的平方.另外还有q(0<=q<=8)个套餐,可以 ...
- JAVA OOP 基础知识提纲
OOP: 面向对象: 认识事物的一个过程,是整体(特征/行为) 认识事物的方式.人类认识事物的自然思维习惯. 对象及类 对象是实实在在具体存在的东西,主要是从两个角度(行为,特征)去观察 类:是一组具 ...
- WCF初探-17:WCF数据协定之等效性
数据协定等效性特点概述 对于客户端要将某种类型的数据成功发送到服务,或者服务要将数据成功发送到客户端的情况,接收端上并不一定必须存在此发送数据类型. 唯一的要求是两种类型的数据协定应该等效. 要使数据 ...