MetaPhlAn 2:宏基因组进化分析
描述
MetaPhlAn是分析从物种水平分辨率宏基因组鸟枪法测序数据的微生物群落(细菌,古细菌,真核细胞和病毒)的组成的计算工具。从版本2.0,MetaPhlAn还能够确定具体的菌株(在将样品含有先前测序的菌株的不那么频繁的情况下),并跟踪跨越样品菌株的所有物种。
MetaPhlAn 2依靠〜1M唯一的特定分支,标记基因(标记信息文件可以在SRC / utils的/ markers_info.txt.bz2或在这里找到)从〜17000的参考基因组鉴定(〜13500细菌和古细菌,3500〜病毒,和〜110真核),使得:
- 明确的分类任务;
- 有机体相对丰度的准确估计;
- 对于细菌,古细菌,真核生物和病毒种级别分辨率;
- 菌种鉴定和跟踪
- 幅度的加速比的订单相比现有的方法。
- 宏基因组应变水平的人口基因组学
先决条件
MetaPhlAn需要Python 2.7版或更高argparse,临时文件和numpy的安装库(除了为numpy的,他们通常与蟒蛇分布一起安装)。现在还支持Python3。
如果提供的SAM输出BowTie2作为输入,没有额外的前提条件。
如果您想使用BowTie2集成在MetaPhlAn,你需要有BowTie2版本2.0.0或更高版本和Perl安装(bowtie2需要在与执行系统路径和读权限)
如果使用“utils的/ metaphlan_hclust_heatmap.py”的剧本绘制和聚类多MetaPhlAn异形样本,还需要以下Python库:matplotlib,SciPy的,pylab(如果不与MatPlotLib一起安装)。
如果要产生输出为“BIOM”文件,你还需要BIOM安装
MetaPhlAn不紧密地与先进的热图密谋整合hclust2和进化树可视化GraPhlAn。如果使用这样的可视化工具,请参考他们的先决条件。
安装: clone https://bitbucket.org/biobakery/metaphlan2
基本用法:
========== MetaPhlAn 2 分支- 丰 估计 =================
========== MetaPhlAn 2 株 跟踪 ============================
INPUT_FILE 的 输入 文件 可以 是:
* 一个 FASTQ 文件 包含 宏基因组 读取
或
* 一个 BowTie2 产生的 SAM 文件。
OR
* 一个 中介 映射 文件 中 的 宏基因组 产生 由 一个 先前 MetaPhlAn 运行
如果 该 输入 文件 的 丢失, 该 脚本 假定 是 在 输入 时 提供 使用 的 标准
输入, 或 命名 管道。
重要提示: 该 类型 的 输入 需要 到 被 指定 与 - INPUT_TYPE
OUTPUT_FILE 的 选项卡- 分隔 输出 文件 中 的 预测 分类群 的相对 丰度
[ stdout中 ,如果 不 存在] 必需的 参数:
- mpa_pkl MPA_PKL 的 元数据 腌制 MetaPhlAn 文件
- INPUT_TYPE { FASTQ ,FASTA ,multifasta ,multifastq ,bowtie2out ,SAM }
设置 是否 该 输入 是 在 multifasta 文件 的 宏基因组 读取 或
将 SAM 文件 中 的 映射 中 的 读取 反对 在 MetaPhlAn 分贝。
[ 默认的 “ 自动” , 我。Ë 。 该 脚本 将 尝试 以 猜测 的 输入 格式]
MetaPhlAn 2:宏基因组进化分析的更多相关文章
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...
- 【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因
Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...
- 【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
英文名:Genetic architecture of artemisinin-resistant Plasmodium falciparum 中文名:疟原虫青蒿素抗药性的全基因组关联分析 期刊:Na ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- WeakSelf宏的进化(转载)
我们都知道在防止如block的循环引用时,会使用__weak关键字做如下定义: __weak typeof(self) weakSelf = self; 后来,为了方便,不用每次都要写这样一句固定代码 ...
- 内核中container_of宏的详细分析【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637597.html 内核中container_of宏的详细分析 16年2月28日09:00:37 内核中 ...
- 基因组表达分析:如何选择RNA-seq vs. 芯片
基因组表达分析:如何选择RNA-seq vs. 芯片 发布日期:2017-03-29 10:00 DNA 芯片(上图左侧)由附着在表面的核酸探针组成.首先,从样品中提取 RNA 并转化为互补 DNA( ...
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
随机推荐
- [linux] shellshock
1> Test if the system is vulnerable env X="() { :;} ; echo vulnerable" /bin/sh -c " ...
- Python编程练习题
1 求可用被17整除的所有三位数 for num in range(99,1000): if num % 17 == 0: print num ps:下面的写法和上面的写法性能的差距,上面好吧? fo ...
- Flex http请求
下面类支持POST和GET请求,请求数据和出错将返回 package com.sole.util { import flash.events.Event; import flash.events.HT ...
- 笔记本_thinkpad_e440
ZC: 这是我现在手上 公司工作的笔记本 1.进入 BIOS --> Enter键 2.背面信息 笔记本序列号(用于查找 驱动等) (ZC: 这个是 ThinkPad E440 的信息) 序号为 ...
- 协同过滤 CF & ALS 及在Spark上的实现
使用Spark进行ALS编程的例子可以看:http://www.cnblogs.com/charlesblc/p/6165201.html ALS:alternating least squares ...
- APP成功上线前的bug解决方案
首先测试用例设计阶段,设计并维护一个各个功能入口的说明文档.其实这个文档的作用很大,一方面对于bug回归阶段的人来说,这是用于提醒的;另外一个方面,在随机测试的时候,随机程度也能有所提高,测试人员能够 ...
- Head First 设计模式 --5 单例模式
单例模式:确保一个类只有一个实例,并提供一个全局访问点.用到的设计原则:1.封装变化2.组合优于集成3.针对接口变成而不是针对实现4.为交互对象之间的松耦合设计而努力5.类应该对扩展开放,对修改关闭6 ...
- WCF双向通信,心跳
合肥程序员群:49313181. 合肥实名程序员群:128131462 (不愿透露姓名和信息者勿加入)Q Q:408365330 E-Mail:egojit@qq.com WCF中双程 ...
- Oracle 字符串分割排序冒泡算法
例子: 一个字符串"11,15,13,17,12",以逗号分割,现在要排序成"11,12,13,15,17". 写了一个实现方法,记录下来以备后用: ----- ...
- 编译安装的 mysql apache 用 service mysqld start 来启动
先我们把mysql增加到linux的系统服务中去 mysql: 代码如下 复制代码 cd /usr/local/mysql/share/mysql cp mysql.server /etc/init ...