LEfSe (Linear discriminant analysis Effect Size) 是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。

1. 在线安装

Galaxy 中可以使用 admin 账号在 Tool Shed 中直接搜索 lefse,并根据提示一步一步进行安装。本文章的所有截图与操作均来自于 zGalaxy,一个基于 Galaxy release_17.09,部署在阿里云 ECS 经过深度定制的中文版生物信息分析测试平台。

安装完成的网页界面:

2. 模块依赖

LEfSe 的执行需要解决 R、python 依赖:

  • R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS

  • python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse


  1. $ cd <GALAXY_ROOT>

  2. $ . .venv/bin/activate

  3. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  4. $ pip install matplotlib==1.5.0

  5. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  6. $ pip install rpy2==2.8.6

matplotlib >= 2.0.0 会导致 LEfSe 的 B)LDAEffectSize(LEfSe) 运行出现 warnning,虽然生成的结果是没问题的。


  1. /data/galaxy-dist/galaxy/.venv/lib/python2.7/site-packages/matplotlib/artist.py:896: MatplotlibDeprecationWarning: The set_axis_bgcolor function was deprecated in version 2.0. Use set_facecolor instead.

  2.  return func(v)

3. 测试与使用

3.1 A) Format Data for LEfSe

第一步,点击 Galaxy 的 "获取数据""数据上传""Choose local file"选择本地文件(hmpaerobiosissmall.txt)设置 Type: tabular"start"


  1. wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt

第二步,点击 Galaxy 中 LEfSe 分析下的 "A) Format Data for LEfSe",选择第一步输入的数据,设置参数如下。

第三步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "2: A) Format Data for LEfSe on data 1"

如果 Galaxy 历史栏的结果中出现格式报错:

这是因为在 Galaxy 中执行 A) Format Data for LEfSe 分析产生的结果默认为 lefse_internal_for 格式,但 Galaxy 本身无法识别该格式。这就需要我们在  config/datatypesconf.xml 中增加 lefseinternal_for 数据格式的登记信息,然后重启 Galaxy 。


  1. <?xml version="1.0"?>

  2. <datatypes>

  3.    <registration>

  4.        ...

  5.        <datatype extension="lefse" type="galaxy.datatypes.data:Lefse" display_in_upload="true"/>

  6.        <datatype extension="lefse_res" type="galaxy.datatypes.tabular:LefseRes" display_in_upload="true"/>

  7.    </registration>

  8. </datatypes>

参考:https://toolshed.g2.bx.psu.edu/repository/viewchangeset?ctxstr=db64b6287cd6&id=cabebb0465f009e4


3.2. B) LDA Effect Size (LEfSe)

第一步,点击 Galaxy 中 LEfSe 分析下的 "B) LDA Effect Size (LEfSe)",选择 A 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "3: B) LDA Effect Size (LEfSe) on data 2"


3.3. C) Plot LEfSe Results

第一步,点击 Galaxy 中 LEfSe 分析下的 "C) Plot LEfSe Results",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "4: C) Plot LEfSe Results on data 3"


3.4. D) Plot Cladogram

第一步,点击 Galaxy 中 LEfSe 分析下的 "D) Plot Cladogram",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "5: D) Plot Cladogram on data 3"


3.5. E) Plot One Feature

第一步,点击 Galaxy 中 LEfSe 分析下的 "E) Plot One Feature",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "6: E) Plot One Feature on data 3 and data 2"


3.6. F) Plot Differential Features

第一步,点击 Galaxy 中 LEfSe 分析下的 "F) Plot Differential Features",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "7: F) Plot Differential Features on data 3 and data 2",点击眼睛图片可以下载本次分析的打包文件(*.zip)。

·end·

—如果喜欢,快分享给你的朋友们吧—

我们一起愉快的玩耍吧

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

Galaxy 平台下 LEfSe 安装与使用教程的更多相关文章

  1. Windows平台下Flutter安装,配置,初运行。

    Flutter是什么?他是谷歌根据Dark语言开源的跨平台开发依赖.和目前比较火的Reactive Native一样,一套代码能够实现两个不同平台的App.那么为什么要介绍Flutter而不是在国内大 ...

  2. 【原创】--linux平台下opencv安装

    1.到opencv官网下载源码 也可以下载此链接http://pan.baidu.com/s/1mgId5ZM 2.解压到任意目录 可以使用右键-提取到此处,也可以在命令行中使用指令解压(linux中 ...

  3. windows平台下redis安装及配置文件介绍

    1.redis介绍 redis是一个key-value存储系统.和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表).set(集合).zset(s ...

  4. Windows平台下ActiveMQ 安装

    安装之前需要先确定机器上已经有JVM环境,如果没有则会在安装过程中提示 Unable to execute Java command.  系统找不到指定的文件 第一步:从官网下载ActiveMQ的安装 ...

  5. windows平台下MongoDB安装和环境搭建

    下载安装包或者压缩包 添加db存储和日志存储文件夹 添加服务.配置环境变量.启动Mongo 本例:安装路径:D:Program Files/MongoDB 配置文件的路径:D:MongoDB 一.安装 ...

  6. Windows平台下SVN安装配置及使用

    原文链接:https://www.cnblogs.com/snake-hand/archive/2013/06/09/3130022.html,等有空了玩一玩吧,现在没空.

  7. Windows平台下的node.js安装

    Windows平台下的node.js安装 直接去nodejs的官网http://nodejs.org/上下载nodejs安装程序,双击安装就可以了 测试安装是否成功: 在命令行输入 node –v 应 ...

  8. linux平台下Hadoop下载、安装、配置

    在这里我使用的linux版本是CentOS 6.4      CentOS-6.4-i386-bin-DVD1.iso      下载地址: http://mirrors.aliyun.com/cen ...

  9. windows平台下nginx+PHP环境安装

    因为日常工作在windows下,为方便在window是下进行PHP开发,需要在windows平台下搭建PHP开发环境,web服务器选择nginx,不过windows版本的nginx性能要比Linux/ ...

  10. Linux平台下Ntop流量监测安装,并实现Netflow全过程

    Linux平台下Ntop流量监测安装,并实现Netflow全过程 更多原创教学视频详见: http://you.video.sina.com.cn/m/1443650204 本文出自 "李晨 ...

随机推荐

  1. urllib.request发送get请求

    发送请求 urllib.request库 模拟浏览器发起一个HTTP请求,并获取请求响应结果 urllib.request.urlopen的语法格式 urllib(url.data = None,[t ...

  2. Comic Life - 超棒的漫画制作工具,拥有多种动画模版,创作属于自己的漫画

    Comic Life是一个照片编辑器,能够添加各种效果,并基于它们创建漫画.该工具包包括各种各样的模板,可以很容易地将照片放置在工作表上,还有大量各种形状的标注.除了拼贴画上的标注之外,您还可以添加带 ...

  3. Go语言:编写一个 WebsiteRacer 的函数,用来对比请求两个 URL 来「比赛」,并返回先响应的 URL。如果两个 URL 在 10 秒内都未返回结果,返回一个 error。

    问题: 你被要求编写一个叫做 WebsiteRacer 的函数,用来对比请求两个 URL 来「比赛」,并返回先响应的 URL.如果两个 URL 在 10 秒内都未返回结果,那么应该返回一个 error ...

  4. kubernetes(k8s)安装BGP模式calico网络支持IPV4和IPV6

    kubernetes(k8s)安装BGP模式calico网络支持IPV4和IPV6 BGP是互联网上一个核心的去中心化自治路由协议,它通过维护IP路由表或"前缀"表来实现自治系统A ...

  5. [Linux]查看硬件及操作系统信息

    许多的软件产品对硬件及操作系统等环境是有具体要求的,那么这时候如何快速知晓目标机器的目标资源信息是较为频繁的操作. 命令 全部硬件及系统信息 dmidecode (软硬件全部信息) hostnamec ...

  6. Nordic nRF52系列/nRF5340硬件设计(一)选型及原理图设计

    Nordic 的BLE系列芯片从第一代的nRF51系列,到第二代的nRF52系列,发展到目前最新的第三代的nRF5340.目前市场中使用最多的nRF52系列一共有七款芯片,它们是:nRF52805.n ...

  7. 五月二十七日jdbc,算法以及数据库

    1.ResultSetMetaData接口主要获得结果集.例如:结果集字段数量和名字通过ResultSet的getMetaData()方法获得对应对象 public class app17_20 { ...

  8. bash shell 无法使用 perl 正则

    哈喽大家好,我是咸鱼.今天跟大家分享一个关于正则表达式的案例,希望能够对你有所帮助 案例现象 前几天有一个小伙伴在群里求助,说他这个 shell 脚本有问题,让大家帮忙看看   可以看到,这个脚本首先 ...

  9. 理解Linux系统: 进程

    Linux内核版本: 2.6.11.12 编写代码: 创建进程 创建进程使用fork系统调用,官方文档对于fork的描述: fork() creates a new process by duplic ...

  10. 为什么数据库project被做成了web开发啊啊——一个半小时实现增删查改

    昨天晚上去小破站上找了一点点~~亿点点~~资料,仔细研究了一下我们项目说明文档里的restful框架,发现可以直接用django_restful_framework. 天大的好消息啊!今天下午有三个小 ...