LEfSe (Linear discriminant analysis Effect Size) 是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。

1. 在线安装

Galaxy 中可以使用 admin 账号在 Tool Shed 中直接搜索 lefse,并根据提示一步一步进行安装。本文章的所有截图与操作均来自于 zGalaxy,一个基于 Galaxy release_17.09,部署在阿里云 ECS 经过深度定制的中文版生物信息分析测试平台。

安装完成的网页界面:

2. 模块依赖

LEfSe 的执行需要解决 R、python 依赖:

  • R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS

  • python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse


  1. $ cd <GALAXY_ROOT>

  2. $ . .venv/bin/activate

  3. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  4. $ pip install matplotlib==1.5.0

  5. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  6. $ pip install rpy2==2.8.6

matplotlib >= 2.0.0 会导致 LEfSe 的 B)LDAEffectSize(LEfSe) 运行出现 warnning,虽然生成的结果是没问题的。


  1. /data/galaxy-dist/galaxy/.venv/lib/python2.7/site-packages/matplotlib/artist.py:896: MatplotlibDeprecationWarning: The set_axis_bgcolor function was deprecated in version 2.0. Use set_facecolor instead.

  2.  return func(v)

3. 测试与使用

3.1 A) Format Data for LEfSe

第一步,点击 Galaxy 的 "获取数据""数据上传""Choose local file"选择本地文件(hmpaerobiosissmall.txt)设置 Type: tabular"start"


  1. wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt

第二步,点击 Galaxy 中 LEfSe 分析下的 "A) Format Data for LEfSe",选择第一步输入的数据,设置参数如下。

第三步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "2: A) Format Data for LEfSe on data 1"

如果 Galaxy 历史栏的结果中出现格式报错:

这是因为在 Galaxy 中执行 A) Format Data for LEfSe 分析产生的结果默认为 lefse_internal_for 格式,但 Galaxy 本身无法识别该格式。这就需要我们在  config/datatypesconf.xml 中增加 lefseinternal_for 数据格式的登记信息,然后重启 Galaxy 。


  1. <?xml version="1.0"?>

  2. <datatypes>

  3.    <registration>

  4.        ...

  5.        <datatype extension="lefse" type="galaxy.datatypes.data:Lefse" display_in_upload="true"/>

  6.        <datatype extension="lefse_res" type="galaxy.datatypes.tabular:LefseRes" display_in_upload="true"/>

  7.    </registration>

  8. </datatypes>

参考:https://toolshed.g2.bx.psu.edu/repository/viewchangeset?ctxstr=db64b6287cd6&id=cabebb0465f009e4


3.2. B) LDA Effect Size (LEfSe)

第一步,点击 Galaxy 中 LEfSe 分析下的 "B) LDA Effect Size (LEfSe)",选择 A 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "3: B) LDA Effect Size (LEfSe) on data 2"


3.3. C) Plot LEfSe Results

第一步,点击 Galaxy 中 LEfSe 分析下的 "C) Plot LEfSe Results",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "4: C) Plot LEfSe Results on data 3"


3.4. D) Plot Cladogram

第一步,点击 Galaxy 中 LEfSe 分析下的 "D) Plot Cladogram",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "5: D) Plot Cladogram on data 3"


3.5. E) Plot One Feature

第一步,点击 Galaxy 中 LEfSe 分析下的 "E) Plot One Feature",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "6: E) Plot One Feature on data 3 and data 2"


3.6. F) Plot Differential Features

第一步,点击 Galaxy 中 LEfSe 分析下的 "F) Plot Differential Features",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "7: F) Plot Differential Features on data 3 and data 2",点击眼睛图片可以下载本次分析的打包文件(*.zip)。

·end·

—如果喜欢,快分享给你的朋友们吧—

我们一起愉快的玩耍吧

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

Galaxy 平台下 LEfSe 安装与使用教程的更多相关文章

  1. Windows平台下Flutter安装,配置,初运行。

    Flutter是什么?他是谷歌根据Dark语言开源的跨平台开发依赖.和目前比较火的Reactive Native一样,一套代码能够实现两个不同平台的App.那么为什么要介绍Flutter而不是在国内大 ...

  2. 【原创】--linux平台下opencv安装

    1.到opencv官网下载源码 也可以下载此链接http://pan.baidu.com/s/1mgId5ZM 2.解压到任意目录 可以使用右键-提取到此处,也可以在命令行中使用指令解压(linux中 ...

  3. windows平台下redis安装及配置文件介绍

    1.redis介绍 redis是一个key-value存储系统.和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表).set(集合).zset(s ...

  4. Windows平台下ActiveMQ 安装

    安装之前需要先确定机器上已经有JVM环境,如果没有则会在安装过程中提示 Unable to execute Java command.  系统找不到指定的文件 第一步:从官网下载ActiveMQ的安装 ...

  5. windows平台下MongoDB安装和环境搭建

    下载安装包或者压缩包 添加db存储和日志存储文件夹 添加服务.配置环境变量.启动Mongo 本例:安装路径:D:Program Files/MongoDB 配置文件的路径:D:MongoDB 一.安装 ...

  6. Windows平台下SVN安装配置及使用

    原文链接:https://www.cnblogs.com/snake-hand/archive/2013/06/09/3130022.html,等有空了玩一玩吧,现在没空.

  7. Windows平台下的node.js安装

    Windows平台下的node.js安装 直接去nodejs的官网http://nodejs.org/上下载nodejs安装程序,双击安装就可以了 测试安装是否成功: 在命令行输入 node –v 应 ...

  8. linux平台下Hadoop下载、安装、配置

    在这里我使用的linux版本是CentOS 6.4      CentOS-6.4-i386-bin-DVD1.iso      下载地址: http://mirrors.aliyun.com/cen ...

  9. windows平台下nginx+PHP环境安装

    因为日常工作在windows下,为方便在window是下进行PHP开发,需要在windows平台下搭建PHP开发环境,web服务器选择nginx,不过windows版本的nginx性能要比Linux/ ...

  10. Linux平台下Ntop流量监测安装,并实现Netflow全过程

    Linux平台下Ntop流量监测安装,并实现Netflow全过程 更多原创教学视频详见: http://you.video.sina.com.cn/m/1443650204 本文出自 "李晨 ...

随机推荐

  1. import tensorflow出现ImportError: DLL load failed: 找不到指定的模块的问题(亲测可用)

    错误如下图所示: 在很长时间的查找后,网上的很多办法都不能很好的解决问题,但是基本上指向了一个问题--版本问题,所以接下来我安装了与python环境对应的tensorflow包. 首先用以下命令查找对 ...

  2. Linux 端口及防火墙常用命令

    Linux 端口及防火墙操作 查看端口操作 一. netstat命令 -t (tcp) 仅显示tcp相关选项 -u (udp)仅显示udp相关选项 -n 拒绝显示别名,能显示数字的全部转化为数字 -l ...

  3. selenium验证码处理-打码平台操作

    1.进入打码平台(超人,斐斐) 斐斐-------官网: 超人-------官网: 2.选择对应的开发文档,下载对应的demo示例,并把demo的python脚本放到项目包管理地址去 参考: 超人的开 ...

  4. 在 Linux 内公网、云服务器搭建一套 K8s 集群

    前言 本文讲述如果在 Linux 搭建内/公网 Kubernetes 集群的详细步骤,解决搭建过程中的问题. 准备工作 Linux CentOS 7.x 两台及以上,本文用的 7.6 本文配置默认是在 ...

  5. vue之箭头函数

    目录 说明 解决方法一 重新定义this 解决方法二 使用箭头函数 无参数的箭头函数 有一个参数的箭头函数 有两个参数的箭头函数 有一个参数一个返回值的箭头函数 说明 当在一个方法(函数)里面再定义一 ...

  6. Python程序笔记20230304

    抛硬币实验 random 模块 import random random.randint(a, b) 返回一个随机整数 N,范围是:a <= N <= b random.choice(&q ...

  7. [Java EE]SpringBoot/Tomcat之启动时报"Error: Could not find or load main class CLASS xxxx"、"no main manifest attribute"异常

    环境信息如下: OS: CENTOS 7 Tomcat : 9.0.46 SpringBoot: 2.3.12.RELASE Build JDK: 1.8.0_261 Runetime JDK : o ...

  8. 【Vue项目 + 自写java后端】尚品汇(七)后台项目 ElementUI 表单验证 + 三级联动

    ElementUI 表单验证 1 标准验证规则 Form 组件提供了表单验证的功能,只需要通过 rules 属性传入约定的验证规则,并将 Form-Item 的 prop 属性设置为需校验的字段名即可 ...

  9. 帝国cms将没有搜索到结果的关键字存入到数据库的方法

    在帝国cms网站前台搜索一个关键字,如果在网站中查询到了,这个关键字会被记录入搜索关键字表中,但是如果在网站中没有搜索到,就不会记录入搜索关键字表中,那怎么把没有搜索结果的关键字才能记录到数据库中,方 ...

  10. Kubesphere中DevOps流水线无法部署/部署失败

    摘要 总算能让devops运行以后,流水线却卡在了deploy这一步.碰到了两个比较大的问题,一个是无法使用k8sp自带的kubeconfig认证去部署:一个是部署好了以后但是没有办法解析镜像名. 版 ...