Galaxy 平台下 LEfSe 安装与使用教程
LEfSe (Linear discriminant analysis Effect Size) 是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。
1. 在线安装
Galaxy 中可以使用 admin 账号在 Tool Shed 中直接搜索 lefse,并根据提示一步一步进行安装。本文章的所有截图与操作均来自于 zGalaxy,一个基于 Galaxy release_17.09,部署在阿里云 ECS 经过深度定制的中文版生物信息分析测试平台。
安装完成的网页界面:
2. 模块依赖
LEfSe 的执行需要解决 R、python 依赖:
R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS
python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse
$ cd <GALAXY_ROOT>$ . .venv/bin/activate(.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy$ pip install matplotlib==1.5.0(.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy$ pip install rpy2==2.8.6
matplotlib >= 2.0.0 会导致 LEfSe 的
B)LDAEffectSize(LEfSe)运行出现 warnning,虽然生成的结果是没问题的。
/data/galaxy-dist/galaxy/.venv/lib/python2.7/site-packages/matplotlib/artist.py:896: MatplotlibDeprecationWarning: The set_axis_bgcolor function was deprecated in version 2.0. Use set_facecolor instead.
return func(v)
3. 测试与使用
3.1 A) Format Data for LEfSe
第一步,点击 Galaxy 的 "获取数据" → "数据上传" → "Choose local file" → 选择本地文件(hmpaerobiosissmall.txt) → 设置 Type: tabular → "start"。
wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt

第二步,点击 Galaxy 中 LEfSe 分析下的 "A) Format Data for LEfSe",选择第一步输入的数据,设置参数如下。
第三步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "2: A) Format Data for LEfSe on data 1"。
如果 Galaxy 历史栏的结果中出现格式报错:
这是因为在 Galaxy 中执行 A) Format Data for LEfSe 分析产生的结果默认为
lefse_internal_for格式,但 Galaxy 本身无法识别该格式。这就需要我们在 config/datatypesconf.xml 中增加 lefseinternal_for 数据格式的登记信息,然后重启 Galaxy 。
<?xml version="1.0"?>
<datatypes>
<registration>
...
<datatype extension="lefse" type="galaxy.datatypes.data:Lefse" display_in_upload="true"/>
<datatype extension="lefse_res" type="galaxy.datatypes.tabular:LefseRes" display_in_upload="true"/>
</registration>
</datatypes>参考:https://toolshed.g2.bx.psu.edu/repository/viewchangeset?ctxstr=db64b6287cd6&id=cabebb0465f009e4
3.2. B) LDA Effect Size (LEfSe)
第一步,点击 Galaxy 中 LEfSe 分析下的 "B) LDA Effect Size (LEfSe)",选择 A 的结果数据,设置参数如下。
第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "3: B) LDA Effect Size (LEfSe) on data 2"。
3.3. C) Plot LEfSe Results
第一步,点击 Galaxy 中 LEfSe 分析下的 "C) Plot LEfSe Results",选择 B 的结果数据,设置参数如下。
第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "4: C) Plot LEfSe Results on data 3"。
3.4. D) Plot Cladogram
第一步,点击 Galaxy 中 LEfSe 分析下的 "D) Plot Cladogram",选择 B 的结果数据,设置参数如下。
第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "5: D) Plot Cladogram on data 3"。
3.5. E) Plot One Feature
第一步,点击 Galaxy 中 LEfSe 分析下的 "E) Plot One Feature",选择 A 和 B 的结果数据,设置参数如下。
第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "6: E) Plot One Feature on data 3 and data 2"。
3.6. F) Plot Differential Features
第一步,点击 Galaxy 中 LEfSe 分析下的 "F) Plot Differential Features",选择 A 和 B 的结果数据,设置参数如下。
第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "7: F) Plot Differential Features on data 3 and data 2",点击眼睛图片可以下载本次分析的打包文件(*.zip)。

·end·
—如果喜欢,快分享给你的朋友们吧—
我们一起愉快的玩耍吧
本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
Galaxy 平台下 LEfSe 安装与使用教程的更多相关文章
- Windows平台下Flutter安装,配置,初运行。
Flutter是什么?他是谷歌根据Dark语言开源的跨平台开发依赖.和目前比较火的Reactive Native一样,一套代码能够实现两个不同平台的App.那么为什么要介绍Flutter而不是在国内大 ...
- 【原创】--linux平台下opencv安装
1.到opencv官网下载源码 也可以下载此链接http://pan.baidu.com/s/1mgId5ZM 2.解压到任意目录 可以使用右键-提取到此处,也可以在命令行中使用指令解压(linux中 ...
- windows平台下redis安装及配置文件介绍
1.redis介绍 redis是一个key-value存储系统.和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表).set(集合).zset(s ...
- Windows平台下ActiveMQ 安装
安装之前需要先确定机器上已经有JVM环境,如果没有则会在安装过程中提示 Unable to execute Java command. 系统找不到指定的文件 第一步:从官网下载ActiveMQ的安装 ...
- windows平台下MongoDB安装和环境搭建
下载安装包或者压缩包 添加db存储和日志存储文件夹 添加服务.配置环境变量.启动Mongo 本例:安装路径:D:Program Files/MongoDB 配置文件的路径:D:MongoDB 一.安装 ...
- Windows平台下SVN安装配置及使用
原文链接:https://www.cnblogs.com/snake-hand/archive/2013/06/09/3130022.html,等有空了玩一玩吧,现在没空.
- Windows平台下的node.js安装
Windows平台下的node.js安装 直接去nodejs的官网http://nodejs.org/上下载nodejs安装程序,双击安装就可以了 测试安装是否成功: 在命令行输入 node –v 应 ...
- linux平台下Hadoop下载、安装、配置
在这里我使用的linux版本是CentOS 6.4 CentOS-6.4-i386-bin-DVD1.iso 下载地址: http://mirrors.aliyun.com/cen ...
- windows平台下nginx+PHP环境安装
因为日常工作在windows下,为方便在window是下进行PHP开发,需要在windows平台下搭建PHP开发环境,web服务器选择nginx,不过windows版本的nginx性能要比Linux/ ...
- Linux平台下Ntop流量监测安装,并实现Netflow全过程
Linux平台下Ntop流量监测安装,并实现Netflow全过程 更多原创教学视频详见: http://you.video.sina.com.cn/m/1443650204 本文出自 "李晨 ...
随机推荐
- import tensorflow出现ImportError: DLL load failed: 找不到指定的模块的问题(亲测可用)
错误如下图所示: 在很长时间的查找后,网上的很多办法都不能很好的解决问题,但是基本上指向了一个问题--版本问题,所以接下来我安装了与python环境对应的tensorflow包. 首先用以下命令查找对 ...
- Linux 端口及防火墙常用命令
Linux 端口及防火墙操作 查看端口操作 一. netstat命令 -t (tcp) 仅显示tcp相关选项 -u (udp)仅显示udp相关选项 -n 拒绝显示别名,能显示数字的全部转化为数字 -l ...
- selenium验证码处理-打码平台操作
1.进入打码平台(超人,斐斐) 斐斐-------官网: 超人-------官网: 2.选择对应的开发文档,下载对应的demo示例,并把demo的python脚本放到项目包管理地址去 参考: 超人的开 ...
- 在 Linux 内公网、云服务器搭建一套 K8s 集群
前言 本文讲述如果在 Linux 搭建内/公网 Kubernetes 集群的详细步骤,解决搭建过程中的问题. 准备工作 Linux CentOS 7.x 两台及以上,本文用的 7.6 本文配置默认是在 ...
- vue之箭头函数
目录 说明 解决方法一 重新定义this 解决方法二 使用箭头函数 无参数的箭头函数 有一个参数的箭头函数 有两个参数的箭头函数 有一个参数一个返回值的箭头函数 说明 当在一个方法(函数)里面再定义一 ...
- Python程序笔记20230304
抛硬币实验 random 模块 import random random.randint(a, b) 返回一个随机整数 N,范围是:a <= N <= b random.choice(&q ...
- [Java EE]SpringBoot/Tomcat之启动时报"Error: Could not find or load main class CLASS xxxx"、"no main manifest attribute"异常
环境信息如下: OS: CENTOS 7 Tomcat : 9.0.46 SpringBoot: 2.3.12.RELASE Build JDK: 1.8.0_261 Runetime JDK : o ...
- 【Vue项目 + 自写java后端】尚品汇(七)后台项目 ElementUI 表单验证 + 三级联动
ElementUI 表单验证 1 标准验证规则 Form 组件提供了表单验证的功能,只需要通过 rules 属性传入约定的验证规则,并将 Form-Item 的 prop 属性设置为需校验的字段名即可 ...
- 帝国cms将没有搜索到结果的关键字存入到数据库的方法
在帝国cms网站前台搜索一个关键字,如果在网站中查询到了,这个关键字会被记录入搜索关键字表中,但是如果在网站中没有搜索到,就不会记录入搜索关键字表中,那怎么把没有搜索结果的关键字才能记录到数据库中,方 ...
- Kubesphere中DevOps流水线无法部署/部署失败
摘要 总算能让devops运行以后,流水线却卡在了deploy这一步.碰到了两个比较大的问题,一个是无法使用k8sp自带的kubeconfig认证去部署:一个是部署好了以后但是没有办法解析镜像名. 版 ...
