Galaxy Release_20.09 发布,新增多个数据上传组件
Galaxy Project(https://galaxyproject.org/)是在云计算背景下诞生的一个生物信息学可视化分析开源项目。
该项目由美国国家科学基金会(NSF)、美国国家人类基因组研究所(NHGRI)、哈克生命科学研究所(The Huck Institutes of the Life Sciences)、宾州州立大学网络科学研究所(The Institute for CyberScience at Penn State),以及约翰霍普金斯大学(Johns Hopkins University)提供支持,是目前生物医学研究领域最受欢迎的在线生物信息分析工具之一。
2020年10月左右,Galaxy Project 正式发布了 release-20.09 的版本;11月18日,发布这一版本的 announcement 文档。这里总结一下该版本一些主要的更新内容,为关注和从事 Galaxy 相关工作的中文用户提供参考。
1. 重点更新
1.1 可插拔的上传组件
@jmchilton为上传源编写了一个新的可插入接口。他最初添加了两个新的后端,现在您可以从 Dropbox 和您可能有权访问的任何 WebDav 服务器导入数据。这项工作在将来,会为开发人员更轻松地添加对其他新的个人数据源提供支持。
一个 Dropbox 帐户的示例:

配置源后,将有一个用于
“选择远程文件(Choose Remote files)”的新按钮,然后您将能够查看和搜索您可能有权访问的所有远程数据位置。

您将能够在 Galaxy 中轻松查看和加载文件!

如果要使用这些服务,管理员首先需要配置这些功能,然后,需要在 Galaxy 的用户首选项中提供这些服务的凭据。
1.2 在 Galaxy 中接入 GTN
在 BCC2020 CoFest 期间,@hexylena和@shiltemann共同增加了对从 Galaxy 内部访问 Galaxy 培训网络教程的支持。点击导航栏的刻度帽图标将激活 GTN 界面。
对于更新的教程,工具将突出显示为蓝色按钮。单击后,这些按钮将隐藏 GTN,并直接将您带到 Galaxy 界面中正确工具的正确版本。用户将无需再花时间弄清楚教程中作者意味的是哪一个种工具!准备就绪后,您又可以轻松地跳回到培训材料。
Thanks @pvanheus for the video of it in action!
1.3 从工具表单直接上传数据
如果你曾经试过点击一个工具后,在工具页面开始进行参数配置,但忘记了先上传数据集,以至于你在上传数据后不得不重新开始之前的参数配置操作。参考
@jmchilton.
Pull Request 9809,您可以直接在工具表单中上传数据集。
1.4 改进的流程布局算法
旧的自动化流程布局算法喜欢在流程中隐藏数据流的信息。

因此,20.09 版本用一种较新的布局算法代替了该算法,这应该使流程中的数据流更容易理解。您可能仍希望在流程自动布局后进行手动调整,但是希望这样可以节省一些时间。

1.4 改进的流程报告
提交一个或多个工作流程后,这些工作流程及其报告的状态页面报告已得到改进!

另外,20.09 在工作流报告语法中还添加了几个新功能,您可以在报告中使用这些功能。参考@OlegZharkov. Pull Request 9938
invocation-time -The iso time of the workflow invocation time.generate-time -The iso time of the time of generation of the Markdown.generate-galaxy-version -The Galaxy MAJOR_VERSION at the time of generation of the Markdown.dataset-type -The ext/format/datatype of the target dataset.dataset-name -The name of the target dataset.
1.5 可以自行删除帐户
在(希望的)极少数情况下,您可能想要关闭帐户并删除关联的数据。@astrovsky01 已实现用户自删除,因此您不再需要请求管理员为您执行此操作并等待他们的响应。参考Pull Request 10107
2. 新的可视化功能
GalaxyP MVP 可视化插件(感谢 @tmcgowan)。参考Pull Request 10136

从他们的相关论文中:
[The MVP App] displays this example data where the list of variant peptides are shown in the Peptide Overview window (A). One of these peptides (sequence DGDLENPVLYSGAVK) has been selected in this list, and the button “PSMs for Selected Peptides” clicked to display the 2 PSMs that matched to this sequence, along with associated scoring metrics (B). Double-clicking on one of these PSMs opens the Lorikeet MS/MS viewer (C). Lorikeet [29] renders MS/MS spectra, providing a visualization of the annotated spectra that led to a PSM using the upstream sequence database searching software. C shows an example PSM, where the blue- and red-colored m/z peak values correspond to amino acid fragments that would be predicted to derive from the peptide sequence identified by this PSM.
3. 新的数据类型
从 2017 年开始,几个社区成员和提交者(@stevecassidy,@hexylena,@anuprulez,@bgruening,@mvdbeek)一起工作,以添加音频和视频相关的数据类型。现在,此 PR 已合并并可以在 Galaxy 中使用。另外,这些文件还包括针对这些文件的特定可视化效果,使您可以直接在 Galaxy 中查看音频或视频媒体。

包括对 mkv,mp4,flv,mpg 视频容器以及 mp3,wav,TextGrid 和 BPF 音频格式的支持。
增加 VCF_BGZIP 到 VCF 转换(感谢@almahmoud).Pull Request 7926
添加 NcbiTaxonomySQlite 类来描述 NCBI 分类标准 SQLite 数据库(感谢@pvanheus).Pull Request 9712
增加 last 工具的 lastdb 的数据类型(PR#2749)(感谢@RomainDallet).Pull Request 9872
增加 BLASTDBv5 数据类型(for blast >=2.8.1)(感谢@abretaud).Pull Request 9939
使用 compression_utils 对压缩数据集进行安全浏览(感谢@pvanheus).Pull Request 9990
添加 Anndata 监视功能(感谢@mtekman).Pull Request 10013,Pull Request 10555
修复 fastq_to_fqtoc 格式转换中的 OSError(感谢@bgruening).Pull Request 10042
不显示可选的不存在的元数据文件的下载链接.Pull Request 10068
将 "tgz" 数据类型添加到配置示例文件中,以用于 toolfactory 和任何其他生成 gzipped tar 文件的工具(感谢@fubar2).Pull Request 10080
修复在 Tabular 格式文件中 'int', ‘float' 列类型的检测(感谢@selten).Pull Request 10155
Decrease pysam verbosityPull Request 10225
从示例配置文件中删除对丢失类型的引用.Pull Request 10269
Fix tuple assignment (fixes anndata, scanpy tool tests)Pull Request 10293
修复
Wav数据类型以从Audio继承(感谢@nsoranzo).Pull Request 10312Fix wiggle estimated_display_viewportPull Request 10333
4. 更新内置工具
修复并简化内置修剪工具(感谢@wm75).Pull Request 10145
Allow unary plus and minus in filtering(感谢@wm75).Pull Request 10154
修复 filter.py 失败的所有表达式(感谢@almahmoud).Pull Request 10266
后话
从个人而言,Galaxy Project 是一个极好的开源学习项目,它包含了从生信到数据库、系统,以及服务器、集群,前端等等的知识;从公司而言,也是从传统命令行生信分析向可视化界面处理的一个很好开源案例,值得借鉴与参考。
本文章的所有链接,以及可用于 Galaxy 管理员、开发人员更加详细的更新文档,可以点击文章底部"阅读原文"进行查阅。
本文由“壹伴编辑器”提供技术支持
如果您觉得这篇文章对您有点用的话,麻烦您为本文来个四连:转发分享、点赞、点在看、留言,因为这将是我写作与分享更多优质文章的最强动力!
往期推荐
本文由“壹伴编辑器”提供技术支

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
Galaxy Release_20.09 发布,新增多个数据上传组件的更多相关文章
- 重新想象 Windows 8.1 Store Apps (89) - 通信的新特性: 下载数据, 上传数据, 上传文件
[源码下载] 重新想象 Windows 8.1 Store Apps (89) - 通信的新特性: 下载数据, 上传数据, 上传文件 作者:webabcd 介绍重新想象 Windows 8.1 Sto ...
- 帝国CMS7.2新增多图同时上传插件,上传多图效率更高
原来上传多图文件,需要挨个选择文件,然后再点批量上传,比较麻烦.所以帝国CMS7.2新增了多图上传插件:为采用FLASH方式实现同时选择多个图片一起上传,提高多图上传效率. 帝国CMS多图上传插件特性 ...
- 如何优化 FineUI 控件库的性能,减少 80% 的数据上传量!
在开始正文之前,请帮忙为当前排名前 10 唯一的 .Net 开源软件 FineUI 投一票: 投票地址: https://code.csdn.net/2013OSSurvey/gitop/codevo ...
- 【AllJoyn专题】基于AllJoyn和Yeelink的传感器数据上传与指令下行的研究
接触高通物联网框架AllJoyn不太久,但确是被深深地吸引了.在我看来,促进我深入学习的原因有三点:一.AllJoyn开源,对开源的软硬件总会有种莫名的喜爱,虽然或许不会都深入下去:二.顺应潮流,物联 ...
- 云中树莓派(2):将传感器数据上传到 AWS IoT 并利用Kibana进行展示
云中树莓派(1):环境准备 云中树莓派(2):将传感器数据上传到AWS IoT 并利用Kibana进行展示 1. 传感器安装及配置 1.1 DHT22 安装 DHT22 是一款温度与湿度传感器,它有3 ...
- 关于数据上传阿里云MaxCompute调研
1.背景 当前的数据存储基于mysql库表存储形式,目前已经无法满足愈加增大的数据存储需求,新项目基于Maxcompute数据仓库架构,需要将统计日志上传Maxcompute,本文对Maxcomput ...
- C#工业物联网和集成系统解决方案的技术路线(数据源、数据采集、数据上传与接收、ActiveMQ、Mongodb、WebApi、手机App)
目 录 工业物联网和集成系统解决方案的技术路线... 1 前言... 1 第一章 系统架构... 3 1.1 硬件构架图... 3 1.2 ...
- PDA手持扫描资产标签,盘点完成后将数据上传到PC端,固定资产系统查看盘点结果
固定资产管理系统介绍: 致力于研发条码技术.集成条码系统的专业性公司,针对客户的不同需求,提供一站式的企业条码系统解决方案:包括功能强大的软件系统.安全可靠的无线网络.坚固耐用的硬件系统.灵活易用的管 ...
- Octopus系列之数据上传格式要求说明
各个数据列要求 价格列:字符串类型[美元价格] 产品名字:可以支持"/"等字符 分类名字:去空格处理 不得包含"&"符号 主图:一定要有主图列 不为空 ...
- C#数据上传方法
/// <summary> /// 连接成功后开始调用数据上传程序 /// </summary> public void CallDataUpload() { //指定上传日期 ...
随机推荐
- flutter系列之:在flutter中使用媒体播放器
目录 简介 使用前的准备工作 在flutter中使用video_player 总结 简介 现在的app功能越来越强大,除了基本的图文之外,还需要各种各样的其他的功能,比如视频,和直播. 直播可能会比较 ...
- STM32 HAL库学习(F407ZGT6) (1)-晶振/时钟树
时钟树(以F407为例) 对于 STM32F4 系列的芯片,正常工作的主频可以达到 168Mhz,但并不是所有外设都需要系统时钟这么高的频率,比如看门狗以及RTC只需要几十Khz的时钟即可.同一个 ...
- OpenTranslator:一款基于ChatGPT API的翻译神器
这是一款使用 ChatGPT API 进行划词翻译和文本润色的浏览器插件.借助了 ChatGPT 强大的翻译能力,它将帮助您更流畅地阅读外语和编辑外语. 它能干啥 一. 可翻译 二. 可润色 三. 可 ...
- How to implement UDP protocal
Server implementation Open a socket on the server that listens to the UDP requests. (I've chosen 888 ...
- 图与网络分析—R实现(四)
三 最短路问题 最短路问题(short-path problem)是图论理论的一个经典问题.寻找最短路径就是在指定网络中两结点间找一条距离最小的路.最短路不仅仅指一般地理意义上的距离最短,还可以引申到 ...
- [Nginx/Linux]Nginx从1.15.12平滑升级到1.17.5
1 问题背景 nginx 安全漏洞(CVE-2019-9511) nginx 安全漏洞(CVE-2019-9513) nginx 安全漏洞(CVE-2019-9516) http://www.cnnv ...
- 3.@RequestParma和@PathVariable的用法和区别
前言 我相信很多程序员都会在自己的项目中使用到Restful风格来安全便捷地进行接口的编写,因此本文这篇博客来简要介绍一下controller方法中的两个注解:@RequestParma和@PathV ...
- LeeCode 317周赛复盘
T1: 可被3整数的偶数的平均值 思路:数组遍历 被3整数的偶数 \(\Leftrightarrow\) 被6整数的数 public int averageValue(int[] nums) { in ...
- day17:内置方法&math模块&random模块&pickle模块
内置方法 1.round:四舍五入 正常遵守四舍五入,但在n.5结构中,n为偶数则舍去,n为奇数则进一. res1 = round(4.51) # 5 res2 = round(4.5) # 4 re ...
- 27-lazy loading(懒加载和预加载)
懒加载 document.getElementById('btn').onclick = function () { // 懒加载:当文件需要使用时才加载 import(/* webpackChunk ...