WhaleStudio 2.6重磅发布!调度模块WhaleScheduler更新78项核心功能
我们很高兴地宣布WhaleStudio 2.6版本的正式发布!新版本中包含了数据调度模块WhaleScheduler和数据集成模块WhaleTunnel的百余项核心功能更新,本文摘选了WhaleScheduler常用功能更新的概况,关于WhaleTunnel的更新详情将于近期发布,欢迎关注!
WhaleStudio中的调度模块WhaleScheduler作为一款全球领先的数据工作流调度系统,一直致力于为用户提供更加高效、便捷的功能。本次版本更新,我们特别优化和增强了多个功能模块,解决了许多用户在日常工作中遇到的实际问题,详情欢迎查看文末联系方式咨询。
WhaleScheduler是白鲸开源Apache DolphinScheduler核心研发团队打造的新一代调度工具,继承了开源使用简单、分布式、易扩展的优点,同时加入大量商业版本功能,支持多云、信创环境的数据源与环境部署。
实时任务管理支持
现在越来越多的用户开始使用实时数据仓库,从数据CDC抽取到数据实时加工及展示,从而支持风控、经济业务、银行在线分析等实时场景。在2.6版本中,我们还新增了对多种实时任务的全面支持, 用户可以更便捷地进行编辑、管理、控制和删除操作,全面升级用户实时数据仓库开发能力。这些实时任务包括:
- Spark Streaming
- Flink Streaming
- WhaleTunnel Streaming(CDC)
- Java Jar
此外,我们为上述任务提供了高级配置与编辑功能:
- Jar任务托管:可以在资源中心/Git中进行托管并进行部署运维。
- Flink实时组件配置:支持Flink实时组件的原生参数配置。
- WhaleTunnel CDC任务:可以进行参数传递,包括循环调用。
工作流复制功能增强
另一方面,随着用户的产品越来越多,帮助用户提高工作流使用的便捷性,是2.6版本中的重要目标。
在日常工作中,您是否经常遇到这样的场景?不同项目使用的表和处理过程非常相似,然而在使用工作流复制功能时,却发现其中的逻辑节点和子节点无法被复制。这给很多用户带来了不便和额外的工作量。为了解决这个问题,WhaleStudio 2.6版本新增复制逻辑任务节点、支持级联复制子工作流、跨项目复制子工作流功能:
01 支持复制逻辑任务节点
在2.6版本中,工作流复制功能得到了显著增强。现在,您可以轻松地复制包含逻辑任务节点的工作流。这意味着,即使工作流中包含复杂的逻辑判断和处理节点,也可以在不同项目中快速复用,极大地提高了工作效率。
02 级联复制子工作流
另一个令人激动的改进是,当工作流中包含子工作流时,复制操作将支持级联复制子工作流。这意味着,整个工作流结构,包括所有嵌套的子工作流,都可以一并复制,不再需要手动一个一个节点进行复制。这项功能不仅简化了操作流程,还确保了工作流的一致性和完整性。
03 支持跨项目复制子工作流
在2.6版本中,工作流复制功能进一步增强,新增支持跨项目复制工作流。现在,您可以轻松地将工作流从一个项目复制到另一个项目中,实现资源和配置的跨项目共享,进一步提升了工作效率和项目协同能力。
依赖任务功能增强
为了提升依赖任务(DEPENDENT)的灵活性和易用性,我们在2.6版本中进行了多项改进:
- 弱依赖模式:为了提高任务调度的灵活性,我们新增了任务组件的运行标志“失败继续”的弱依赖模式。在这种模式下,当前任务节点执行失败(例如等待1小时还为满足要求,而失败)不会阻断当前流程,后续任务将正常提交执行。
- 业务日期修改为牌日期:明确表示当选择牌日期时将会根据依赖规则在当前工作流的牌所使用的日历上进行查找对应业务日期。
- 新增月维度的时间依赖选项:牌日期依赖新增了月纬度的时间选项,增加了时间依赖的灵活性。
- 依赖所有任务(ALL):不再单独检查任务状态,而是检查整个工作流的执行状态。被依赖的工作流中的任务可以修改和删除了。
- 依赖检查优化:依赖检查时不再取“最后结束时间”而是取“最后开始时间”作为判断最新实例的条件,避免后启动的实例先完成而导致依赖判断出错的问题。
- 自然日时间依赖不使用日历:自然日的时间依赖现在无需使用日历,简化了依赖设置。
多种任务功能增强
为了进一步提升任务功能的多样性和灵活性,我们在2.6版本中进行了多项增强:
01 SQL任务
优化了SQL任务的参数传递。在SQL任务中设置传出参数时,现在能够获取并向后传递多行的返回结果。这一改进大大增强了SQL任务的灵活性和实用性,使得处理复杂查询和数据传递更加方便。
02 DATA QUALITY任务
在2.6版本中,DATA QUALITY任务得到了显著增强。现在,您可以使用参数变量替换表名和过滤条件中的部分字符,从而可以使用循环节点或者前面的SQL节点的内容来批量控制数据质量。这使得数据质量管理更加动态和灵活。
03 BREAK任务
新增了BREAK逻辑任务节点。该节点允许在执行到此节点时自动暂停流程并发送告警通知,从而让用户可以手工参与到工作流的安排中。这一功能使得工作流调度更加灵活,并能够及时响应和处理异常情况。
04 资源池任务优先/工作流优先任选
在 2.6版本中,我们对资源池配置进行了优化,增加了优先策略设置。用户现在可以选择任务优先或工作流优先,这将影响任务在资源池队列中的排序规则。特别是当选择工作流优先时,系统将保证先提交的工作流优先完成。这一功能优化了资源分配和任务调度策略,使调度过程更加高效和合理。
影响分析与展示性能优化
为了提升用户体验和系统性能,2.6版本在整体展示性能上进行了显著优化,现在画布可支持同时展示数千个节点。
此外,我们对展示范围和逻辑进行了重构:
- 展示范围更新:仅展示处于依赖链条上的节点,减少不必要的节点显示,提高画面清晰度和操作性能。
- 展示逻辑重构:以起点(被搜索节点)为中心,按依赖关系的层数由近到远进行展示。具体如下:
- x轴:节点与起点的相隔层数关系,同一层数的节点在同一列。
- y轴:以工作流为纬度,展示节点与起点的相隔关系。
- 画布布局:左侧展示节点的父关系链路,右下侧展示节点的子关系链路。
同时我们对页面的搜索逻辑进行了优化,改进了搜索返回结果的方式。当搜索工作流或节点时,结果将分批返回,提升了搜索效率和页面响应速度。
工作流导入导出及管理优化
我们还改进了工作流的导入导出功能以及管理体验,确保用户在操作时更加便捷和安全:
01 工作流导入新增权限校验
在导入工作流时,新增了权限校验功能。如果您没有文件内工作流配置中引用资源或配置的使用权限,将无法成功导入到目标项目中。这一改进提高了系统的安全性和数据完整性,也避免导入数据后因为权限原因无法执行。
02 工作流Excel导入导出模版更新
我们更新了工作流的Excel导入导出模版,使操作更加直观和易用,进一步提升了用户体验。这样在维护上万个工作流的时候,维护好Excel模板就可以快速导入导出。
03 工作流上下线
现在,工作流上线后允许用户打开查看工作流内的配置信息。这样您可以在工作流上线后依然检查和查看其详细配置,确保一切运行如预期,而不用先下线才能看工作流内部信息。
04 工作流列表优化
我们调整了工作流定义名称列的宽度比例,并增加了列表中每列的宽度上限。这样,即使某些列内容较少,也不会导致某些列特别宽,整体界面更加美观和协调。
小结
WhaleScheduler 2.6版本中,我们发布了多达78项核心功能的更新,旨在全面提升用户体验和系统性能。本次升级涵盖了工作流复制、实时任务管理、导入导出管理、多种任务功能、DEPENDENT任务增强、资源池配置优化,以及影响分析与展示性能优化等多个方面,本文仅摘选了2.6版本当中的一些常用功能更新,如果您对WhaleScheduler或者WhaleStudio感兴趣,欢迎垂询。
- 邮箱: xiyan@whaleops.com
- 加V:17743592110
- 公司网站: www.whaleops.com
白鲸开源
白鲸开源是一家开源原生的DataOps商业公司,是国家高新技术企业,由多个Apache Foundation Member成立,80%员工都是 Apache Committer,运营2个全球Apache开源项目(DolphinScheduler, SeaTunnel)。白鲸开源已根据全球最佳实践发布商业版产品WhaleStudio(含白鲸数据调度平台WhaleScheduler和白鲸数据集成平台WhaleTunnel)。我们致力于打造下一代开源原生的DataOps 平台,助力企业在大数据和云时代,智能化地完成多数据源、多云及信创环境的数据集成、调度开发和治理,以提高企业解决数据问题的效率,提升企业分析洞察能力和决策能力。
本文由 白鲸开源 提供发布支持!
WhaleStudio 2.6重磅发布!调度模块WhaleScheduler更新78项核心功能的更多相关文章
- 阿里云数据管理DMS企业版发布年度重大更新 多项功能全面升级
随着企业规模和人员扩充,您是否遇到这些问题:企业员工还在使用数据库账号直接操作数据库?人员流动导致运维人员频繁维护数据库账号密码?所有数据库变更还在等DBA集中执行,导致研发效率日益低下. 2月27日 ...
- julia,集Python、C++、R为一体!Julia 1.0重磅发布, MIT发布史上最强科学计算编程语言?创始人独家解答11个问题
这个编程语言的新版本之所以受到整个人工智能界的关注,最主要的原因正是其将 C 语言的速度.Ruby 的灵活.Python 的通用性前所未有地结合在一起,支持并行处理,易于学习和使用,尤其适合科学和工程 ...
- OSS跨同城3AZ重磅发布,构造全面数据保护体系
点击订阅新品发布会! 新产品.新版本.新技术.新功能.价格调整,评论在下方,下期更新!关注更多内容,了解更多 最新发布 OSS跨同城3AZ重磅发布 2019年7月3日15时,OSS跨同城3AZ重磅发布 ...
- Dataphin公共云重磅发布,提供一站式智能数据构建与管理能
点击订阅新品发布会! 新产品.新版本.新技术.新功能.价格调整,评论在下方,下期更新!关注更多内容,了解更多 最新发布 Dataphin公共云重磅发布 2019年6月26日15时,阿里云Dataphi ...
- 云数据库 MySQL 8.0 重磅发布,更适合企业使用场景的RDS数据库
点击订阅新品发布会! 新产品.新版本.新技术.新功能.价格调整,评论在下方,下期更新!关注更多内容,了解更多 最新发布 云数据库MySQL 8.0 升级发布会 2019年5月29日15时,阿里云云数据 ...
- YOLOv5目标检测源码重磅发布了!
YOLOv5目标检测源码重磅发布了! https://github.com/ultralytics/yolov5 该存储库代表了对未来对象检测方法的超解析开源研究,并结合了在使用之前的YOLO存储库在 ...
- 120项改进:开源超级爬虫Hawk 2.0 重磅发布!
沙漠君在历时半年,修改无数bug,更新一票新功能后,在今天隆重推出最新改进的超级爬虫Hawk 2.0! 啥?你不知道Hawk干吗用的? 这是采集数据的挖掘机,网络猎杀的重狙!半年多以前,沙漠君写了一篇 ...
- 重磅发布:《阿里巴巴Android开发手册(规约)》
1.前言 阿里巴巴于近日为广大程序员再送上重磅开春好礼:<阿里巴巴Android开发手册(规约)>.该开发规范在阿里内部经过了长期的修缮,现已总结成册,向所有移动开发者.技术爱好者开放,希 ...
- MTSC2019大会日程重磅发布,腾讯WeTest独家Topic大揭秘!
WeTest 导读 中国移动互联网测试开发大会 Mobile Testing Summit China(简称 MTSC)是由国内最大的移动测试技术社区 TesterHome 发起的软件测试行业技术会议 ...
- 【AI】【计算机】【中国人工智能学会通讯】【学会通讯2019年第01期】中国人工智能学会重磅发布 《2018 人工智能产业创新评估白皮书》
封面: 中国人工智能学会重磅发布 <2018 人工智能产业创新评估白皮书> < 2018 人工智能产业创新评估白皮书>由中国人工智能学会.国家工信安全中心.华夏幸福产业研究院. ...
随机推荐
- Spring Boot 使用 拦截器 实现 token 验证
Spring Boot 使用 拦截器 实现 token 验证 整体思路:1.写一个工具类封装生成.校验和解析 token 的方法:2.在注册和登录时生成 token ,生成的 token 存入 red ...
- java中判断一个String字符串或字符数组中包含某个字段
/** * 判断String字符串中包含某个字段 * @param oriStr 原始字符串 * @return */ private static boolean findString(String ...
- Scrapy爬取知名技术文章网站
scrapy安装以及目录结构介绍 创建有python3的虚拟环境 mkvirtualenv mkvirtualenv py3env 安装scrapy 进入虚拟环境py3env,把pip的源设置为豆瓣源 ...
- UE 5 NavMesh 烘培 逻辑流程
关于UE引擎层面的东西: 在向场景重拖入一个NavMeshBoundsVolume时(或者修改时). 会调用 void UNavigationSystemV1::PerformNavigation ...
- nginx 信号量
nginx支持的信号量 TERM, INT fast shutdown QUIT graceful shutdown HUP changing configuration, keeping up wi ...
- 数据标注工具 doccano | 命名实体识别(Named Entity Recognition,简称NER)
目录 安装 数据准备 创建项目 创建抽取式任务 上传 定义标签 构建抽取式任务标签 任务标注 命名实体识别 导出数据 查看数据 命名实体识别(Named Entity Recognition,简称NE ...
- .NET 个人博客-首页排版优化
个人博客-首页排版优化 优化计划 置顶3个且可滚动或切换 推荐改为4个,然后新增历史文章,将推荐的加载更多放入历史文章,按文章发布时间降序排列. 标签功能,可以为文章贴上标签 推荐点赞功能 本篇文章优 ...
- PyTorch程序练习(二):循环神经网络的PyTorch实现
一.RNN实现 结构原理 代码实现 import torch import torch.nn as nn class RNN(nn.Module): def __init__(self, input_ ...
- Linux历史管理命令
history管理历史命令 [1].history命令 history命令用于显示历史记录和执行过的命令,登录系统时,会读取~./bash_history历史文件中记录的命令,当我们退出shell时, ...
- HTTP事务理解
借图: 首先三次握手理解: TCP三次握手好比两个对话, 第一次握手:甲给乙一直发送信息,乙没有回应,甲不知道乙有没有收到信息 第二次握手:乙收到信息,然后再给甲回信息,此时甲知道乙收到信息,但乙不知 ...