Apache DolphinScheduler使用规范与使用技巧分享
本次分享来源2021年9月4日杨佳豪同学,给大家带来的分享是基于 Apache DolphinScheduler 使用规范与使用技巧分享,分享的内容主要为以下五点:
“
DolphinScheduler基本部署情况
DolphinScheduler使用规范
DolphinScheduler工作流维护
DolphinScheduler调度依赖划分
DolphinScheduler运维维护
1 基本部署情况
DolphinScheduler 部署情况:
目前采用1.3.3版本,于2020.11月开始使用
整套平台基础CDH 6.3.2 离线hive 进行调度,目前有三套独立调度平台环境 ,dev和test 共用在一起,uat ,prd,分别单独部署
dev 、 test 环境:
部署在一台 16C/64G 的服务器上
uat 环境:
部署在三台 32C / 64G 的服务器 ,部署了两台master 和 三台 worker

prd 环境
部署在 五台 32C / 64 G 的服务器,分开部署了两台master 和 三台worker

每天调度大概近1000+任务,主要用到的组件 【shell】、【sub_process】、【depend节点】,
目前使用稳定。
我们目前实现一套脚本,多环境调度。仅需细小参数更改,即可用于测试开发生产分别使用,
以及数据生命周期的管理。
2 DolphinScheduler 使用规范
DolphinScheduler 项目开发使用规范
租户管理:
目前多套环境都只创建了一个租户,所有服务器一个队列,开发人员无需过多选择,直接使用即可。

用户管理:
所有开发和测试的同学都由管理人员创建账户,用于统一管理。

告警组管理:
开发人员都被添加到告警组中,排班对任务报错进行排查处理

项目管理:
目前我们这采用不同迭代的方式和项目迭代项目保持一致,整体项目数据库,由dba进行定期备份。

DolphinScheduler 人员权限管理规范
开发同学:
开发的同学会授予自己负责的项目,只负责开发环境和测试的工作流配置,不接触uat和prd

测试同学:
测试的同学只授权test项目,用于测试工作流的相应报表,其他项目不予开放权限。

DolphinScheduler 上线流程使用规范
上线流程:
按照流程,负责维护的ds运维同学,对项目版本跟随git代码版本进行备份和新上线

3 DolphinScheduler 工作流维护
DolphinScheduler 工作流分类
主题分类:
ods 层 辖区主题,它们主要在一个相应的表,进行分类

DolphinScheduler 工作流节点配置
配置规范:
节点名称必须和脚本所调度文件名称保证一致
必须配置失败重试次数和间隔时间,默认3次,5分钟
描述信息开发环境必须描述清晰
脚本下线只采用禁止执行,不进行删除操作
全量表必须设置生命周期时间

配置规范:
开发同学在更改自己负责的工作流是需要添加具体描述。

DolphinScheduler 工作流节点扩展
离线sqoop 任务:

hive 任务:

全局参数:

4 DolphinScheduler 调度依赖的划分
DolphinScheduler 调度划分
项目调度:

DolphinScheduler 周期调度
周期任务:

DolphinScheduler 任务容错
任务失败容错机制:

5 DolphinScheduler 运维维护
DolphinScheduler 服务报警
对所在主机和服务进行监控:

DolphinScheduler 工作流质量监控
相关监控:

下面视频是分享演讲:
Apache DolphinScheduler使用规范与使用技巧分享的更多相关文章
- 4 亿用户,7W+ 作业调度难题,Bigo 基于 Apache DolphinScheduler 巧化解
点击上方 蓝字关注我们 ✎ 编 者 按 成立于 2014 年的 Bigo,成立以来就聚焦于在全球范围内提供音视频服务.面对 4 亿多用户,Bigo 大数据团队打造的计算平台基于 Apache Dolp ...
- 就在明天,Apache DolphinScheduler Meetup 2021 如约而至!
点击上方 蓝字关注我们 社区的小伙伴们,Apache DolphinScheduler Meetup 2021 如约而至,就在明天,等你来玩! 在此次 Meetup 线上直播中,不仅将有来自 Bigo ...
- 重构、插件化、性能提升 20 倍,Apache DolphinScheduler 2.0 alpha 发布亮点太多!
点击上方 蓝字关注我们 社区的小伙伴们,好消息!经过 100 多位社区贡献者近 10 个月的共同努力,我们很高兴地宣布 Apache DolphinScheduler 2.0 alpha 发布.这是 ...
- 议题征集令 | Apache DolphinScheduler Meetup 2021 来啦,议题征集正式开启!
点击上方 蓝字关注我们 社区的小伙伴们,经过精心筹备,我们很高兴地宣布,Apache DolphinScheduler Meetup 2021 将于 2021 年 11 月 27 日到来! 在 Mee ...
- Apache DolphinScheduler 1.3.9 发布,新增 StandaloneServer
点击上方 蓝字关注我们 2021 年 10 月 22 日,Apache DolphinScheduler 正式发布 1.3.9 版本.时隔一个半月,在社区贡献者的共同努力下,Apache Dolphi ...
- 手把手教你 Apache DolphinScheduler 本地开发环境搭建 | 中英文视频教程
点击上方 蓝字关注我们 最近,一些小伙伴反馈对小海豚的本地开发环境搭建过程不太了解,这不就有活跃的贡献者送来新鲜的视频教程!在此感谢@Tianqi-Dotes 的细致讲解 贡献者还贴心地录制了中英文两 ...
- Apache DolphinScheduler 架构演进介绍及开源经验分享 - eBay 阮文俊
引言 来自 eBay 的文俊同学在近期的上海开源大数据 Meetup 上做了十分精彩的 "Apache DolphinScheduler 的架构演进" 分享.本次分享有近 200 ...
- 社区之光:我和 Apache DolphinScheduler 的这一年
背景 没错,本文的主人翁就是那个在多个 DolphinScheduler 用户群超级活跃,"孜孜不倦" 地给用户各种答疑的小伙,如果你在群里问过问题,伯毅多半概率回答过,哈哈,今天 ...
- Apache DolphinScheduler 是如何诞生的
作者 | 代立冬,李岗 排版 | 开源之道小助理 Apache DolphinScheduler,简称"DS", 中文名 "小海豚调度"(海豚聪明.人性化,又左 ...
随机推荐
- Vue 基础篇---computed 和 watch
最近在看前端 Vue方面的基础知识,虽然前段时间也做了一些vue方面的小项目,但总觉得对vue掌握的不够 所以对vue基础知识需要注意的地方重新撸一遍,可能比较零碎,看到那块就写哪块吧 1.vue中的 ...
- ELK 是什么?
E指的是ElasticSearch Elasticsearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch ...
- 『忘了再学』Shell基础 — 26、cut列提取命令
目录 1.cut命令说明 2.cut命令练习 (1)cut命令基本用法 (2)cut命令选取多列 (3)按字符来进行提取 (4)按指定分隔符进行截取数据 3.cut命令分隔符说明 1.cut命令说明 ...
- neo4j中重复节点问题
neo4j中重复节点问题 neo4j中,在导入csv文件时,可能会出现有重复节点的现象.可以分为以下步骤解决:1.先查看下某个标签下的节点总数match (n:PERSON) return count ...
- 2021.05.03【NOIP提高B组】模拟 总结
比较水的一场比赛,却不能 AK T1 有 \(n\) 次,每次给 \(A_i,B_i\) 问以 \(i\) 结尾的 \(A,B\) 的匹配中最大和的最小值 问最大和的最小值,却不用二分. 如果暴力排序 ...
- 在海思芯片上使用GDB远程调试
1 前言 使用海思平台上(编译工具链:arm-himix200-linux)交叉编译 GDB 工具(使用版本8.2,之前用过10.2的版本,在编译 gdbserver 遇到编译出错的问题,因为关联了其 ...
- 皓远的第二次博客作业(最新pta集,链表练习及期中考试总结)
前言: 知识点运用:正则表达式,有关图形设计计算的表达式和算法,链表的相关知识,Java类的基础运用,继承.容器与多态. 题量:相较于上次作业,这几周在java方面的练习花了更多的精力和时间,所要完成 ...
- 1.3 操作系统的第三个功能——存储管理功能 -《zobolの操作系统学习札记》
1.3 操作系统的第三个功能--存储管理功能 作者zobol:关于操作系统概论-存储管理功能,我给出下列问题: 目录 1.3 操作系统的第三个功能--存储管理功能 问1:操作系统的文件管理系统主要是负 ...
- opencv-python获取视频信息
代码 import cv2 if __name__ == '__main__': # 读取视频 capture = cv2.VideoCapture('./videos/person.mp4') # ...
- DAST 黑盒漏洞扫描器 第六篇:运营篇(终)
0X01 前言 转载请标明来源:https://www.cnblogs.com/huim/ 当项目功能逐渐成熟,同时需要实现的是运营流程和指标体系建设.需要工程化的功能逐渐少了,剩下的主要工作转变成持 ...