本次分享来源2021年9月4日杨佳豪同学,给大家带来的分享是基于 Apache DolphinScheduler 使用规范与使用技巧分享,分享的内容主要为以下五点:

  • DolphinScheduler基本部署情况

  • DolphinScheduler使用规范

  • DolphinScheduler工作流维护

  • DolphinScheduler调度依赖划分

  • DolphinScheduler运维维护

1 基本部署情况

DolphinScheduler 部署情况:

  • 目前采用1.3.3版本,于2020.11月开始使用

  • 整套平台基础CDH 6.3.2 离线hive 进行调度,目前有三套独立调度平台环境 ,dev和test 共用在一起,uat ,prd,分别单独部署

  • dev 、 test 环境

部署在一台 16C/64G 的服务器上

  • uat  环境

部署在三台 32C / 64G 的服务器 ,部署了两台master 和 三台 worker

  • prd 环境

部署在 五台 32C / 64 G 的服务器,分开部署了两台master 和 三台worker

每天调度大概近1000+任务,主要用到的组件 【shell】、【sub_process】、【depend节点】,

目前使用稳定

我们目前实现一套脚本,多环境调度。仅需细小参数更改,即可用于测试开发生产分别使用,

以及数据生命周期的管理。

2 DolphinScheduler 使用规范

DolphinScheduler 项目开发使用规范

租户管理:

  • 目前多套环境都只创建了一个租户,所有服务器一个队列,开发人员无需过多选择,直接使用即可。

用户管理:

  • 所有开发和测试的同学都由管理人员创建账户,用于统一管理。

告警组管理:

  • 开发人员都被添加到告警组中,排班对任务报错进行排查处理

项目管理:

  • 目前我们这采用不同迭代的方式和项目迭代项目保持一致,整体项目数据库,由dba进行定期备份。

DolphinScheduler 人员权限管理规范

开发同学:

  • 开发的同学会授予自己负责的项目,只负责开发环境和测试的工作流配置,不接触uat和prd

测试同学:

  • 测试的同学只授权test项目,用于测试工作流的相应报表,其他项目不予开放权限。

DolphinScheduler 上线流程使用规范

上线流程:

  • 按照流程,负责维护的ds运维同学,对项目版本跟随git代码版本进行备份和新上线

3 DolphinScheduler 工作流维护

DolphinScheduler 工作流分类

主题分类:

  • ods 层 辖区主题,它们主要在一个相应的表,进行分类

DolphinScheduler 工作流节点配置

配置规范:

  • 节点名称必须和脚本所调度文件名称保证一致

  • 必须配置失败重试次数和间隔时间,默认3次,5分钟

  • 描述信息开发环境必须描述清晰

  • 脚本下线只采用禁止执行,不进行删除操作

  • 全量表必须设置生命周期时间

配置规范:

  • 开发同学在更改自己负责的工作流是需要添加具体描述。

DolphinScheduler 工作流节点扩展

离线sqoop 任务:

hive 任务:

全局参数:

4 DolphinScheduler 调度依赖的划分

DolphinScheduler 调度划分

项目调度:

DolphinScheduler 周期调度

周期任务:

DolphinScheduler 任务容错

任务失败容错机制:

5 DolphinScheduler 运维维护

DolphinScheduler 服务报警

对所在主机和服务进行监控:

DolphinScheduler 工作流质量监控

相关监控:

下面视频是分享演讲: 

Apache DolphinScheduler使用规范与使用技巧分享的更多相关文章

  1. 4 亿用户,7W+ 作业调度难题,Bigo 基于 Apache DolphinScheduler 巧化解

    点击上方 蓝字关注我们 ✎ 编 者 按 成立于 2014 年的 Bigo,成立以来就聚焦于在全球范围内提供音视频服务.面对 4 亿多用户,Bigo 大数据团队打造的计算平台基于 Apache Dolp ...

  2. 就在明天,Apache DolphinScheduler Meetup 2021 如约而至!

    点击上方 蓝字关注我们 社区的小伙伴们,Apache DolphinScheduler Meetup 2021 如约而至,就在明天,等你来玩! 在此次 Meetup 线上直播中,不仅将有来自 Bigo ...

  3. 重构、插件化、性能提升 20 倍,Apache DolphinScheduler 2.0 alpha 发布亮点太多!

    点击上方 蓝字关注我们 社区的小伙伴们,好消息!经过 100 多位社区贡献者近 10 个月的共同努力,我们很高兴地宣布 Apache DolphinScheduler 2.0 alpha 发布.这是 ...

  4. 议题征集令 | Apache DolphinScheduler Meetup 2021 来啦,议题征集正式开启!

    点击上方 蓝字关注我们 社区的小伙伴们,经过精心筹备,我们很高兴地宣布,Apache DolphinScheduler Meetup 2021 将于 2021 年 11 月 27 日到来! 在 Mee ...

  5. Apache DolphinScheduler 1.3.9 发布,新增 StandaloneServer

    点击上方 蓝字关注我们 2021 年 10 月 22 日,Apache DolphinScheduler 正式发布 1.3.9 版本.时隔一个半月,在社区贡献者的共同努力下,Apache Dolphi ...

  6. 手把手教你 Apache DolphinScheduler 本地开发环境搭建 | 中英文视频教程

    点击上方 蓝字关注我们 最近,一些小伙伴反馈对小海豚的本地开发环境搭建过程不太了解,这不就有活跃的贡献者送来新鲜的视频教程!在此感谢@Tianqi-Dotes 的细致讲解 贡献者还贴心地录制了中英文两 ...

  7. Apache DolphinScheduler 架构演进介绍及开源经验分享 - eBay 阮文俊

    引言 来自 eBay 的文俊同学在近期的上海开源大数据 Meetup 上做了十分精彩的 "Apache DolphinScheduler 的架构演进" 分享.本次分享有近 200 ...

  8. 社区之光:我和 Apache DolphinScheduler 的这一年

    背景 没错,本文的主人翁就是那个在多个 DolphinScheduler 用户群超级活跃,"孜孜不倦" 地给用户各种答疑的小伙,如果你在群里问过问题,伯毅多半概率回答过,哈哈,今天 ...

  9. Apache DolphinScheduler 是如何诞生的

    作者 | 代立冬,李岗 排版 | 开源之道小助理 Apache DolphinScheduler,简称"DS", 中文名 "小海豚调度"(海豚聪明.人性化,又左 ...

随机推荐

  1. C++:制作火把

    制作火把 时间限制 : 1.000 sec          内存限制 : 128 MB 题目描述: 小红最近在玩一个制作火把的游戏,一开始,小红手里有一根木棍,她希望能够通过这一根木棍通过交易换取制 ...

  2. Clash 规则的写法

    这篇博文是针对 CFW 写的. 最近尝试从 v2 转向使用 Clash.基于一个简单的需求:用 Spotify 听专的时候用代理,用 AM 听专的时候直连,我参考了以下完成了我的规则: CFW 官网的 ...

  3. Python Beautiful Soup库

    Beautiful Soup库 Beautiful Soup库:https://www.crummy.com/software/BeautifulSoup/ 安装Beautiful Soup: 使用B ...

  4. 【原创】eNSP路由器启动#号问题排查

    1.删除拖出来的设备,重新拖出来一台---我用过[有时候好使] 2.确保Ensp的设置-工具-Virtual Box安装目录是否正确--我也遇到过[尤其是卸载掉Virtual Box重装之后] 3.确 ...

  5. csv.reader(f)和f.readlines()、追加数据

    假如某个文档f中存储如下内容: 你好,中国. 1,2,3,4 共两行内容. 当你使用csv.reader(f),则会存储为如下形式: [['你','好','中','国'] ['1','2','3',' ...

  6. 2.C++标准库函数:getline函数 定界流输入截取函数 -windows编程

    引言:今天工作遇到了一个需要按行读取txt文件数据的需求,查询了一下getline()函数,发现这竟然是一个C++的标准库函数,而且设计的很好,特地做一下记录.getline本质是一个定界流输入截取函 ...

  7. VirtualBox虚拟机安装Ubuntu系统后,增加内存空间和处理器核心数

    对于Linux爱好者而言,初次使用虚拟机时,一般都会使用默认的设置,例如硬盘空间.内存空间等等. 而往往在熟悉之后,安装了某些必要的软件,或者熟悉了实际的开发场景后,却发现原本给虚拟机分配的物理资源是 ...

  8. RPA SAP财务内部对账机器人

    [简介] 本机器人用于使用SAP软件的集团公司间往来对账前台登录SAP账户和密码,需退出PC微信,输入法切换为英文半角状态. [详细流程] 1.清空Excel-VBA管理工具原始数据 2.输入对账时间 ...

  9. fiddle如何使用代理

    前言 Fiddle作为抓包工具深受程序员的喜爱,可能在代理方面有些会感觉到迷惑的,可以通过本文的学习来掌握一些基本的知识. Fiddle介绍 Fiddler是位于客户端和服务器端的HTTP代理,也是目 ...

  10. 一条update语句到底加了多少锁?带你深入理解底层原理

    迎面走来了你的面试官,身穿格子衫,挺着啤酒肚,发际线严重后移的中年男子. 手拿泡着枸杞的保温杯,胳膊夹着MacBook,MacBook上还贴着公司标语:"我爱加班". 面试开始,直 ...