Azkaban 3.73.1 使用简介
本文上接《Azkaban 3.73.1 集群搭建(Multiple Executor)》,对Azkaban的使用做简单说明
目录
简介
AzkabanWebServer中的三个主要元素:project、job、flow
- project:工程/项目
- job:任务,project中包含的需要执行的任务
- flow:工作流,由各个job之间的依赖关系所组成
1. 登录
- 因为使用了SSl所以是 https
- host为启动WebServer服务的机器ip
- port为azkaban-web/conf/azkaban.properties中配置的jetty.ssl.port=8443
- 账号密码为 azkaban-web/conf/azkaban-users.xml 中配置的

2. 创建工程
首页四个重要的菜单
| 菜单 | 备注 |
|---|---|
| projects | 工程,最重要的部分,所有flows都在工程中运行 |
| scheduling | 显示定时任务 |
| executing | 显示当前运行的任务 |
| history | 显示历史运行任务 |
在“projects”菜单下点击“Create Project”完成创建工程,注意请使用英文,中文会报错


3. 创建job
- web页面中并没有提供创建job的功能
- 需要自行创建以.job为扩展名的文件,并将创其通过web页面上传,才能形成job任务
- 所有的job都需要有一个知道他们如何去执行的type,附:Azkaban Jobtypes 文档
.job文件中常用的参数,如下
参数 备注 dependencies 定义依赖关系,参数值为该job依赖的任务文件名(不包括.job后缀)
如果依赖多个,则以逗号分隔,如:job2,job5retries 任务失败时自动重启的次数 retry.backoff 每一次任务尝试重启时之间等待的毫秒数 working.dir 重新指定任务执行的工作目录,默认为目前正在运行的任务的工作目录 failure.emails 任务失败时的邮件提醒设置,以逗号分隔多个邮箱 success.emails 任务成功时的邮件提醒设置,以逗号分隔多个邮箱 notify.emails 任务无论失败还是成功都邮件提醒设置,以逗号分隔多个邮箱
3.1 创建 .job 文件
使用 command type 举例:
job1
# 文件名:test_1.job
type=command
command=echo "This is a test job, name is test_1."
retries=5
job2
# 文件名:test_2.job
type=command
dependencies=test_1
retries=5
command=echo "This is a test job, name is test_2."
command.1=pwd
command.2=ls –l /tmp
job3
# 文件名:test_3.job
type=command
dependencies=test_1
retries=5
command=echo "This is a test job, name is test_3."
command.1=sh /opt/azkaban/job/test_script.sh
注意:/opt/azkaban/job/test_script.sh 为事先在服务器上写好的脚本,且强烈建议使用这种形式,后期维护时,只需修改此文件内容就可以了
job4
# 文件名:test_4.job
type=command
dependencies=test_2,test_3
retries=5
command=echo "This is a test job, name is test_4."
command.1=netstat -ntlp
job5
# 文件名:test_5.job
type=command
dependencies=test_4
retries=5
command=echo "This is a test job, name is test_5."
command.1=whoami

3.2 打包
压缩所有.job文件到同一个.zip文件中
- 必须是zip压缩文件,当前仅支持zip
- 所有文件必须在压缩包的根目录中,没有子目录

3.3 创建Flow
- 上传打包好的zip文件,进而生成一个Flow
- Flow的名称为最后一个没有依赖的.job文件的文件名
选择工程,直接点击“工程名”

工程页面的三个菜单
| 菜单 | 备注 |
|---|---|
| Flows | 工作流程,有多个job组成 |
| Permissions | 权限管理 |
| Project Logs | 工程日志 |
工程页面的三个按钮
| 按钮 | 备注 |
|---|---|
| Delete Project | 删除该工程 |
| Upload | 上传zip文件,进而生成Flow |
| Download | 下载工程 |
点击“Upload”上传zip


3.4 运行Flow
Flow的三个操作按钮
| 按钮 | 备注 |
|---|---|
| Execute Flow | 配置或执行Flow |
| Executions | Flow的执行记录 |
| Summary | Flow的总结 |
点击“Execute Flow”配置执行该流程

Execute Flow 的几个菜单
| 菜单 | 备注 |
|---|---|
| Flow view | 流程视图,“右键”可以禁用/启用某些job |
| Notification | 定义任务成功或者失败是否发送邮件 |
| Failure Options | 定义一个job失败,剩下的job怎么执行 |
| Concurrent | 并行任务执行设置 |
| Flow Parametters | 参数设置 |
点击左下方的“Schedule”可设置定时执行,下方绿色字体为执行时间的提示

点击右下方“Execute”执行该Flow


“Continue”之后可以直接看到Flow的运行结果,“绿色”成功、“蓝色”执行中、“红色”失败

可查看每一个job的运行日志,如果有报错,也可以直接查看错误日志

首次运行是可能的报错
ERROR [ExecutorServlet] [Azkaban] executor became inactive before setting up the flow 1
azkaban.executor.ExecutorManagerException: executor became inactive before setting up the flow 1

需要手动去激活一下 executor,方式如下:
curl http://${executorHost}:${executorPort}/executor?action=activate

附录
参考
- 官方:https://azkaban.github.io/azkaban/docs/latest/#creating-flows
- https://juejin.im/post/5c8a289151882504715038cc
- https://www.jianshu.com/p/01188607a794
- http://www.jobplus.com.cn/article/getArticleDetail/51461
例子源码
https://github.com/remainsu/azkaban_job
Azkaban 3.73.1 使用简介的更多相关文章
- Azkaban Flow 2.0 使用简介
官方建议使用Flow 2.0来创建Azkaban工作流,且Flow 1.0将被弃用 目录 目录 一.简单的Flow 1. 新建 flow20.project 文件 2. 新建 .flow 文件 3. ...
- Azkaban 3.73.1 集群搭建(Multiple Executor)
一.简介 Azkaban是LinkedIn开源的任务调度框架,采用java编写 Azkaban功能和特点: 任务的依赖处理 任务监控,失败告警 任务流的可视化 任务权限管理 Azkaban具有轻量可插 ...
- Azkaban Condition Flow (条件工作流) 使用简介
本文上接<Azkaban Flow 2.0 使用简介>,对Azkaban Condition Flow (条件工作流) 做简单介绍 目录 目录 条件工作流 介绍 作用 使用方式 支持的运算 ...
- Storm 实战:构建大数据实时计算
Storm 实战:构建大数据实时计算(阿里巴巴集团技术丛书,大数据丛书.大型互联网公司大数据实时处理干货分享!来自淘宝一线技术团队的丰富实践,快速掌握Storm技术精髓!) 阿里巴巴集团数据平台事业部 ...
- 【原创】大数据基础之Azkaban(1)简介、源代码解析
Azkaban3.45 一 简介 1 官网 https://azkaban.github.io/ Azkaban was implemented at LinkedIn to solve the pr ...
- Azkaban 简介
本文简单介绍一下Azkaban及其特点.azkaban是一个开源的任务调度系统,用于负责任务的调度运行(如数据仓库调度),用以替代linux中的crontab. 一.Azkaban是什么? 1.1 A ...
- Azkaban简介及使用
一.Azkaban概述 Azkaban是一个分布式工作流管理器,在LinkedIn上实现,以解决Hadoop作业依赖性问题. 我们有需要按顺序运行的工作,从ETL工作到数据分析产品. 特点: 1)给用 ...
- Azkaban简介和使用
概述 为什么需要工作流调度系统 l 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序.hive脚本等 l 各任务单元之间存在时间先后及前后依 ...
- Azkaban学习之路(一)—— Azkaban 简介
一.Azkaban 介绍 1.1 背景 一个完整的大数据分析系统,必然由很多任务单元(如数据收集.数据清洗.数据存储.数据分析等)组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流.复杂的工作流 ...
随机推荐
- aspnetboilerplate && .net core 使用原生sql
利用aspnetboilerplate提供的工具类IDbContextProvider private readonly IDbContextProvider<XXXDbContext> ...
- EasyUI-DataGrid多线动态实现选择性合并
jQuery EasyUI有一个非常易于使用的数据列表控件,这是DataGrid控制.某些背景json格式可以传递给在前景中显示的控制,很强大.只要有时需求须要这样即多行合并,如在列表中假设同样的部门 ...
- Eucalyptus企业云计算(建立能够和Amazon EC2兼容的云)
Eucalyptus是与一个在加利福尼亚大学的研究性项目,创建了一个使企业能够使用它们内部IT资源(包括服务器.存储系统.网络设备)的开源界面,来建立能够和Amazon EC2兼容的云. “Eucal ...
- WPF 4 日历控件(Calendar)
原文:WPF 4 日历控件(Calendar) 在之前我已经写过两篇关于WPF 4 任务栏(Taskbar)相关的特性.相信自从VS2010 Beta 版放出后,WPF 的粉丝们肯定在第一时 ...
- IdentityServer学习目录
IdentityServer IdentityServer的基本概念与特性 IdentityServer流程图与相关术语 最简单的IdentityServer实现 最简单的IdentityServer ...
- UWP中String类型如何转换为Windows.UI.Color
原文:UWP中String类型如何转换为Windows.UI.Color 我在学习过程中遇到的,我保存主题色为string,但在我想让StatusBar随着主题色变化时发现没法使用. ThemeCol ...
- wpf屏蔽快捷键alt+space,alt+F4
/// <summary> /// 阻止 alt+f4和alt+space 按键 /// </summary> /// <par ...
- 企业级架构 MVVM 模式指南 (WPF 和 Silverlight 实现) 译(3)
第一章 表现模式关注分离(soc)是企业及软件开发中非常有用的核心原则,也是许多表现模式背后的驱动力量.在WPF和Silverlight开发中,MVVM成为了实现关注分离最为有效的设计模式.然而,这种 ...
- AngularJS 1.4对动画系统进行了彻底的重构
分享 <关于我> 分享 [中文纪录片]互联网时代 http://pan.baidu.com/s/1qWkJfcS 分享 <HTML开发MacOSAp ...
- 树莓派中安装QT
树莓派中安装QT 本文博客链接:http://blog.csdn.net/jdh99,作者:jdh,转载请注明. 环境: 主机:WIN7 硬件:树莓派 步骤: 参考链接:http://qt-proje ...