17.Azkaban实战

首先创建一个command.job文件

#command.job

type=command

command=echo it18zhang

然后打成zip压缩包

上传刚刚打包的zip包

上传完后可以执行他

可以定时执行

现在我们立马执行

现在我们要执行一个脚本

新建一个commad1.job文件

#command.job

type=command

command=bash hello.sh

再编写一个hello,sh脚本

#!/bin/bash

echo 'hello it18zhang~~~~'

把两个文件都选上一起打包

上传刚刚打的zip包

执行

创建有依赖关系的多个job描述

新建一个bar.job

# bar.job

type=command

dependencies=foo

command=echo bar

新建一个foo.job

# foo.job

type=command

command=echo foo

把这两个文件一起打成zip包

HDFS操作任务

新建文件fs.job

# fs.job

type=command

command=/opt/modules/hadoop-2.6./bin/hadoop fs -mkdir /azaz

打包成zip包

MAPREDUCE任务

先创建一个输入路径

创建一个数据文件b.txt

输入一些单词

把b.txt文件上传到hdfs上

创建mrwc.job文件

# mrwc.job

type=command

command=/opt/modules/hadoop-2.6./bin/hadoop  jar hadoop-mapreduce-examples-2.6..jar wordcount /wordcount/input /wordcount/azout

把这两个文件一起打包

在azkaban创建一个project

可以看到执行成功了

HIVE脚本任务

先创建目录

hadoop fs -mkdir -p /aztest/hiveinput

新建一个c.txt数据文件

把c.txt文件上传到HDFS上

新建hivef.job

# hivef.job

type=command

command=/opt/modules/hive/bin/hive -f 'test.sql'

新建test.sql

use default;

drop table aztest;

create table aztest(id int,name string) row format delimited fields terminated by ',' ;

load data inpath '/aztest/hiveinput' into table aztest;

create table azres as select * from aztest;

insert overwrite directory '/aztest/hiveoutput' select count() from aztest;

打包成hivef.zip

可以看到失败了，查看原因

把本地hive的Lib目录下的mysql连接包的版本更换一下

换成这个5.1.28版本

再运行一次，同样失败了，但是hive和hdfs上出来了相应的结果，具有原因我也不懂

17.Azkaban实战的更多相关文章

大数据技术之_13_Azkaban学习_Azkaban(阿兹卡班)介绍 + Azkaban 安装部署 + Azkaban 实战
一概述1.1 为什么需要工作流调度系统1.2 常见工作流调度系统1.3 各种调度工具特性对比1.4 Azkaban 与 Oozie 对比二 Azkaban(阿兹卡班) 介绍三 Azkaban 安装部 ...
Azkaban实战，Command类型单一job示例，任务中执行外部shell脚本，Command类型多job工作flow,HDFS操作任务，MapReduce任务，HIVE任务
本文转载自:https://blog.csdn.net/tototuzuoquan/article/details/73251616 1.Azkaban实战 Azkaba内置的任务类型支持comman ...
Hadoop生态圈-Azkaban实战之Command类型执行指定脚本
Hadoop生态圈-Azkaban实战之Command类型执行指定脚本作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 1>.服务端测试代码(别忘记添加权限哟!) [yinzh ...
Hadoop生态圈-Azkaban实战之Command类型多job工作流flow
Hadoop生态圈-Azkaban实战之Command类型多job工作流flow 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. Azkaban内置的任务类型支持command.ja ...
azkaban(安装配置加实战)
为什么需要工作流调度系统 一个完整的数据分析系统通常都是由大量任务单元组成:shell 脚本程序,java 程序,mapreduce 程序.hive 脚本等 各任务单元之间存在时间先后及前后依赖关 ...
Flume+Sqoop+Azkaban笔记
大纲(辅助系统) 离线辅助系统数据接入 Flume介绍 Flume组件 Flume实战案例任务调度调度器基础市面上调度工具 Oozie的使用 Oozie的流程定义详解数据导出 sqoop基础 ...
【大数据】Azkaban学习笔记
一概述 1.1 为什么需要工作流调度系统 1)一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序.hive脚本等 2)各任务单元之间存在时间 ...
《Spring 3.x 企业应用开发实战》目录
图书信息:陈雄华林开雄编著 ISBN 978-7-121-15213-9 概述: 第1章:对Spring框架进行宏观性的概述,力图使读者建立起对Spring整体性的认识. 第2章:通过一个简单的例 ...
AI人工智能顶级实战工程师课程大纲
课程名称内容阶段一.人工智能基础 — 高等数学必知必会 1.数据分析 "a. 常数eb. 导数c. 梯度d. Taylore. gini系数f. 信息熵与组合数 ...

随机推荐

我带旅游ERP管理系统开发的经历
前言不怎么会写博文的我也不知道怎么写,但是有冲动让我去记录下我做项目的经历. 项目背景某旅行社需要一款内部业务管理系统,找了一家外包来开发但最终不是她们想要的,上线的时候很多问题,首先酒店和票务资 ...
Python装饰器的应用场景
装饰器的应用场景附加功能数据的清理或添加: 函数参数类型验证 @require_ints 类似请求前拦截数据格式转换将函数返回字典改为 JSON/YAML 类似响应后篡改为函数提供额外的数据 ...
docker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting container process caused "exec: \"ping\": executable file not found in $PATH": unknown.
docker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting cont ...
RHSA-2018:0014-重要: linux-firmware 安全更新
修复命令: yum update iwl2030-firmware yum update iwl5000-firmware yum update iwl100-firmware yum update ...
app支付宝充值
首先支付宝需要开通app 支付然后登录支付宝 ,点击合作伙伴, 进入开放平台,申请一个应用. 下载支付宝开放平台助手, 生成应用公钥,点击上传设置进入之前申请的应用,支付宝自动生成支付宝公钥,设 ...
php多线程的概念
来源:http://www.cnblogs.com/zhenbianshu/p/7978835.html 多线程线程首先说下线程: 线程(thread) 是操作系统能够进行运算调度的最小单位.它被 ...
URL编码和解码
1. 为什么需要编码当数据不利于处理.存储的时候,就需要对它们进行编码.如对字符进行编码是因为自然语言中的字符不利于计算机处理和存储.对图片信息.视频信息.声音信息进行压缩.优化,将其“格式化”,是 ...
webpy简单入门---1
1. 2. 3. 4.
zabbix通过SDK和API获取阿里云RDS的监控数据
阿里云的RDS自带的监控系统获取数据不怎么直观,想要通过API获取数据通过zabbix显示,因为网上资料缺乏和其他一些原因,获取API签名很困难,但使用阿里云的SDK可以完美避开获取签名的步骤. 阿里 ...
Java集合(0)：概述
下面是一个Java集合的简化图,我们可以看出,集合分Collection和Map两大部分: 接下来分别以下面几个章节介绍Java集合: Java集合(1):Collections工具类中的static ...