1.22-1.24 Oozie企业使用案例

一、将hive的表数据用sqoop抽取到mysql

1、编写oozie workflow和Coordinator

##

[root@hadoop-senior oozie-apps]# pwd

/opt/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/oozie-apps

[root@hadoop-senior oozie-apps]# ls wf-user-select/

coordinator.xml  hive-site.xml  job.properties  lib  select-user.sql  workflow.xml

[root@hadoop-senior oozie-apps]# ls wf-user-select/lib/

mysql-connector-java-5.1.27-bin.jar

##job.properties    //start:2019-05-17   end:2019-05-18 ，此任务执行周期为1天

nameNode=hdfs://hadoop-senior.ibeifeng.com:8020

jobTracker=hadoop-senior.ibeifeng.com:8032

queueName=default

oozieAppsRoot=user/root/oozie-apps

oozieDataRoot=user/root/oozie/datas

oozie.use.system.libpath=true

oozie.coord.application.path=${nameNode}/${oozieAppsRoot}/wf-user-select

start=2019-05-17T13:45+0800

end=2019-05-18T14:00+0800

workflowAppUri=${nameNode}/${oozieAppsRoot}/wf-user-select

outputDir=wf-user-select/output

##workflow.xml

<workflow-app xmlns="uri:oozie:workflow:0.5" name="wf-user-select">

    <start to="hive-node"/>

    <action name="hive-node">

        <hive xmlns="uri:oozie:hive-action:0.5">

            <job-tracker>${jobTracker}</job-tracker>

            <name-node>${nameNode}</name-node>

            <prepare>

                <delete path="${nameNode}/${oozieDataRoot}/${outputDir}"/>

            </prepare>

            <job-xml>${nameNode}/${oozieAppsRoot}/hive-select/hive-site.xml</job-xml>

            <configuration>

                <property>

                    <name>mapred.job.queue.name</name>

                    <value>${queueName}</value>

                </property>

            </configuration>

            <script>select-user.sql</script>

            <param>OUTPUT=${nameNode}/${oozieDataRoot}/${outputDir}</param>

        </hive>

        <ok to="sqoop-node"/>

        <error to="fail"/>

    </action>

    <action name="sqoop-node">

        <sqoop xmlns="uri:oozie:sqoop-action:0.3">

            <job-tracker>${jobTracker}</job-tracker>

            <name-node>${nameNode}</name-node>

            <configuration>

                <property>

                    <name>mapred.job.queue.name</name>

                    <value>${queueName}</value>

                </property>

            </configuration>

            <command>export --connect jdbc:mysql://hadoop-senior.ibeifeng.com:3306/test --username root --password 123456 --table my_user --num-mappers 1 --fields-terminated-by "\t" --export-dir /user/root/oozie/datas/wf-user-select/output</command>

        </sqoop>

        <ok to="end"/>

        <error to="fail"/>

    </action>

##select-user.sql

--drop table tmp_user

drop table if exists default.tmp_user ;

--create table tmp_user

create table default.tmp_user like user_hive location '${OUTPUT}' ;

--load data to tmp_user

insert into table tmp_user

select

    id, account, password

from

    user_hive

where

        id >= 15

    and

        account like 'beif%' ;

##coordinator.xml        //每天1点30开始执行，

<coordinator-app name="cron-coord" frequency="30 1 * * *"

                start="${start}" end="${end}" timezone="GMT+0800"

                xmlns="uri:oozie:coordinator:0.4">

        <action>

        <workflow>

            <app-path>${workflowAppUri}</app-path>

            <configuration>

                <property>

                    <name>jobTracker</name>

                    <value>${jobTracker}</value>

                </property>

                <property>

                    <name>nameNode</name>

                    <value>${nameNode}</value>

                </property>

                <property>

                    <name>queueName</name>

                    <value>${queueName}</value>

                </property>

            </configuration>

        </workflow>

    </action>

</coordinator-app>

##hive-site.xml

2、执行

[root@hadoop-senior oozie-apps]# /opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/bin/hdfs dfs -put wf-user-select/ oozie-apps/

[root@hadoop-senior oozie-4.0.0-cdh5.3.6]# bin/oozie job -config oozie-apps/wf-user-select/job.properties -run

1.22-1.24 Oozie企业使用案例的更多相关文章

7个自定义定时任务并发送消息至邮箱或企业微信案例（crontab和at）
前言更好熟悉掌握at.crontab定时自定义任务用法. 实验at.crontab定时自定义任务运用场景案例. 作业.笔记需要. 定时计划任务相关命令及配置文件简要说明 at 工具由包 at 提供 ...
《Linux企业应用案例精解(第2版)》新书开始发售
<Linux企业应用案例精解(第2版)>新书开始发售 650) this.width=650;" title="linux企业应用案例精解第2版" alt= ...
Jenkins 搭建企业实战案例 (发布与回滚)
让我们的代码部署变得easy,不再难,Jenkins是一个可扩展的持续集成引擎,是一个开源软件项目,旨在提供一个开放易用的软件平台,使软件的持续集成变成可能.Jenkins非常易于安装和配置,简单易用 ...
3.awk数组详解及企业实战案例
awk数组详解及企业实战案例 3.打印数组: [root@nfs-server test]# awk 'BEGIN{array[1]="zhurui";array[2]=" ...
《Linux企业应用案例精解》一书配套视频发布
<Linux企业应用案例精解>一书配套视频发布(每周更新视频教程),通过读者平台账号,可以在平台下载AVI格式.所有读者都能获得本书中涉及的软件资料,轻松搭建你的学习环境. 当当购书地址: ...
hadoop 企业应用案例--大众点评
hadoop 企业应用案例--大众点评 http://f.dataguru.cn/thread-260531-1-1.html
有关memcached企业面试案例讲解
有关memcached企业面试案例讲解 1.Memcached是什么,有什么作用? a. memcached是一个开源的.高性能的内存的缓存软件,从名称上看Mem就是内存的意思,而Cache就是 ...
ESB架构之企业实施案例
ESB架构之企业实施案例 ESB解决令企业最头痛的信息系统整合问题 SOA 架构中的ESB是更好的应用于异构系统集成整合还是用于统一服务调用/基础服务实施
大数据技术之_09_Flume学习_Flume概述+Flume快速入门+Flume企业开发案例+Flume监控之Ganglia+Flume高级之自定义MySQLSource+Flume企业真实面试题（重点）
第1章 Flume概述1.1 Flume定义1.2 Flume组成架构1.2.1 Agent1.2.2 Source1.2.3 Channel1.2.4 Sink1.2.5 Event1.3 Flum ...

随机推荐

两种IO模式：Proactor与Reactor模式
在高性能的I/O设计中,有两个比较著名的模式Reactor和Proactor模式,其中Reactor模式用于同步I/O,而Proactor运用于异步I/O操作. 在比较这两个模式之前,我们首先的搞明白 ...
【Sprint3冲刺之前】项目完成时间表
Sprint2冲刺成果——项目完成时间表项目完成时间表经过Sprint2小组总结会议的探讨,我们决定一起约定项目alpha版本,beta版本,release版本的发布时间,发布形式及预计完成效果 ...
Android.mk: recipe commences before first target. Stop.
[GUIDE] Setup Android Development Environment on Ubuntu 14.04 Trusty Tahr Hi All, This originally wa ...
【ZZ】Visual C++ 6.0 精简安装版（支持VA、ICC 等等安装）
(2012-04-22 08:10:10) 标签: it 分类: 软件_Software Visual C++ 6.0 精简安装版(支持VA.ICC 等等安装) 2012-04-16 21:07 想找 ...
集群服务器状态命令------rs.status()各个字段的含义
可根据rs.status() 查询集群服务器状态.字段解释: self 这个信息出现在执行rs.status()函数的成员信息中 stateStr用户描述服务器状态的字符串.有SECONDARY,PR ...
Qt 5.5.0 Windows环境搭建
1)訪问官方站点:http://www.qt.io/download-open-source/ 2)选择离线安装包 3)选择 Windows 离线安装包(32 位或 64 位都可用,Windows 6 ...
Linux把查询结果写入到文本
在Linux命令模式下,可以将查询结果写入文件.大概有两种方式,增量写入和覆盖写入. 增量写入: #iostat -m >> /tmp/iostat.txt 覆盖写入: #iostat - ...
pygame 安装教程
步骤: 1.去官网下载PyGame 注意:要下载对应版本的包官网地址:http://www.pygame.org/download.shtml 其中,如果python为以下版本: python 3. ...
C# wince 实现软件忙鼠标状态改变
eg: Cursor.Current = Cursors.WaitCursor; dosomething(); Cursor.Current = Cursors.Default; Cursor.Cur ...
Sparksql 取代 Hive？
sparksql hive https://databricks.com/blog/2014/07/01/shark-spark-sql-hive-on-spark-and-the-future-o ...

1.22-1.24 Oozie企业使用案例

1.22-1.24 Oozie企业使用案例的更多相关文章

随机推荐

热门专题