1. 解压  tar -zxvf oozie-4.0.0-cdh5.3.6.tar.gz

2.配置hadoop的集群,添加一个代理用户(给oozie运行mapreduce的权限)

在hadoop的core-site.xml配置文件中添加 (要在hadoop启动之前添加)    root  可以改成 当前操作系统的用户  eg:beifeng

     <!-- OOZIE 添加代理-->
<property>
<!-- OOZIE 的启动用户-->
<name>hadoop.proxyuser.root.hosts</name>
<!-- OOZIE 所在的主机-->
<value>hadoop</value>
</property>
<property>
<!-- OOZIE 用户的组-->
<name>hadoop.proxyuser.root.groups</name>
<value>*</value>
</property>

配置 oozie 的配置文件  oozie-site.xml

3.解压   oozie-hadooplibs-4.0.0-cdh5.3.6.tar.gz

多了一个文件

jar包存放位置 /opt/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/oozie-4.0.0-cdh5.3.6/hadooplibs/hadooplib-2.5.0-cdh5.3.6.oozie-4.0.0-cdh5.3.6

4:拷贝jar至 libxt目录下

5:把ext.zip拷贝到刚创建的libxt目录下

6:运行oozie-setup.sh脚本的所有组件配置Oozie添加到libext /目录。

语法:

 $ bin/oozie-setup.sh prepare-war [-d directory] [-secure]
sharelib create -fs <FS_URI> [-locallib <PATH>]
sharelib upgrade -fs <FS_URI> [-locallib <PATH>]
db create|upgrade|postupgrad -run [-sqlfile <FILE>]

将jar包导成war包

1 bin/oozie-setup.sh prepare-war -d /opt/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/libxt

7:启动hadoop  创建一个hdfs目录oozie共享包  /user/root/share/lib/lib_20171214123146

 bin/oozie-setup.sh sharelib create -fs hdfs://hadoop -locallib oozie-sharelib-4.0.0-cdh5.3.6-yarn.tar.gz

(ps:如果已经存在直接使用upgrade更新最新的lib    bin/oozie-setup.sh sharelib upgrade -fs hdfs://hadoop -locallib oozie-sharelib-4.0.0-cdh5.3.6-yarn.tar.gz

8:创建数据库

 bin/ooziedb.sh create -sqlfile oozie.sql -run DB Connection

9:启动oozie

 *在控制台启动
bin/oozied.sh run
*在后台启动
bin/oozied.sh start | stop

多了一个

10:oozie的日志目录

 more /opt/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/logs/oozie.log

补充一下 more的用法

11:访问 web端   http://hadoop:11000/oozie/

12:运行 example application

1) 解压

oozie-examples.tar.gz
 tar -zxf oozie-examples.tar.gz

2) 上传examples至hdfs用户主目录下

  /opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/bin/hadoop dfs -put examples examples

注意:这里本地的/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/examples/apps/*里面的文件发生变化不用同步到hdfs的文件中

3)  修改job.properties

oozie-4.0.0-cdh5.3.6/examples/apps/map-reduce/job.properties

 #jobTracker=hadoop:8032 yrc是resourcemanager的ha cluster-id
jobTracker=yrc
# 队列 yarn的资源是按队列分配的
queueName=default
examplesRoot=examples #定义一个workflow工作流的路径,一个路径下只能有一个workflow.xml
oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce/workflow.xml
outputDir=map-reduce

4)运行job
###方法一 直接使用-oozie http://localhost:11000/oozie

 bin/oozie job -oozie http://localhost:11000/oozie -config examples/apps/map-reduce/job.properties -run

###方法二 配置环境变量

 export OOZIE_URL=http://localhost:11000/oozie
bin/oozie job -config examples/apps/map-reduce/job.properties -run

出现两个任务的原因是 oozie本身就是一个MapReduce 它又运行了一个MapReduce程序所以会有两个任务

也可以在命令行查看结果

 bin/oozie job --oozie http://localhost:11000/oozie -config examples/apps/map-reduce/job.properties -info 0000000-170205191208965-oozie-chk-W

这个博客里面详细的介绍了 oozie运行时的一些错误场景以及解决方案

  http://blog.csdn.net/wiborgite/article/details/78585689

(4)oozie本身是一个MapReduce程序,仅仅只有Map Task。
          针对不同类型的任务,workflow,模板
(5)workflow action nodes
          *actions可以计算处理,运行在框架(远程)
          *actions是异步的
          *actions有两个状态:要么成功(ok)要么失败(error)
          *actions可以自动恢复
(6)如何定义一个WorkFlow

* job.properties
                关键点:指向workflow.xml文件所在的HDFS位置
         * workflow.xml
               定义文件
               XML文件
                  包含几点
                        * start
                        * action
                              MapReduce、Hive、Sqoop、Shell
                             * ok
                             * error
                       * kill
                      * end
        * lib 目录
              依赖的jar包

workflow.xml编写:
       * 流程控制节点
      * Action节点
   注意:节点名称必需复合 [a-zA-Z][\-_a-zA-Z0-0]* ,最大20个字符

oozie的简易安装的更多相关文章

  1. VMware Tools的简易安装---解决Ubuntu 14.10不能满屏显示问题

    由于使用的VMware WorkStation是中文破解版,安装时又是简易安装,因此VMware Tools并没有安装上,导致Ubuntu 14.10在VMware中装上之后,并不能满屏显示,如图1所 ...

  2. LAMP简易安装

    看,老鸟绕道–LAMP简易安装 导读 LAMP是企业中最常用的服务,也是非常稳定的网站架构平台.其中L-指的是Linux,A-指的是Apache,m-指的是mysql或者marriDB,p-php.相 ...

  3. 简易安装python统计包

    PythonCharm简易安装python统计包及 本文介绍使用pythonCharm IDE 来安装Python统计包或一些packages的简单过程,基本无任何技术难度,顺便提一提笔者在安装过程中 ...

  4. HBase介绍及简易安装(转)

    HBase介绍及简易安装(转) HBase简介 HBase是Apache Hadoop的数据库,能够对大型数据提供随机.实时的读写访问,是Google的BigTable的开源实现.HBase的目标是存 ...

  5. VMware 非简易安装centos6(静态ip配置)

    1.选择新建虚拟机 在弹出框中我选择推荐安装 然后点击下一步 2.选择稍后安装操作系统(不然会默认简易安装) 接着一直下一步就可以了,最后到这个页面 4.如下图选择事先下载好的安装文件 5.配置桥接模 ...

  6. centos中简易安装docker

    centos中简易安装docker准备环境要求:请确保自己的centos的内核版本大于3.10,使用如下linux命令: uname -r1显示如下类似信息: 3.10.0-862.3.3.el7.x ...

  7. Django简易安装

    Django简易安装 1,下载 https://www.djangoproject.com/download/ 2, 拷贝至python同级目录 python setup.py install 3,在 ...

  8. Oracle client客户端简易安装网上文档一

    Oracle client客户端简易安装网上文档一-------------------------------------------------------------------------一. ...

  9. AngularJS的开发工具---yeoman 简易安装

    AngularJS 不错,yeoman作为推荐开发工具,网上的安装步骤较烦,这里给出简易步骤. 1.安装 Ruby     自己到 Ruby 官方下载最新安装包: http://rubyinstall ...

随机推荐

  1. 使用 virt-install 创建虚拟机

    使用 virt-install 创建虚拟机 virt-install --help 使用 qemu-kvm 创建虚拟机 介绍 1:命令路径:/usr/libexec/qemu-kvm   2:添加至环 ...

  2. Qt多线程-QThreadPool线程池与QRunnable

    版权声明:若无来源注明,Techie亮博客文章均为原创. 转载请以链接形式标明本文标题和地址: 本文标题:Qt多线程-QThreadPool线程池与QRunnable     本文地址:https:/ ...

  3. 第二周:PSP&进度条

    PSP: 一.词频统计改进 1.表格:     C类型 C内容 S开始时间 E结束时间 I时间间隔 T净时间(mins) 预计花费时间(hrs) 学习 <构建之法>.Java 8:46 1 ...

  4. Cmder命令行工具在Windows系统中的配置

    一.Cmder简介 Cmder:一款用于Windows系统中,可增强传统cmd命令行工具的控制台模拟器(类似于Linux系统中的终端控制窗口) 特点: 无需安装,解压即用 可使用较多Linux命令,如 ...

  5. 解决Lenovo(ldeapad)笔记本F1-F12功能键操作无效的问题

    1.操作条件:Lenovo笔记本自带的“一键恢复”按钮 2.操作方法:上下键为切换选项,回车键(Enter)为确定选择 (1)在笔记本电脑关机状态下,使用曲别针或其他物件按下笔记本自带的“一键恢复按钮 ...

  6. java网络编程(二)可中断套接字

    参考资料:java核心技术 卷II 为中断套接字操作,可使用java.nio包提供的SocketChannel类.可以使用如下方式打开SocketChannel: SocketChannel chan ...

  7. 【Jmeter】集合点Synchronizing Timer

    集合点: 简单来理解一下,虽然我们的“性能测试”理解为“多用户并发测试”,但真正的并发是不存在的,为了更真实的实现并发这感念,我们可以在需要压力的地方设置集合点,每到输入用户名和密码登录时,所有的虚拟 ...

  8. Find the hotel HDU - 3193(RMQ)

    题意: 有n个旅馆,从这n个旅馆中找出若干个旅馆,使得这若干个旅馆满足这样的条件:不能从其它和剩下的旅馆中找到一个价格和距离都小于这个旅馆的旅馆... 解析: 按price 排序,若price相同, ...

  9. 【刷题】HDU 4966 GGS-DDU

    Problem Description Do you think this is a strange problem name? That is because you don't know its ...

  10. linux 操作swap分区

    Swap是Linux下的交换分区,类似Windows的虚拟内存,当物理内存不足时,系统可把一些内存中不常用到的程序放入Swap,解决物理内存不足的情况. 若系统安装时开辟的Swap空间太小,可通过手动 ...