* HUE搭配基础

首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。

简单来讲,就是用图形化的界面来操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库,oozie,flume等等。

官网网站:http://gethue.com/

在官网上可以看到,如下世界知名公司都在用(地球人用了都说好?)

 
 

* 安装HUE

官网安装帮助:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html

** 安装依赖

 
 

如上图所示,这部分内容是告诉你,安装编译Hue需要依赖哪些Linux安装包,你只需要使用yum命令一次安装就可以了,在此给大家整理好该命令(注意使用root权限安装):

# yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel

尖叫提示:使用yum安装这些包的同时,也会自动安装openJDK的依赖,所以,请自行删除安装后的openJDK,忘记的同学请参考

Linux基础(二)

** 下载HUE

你去官网下载是没有问题的,在此给你开个传送门:

链接:http://pan.baidu.com/s/1pKKSOSr 密码:5r51

** 解压HUE

$ tar -zxf hue-3.7.0-cdh5.3.6.tar.gz -C /opt/modules/cdh/

** 编译HUE

到hue安装目录下,执行make apps

$ make apps

大概等个几分钟之后,就编译成功了。

** 配置Hue

修改Hue.ini文件

文件位置:/opt/modules/cdh/hue-3.7.0-cdh5.3.6/desktop/conf/hue.ini

打开之后,更改如下属性:

 
 

其中secret_key密钥的值可以来Hue安装帮助中查看到,如下图位置:

 
 

** 启动HUE

完成之后呢,保存退出,我们来使用命令启动Hue

$ build/env/bin/supervisor,出现如下界面表示启动成功:

 
 

接下来使用浏览器来查看hue界面:

http://z01:8888,接着我们就看到如下界面:

 
 

这句话是在提示你,第一次使用本工具,需要创建一个用户及密码,且会成为hue的超级用户凭证,在此呢,我设置为admin用户名,密码随意,那就123456吧,然后呢就可以见到如下界面了:

 
 

* HUE与Hadoop集成

当前集群环境:

 
NameNode与Resourcemanager均已配置HA与前几节教程一致(Bootstrap一会再说)

** 配置Hadoop文件

hdfs-site.xml

添加如图内容:

 
 

 

core-site.xml

添加如图内容:

 
 

httpfs-site.xml

配置内容如图:

 
 

我来解释一下:

1、如果没有配置NameNode的HA,HUE可以用WebHDFS来管理HDFS

2、如果配置了NameNodeHA,则HUE只可用HttpFS来管理HDFS

由于第一种方案官方说明中有完整示例,而且基于本例是在完全分布式且HA环境已经部署的情况下搭建的,所以,采用第二种方式。即配置如上,请大家注意。

尖叫提示:

1、Hadoop相关文件配置完成后,scp拷贝到其他机器节点

2、配置完成后呢,记得重启整个Hadoop集群

3、在z01机器节点上,在hadoop根目录下,使用sbin/httpfs.sh start来启动Bootstrap进程,以服务HttpFS管理

** 修改Hue.ini文件,先找到[[hdfs_clusters]]这个标签,然后修改如下图:

 
mycluster是我在core-site.xml和hdfs-site.xml中设置的集群名称,请自行查看自己的,如果你遵从了前几节的内容,则我们应该是一致的。

** 修改Hue.ini文件,先找到[[yarn_clusters]]这个标签,然后修改如下图:

 
cluster-yarn1请到yarn-site.xml中查看

** 重启HUE并测试

先使用Ctrl+C关闭HUE服务,再使用如下命令重启:

$ build/env/bin/supervisor

测试HDFS点进:File Browser选项查看如图:

 
可以进行删除,上传等操作

测试Yarn点进:Job Browser选项查看如图:

 
 

注意红框内的内容,我是按照之前提交任务的人物名来查看任务的历史记录的,可以自行到yarn中查看用户名是什么,如图:

 
 

* HUE与Hive集成

** 配置Hive文件

hive-site.xml

HUE与hive集成需要hive开启HiveServer2服务

修改如下内容如图:

 
 

** 启动Hive服务

进入Hive根目录,使用命令启动服务,末尾加上&符号,让脚本在后台运行,不至于占用终端:

$ bin/hive --service metastore &

$ bin/hive --service hiveserver2 &

尖叫提示:如果设置了uris,那么必须启动如上两个命令,否则Hive无法正常启动

** 配置Hue.ini

找到[beeswax]这个标签,配置如下:

 
 

然后重启Hue服务,在“查询编辑器”中选择Hive,即可看到如下界面,我们之前创建的一个表,查询一下试试:

 
 

* HUE与Mysql集成

** 配置Hue.ini

找到[[[mysql]]]标签,修改内容如下:

 
 

** 配置完成,重启Hue,点击“DB查询”,看到如图内容:

 
 

* Hue与Oozie集成

** 配置Hue.ini

找到[liboozie]以及[oozie]标签,修改内容如下:

 
 

** 修改Oozie配置文件

oozie-site.xml

修改一下oozie的时区,如下:

 
 

** 启动Oozie相关服务

进入到Oozie安装根目录,然后执行命令:

$ bin/oozied.sh start

然后重启Hue服务,点击Workflow-仪表板-Workflow,之前我们练习的历史记录如下:

 
 

配置完成后,可以非常简单方便的使用图形化界面创建Oozie任务,因为过于简单,在此不再赘述,请自行体验。

* 总结

这一节我们使用Hue工具将之前使用的工具和框架通过图形界面化的形式展示出来并操作,方便了日常维护和开发,里面的种种细节,请同学们自行琢磨。


个人微博:http://weibo.com/seal13

QQ大数据技术交流群(广告勿入):476966007


作者:Z尽际
链接:https://www.jianshu.com/p/93136579d4d4
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

HUE搭配基础的更多相关文章

  1. SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类

    https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...

  2. 【Hadoop离线基础总结】Hue的简单介绍和安装部署

    目录 Hue的简单介绍 概述 核心功能 安装部署 下载Hue的压缩包并上传到linux解压 编译安装启动 启动Hue进程 hue与其他框架的集成 Hue与Hadoop集成 Hue与Hive集成 Hue ...

  3. [iOS基础控件 - 6.10.1] PickerView 餐点搭配Demo

    A.需求 1.使用PickerView做出有3列餐点(水果.主菜.饮料)的搭配Demo 2.选择的餐点实时显示在“显示区” 3.提供“随机”按钮,随机选择菜品搭配   B.实现步骤 1.拖入一个Pic ...

  4. 【原创】大数据基础之Ambari(5)通过Ambari部署Hue

    ambari2.7.3(hdp3.1) 安装 hue4.2 ambari的hdp中原生不支持hue安装,下面介绍如何通过添加service的方式使ambari支持hue安装: 官方:http://ge ...

  5. 【Hadoop离线基础总结】Hue与oozie集成

    目录 1.停止oozie与hue的进程 2.修改oozie的配置文件 3.修改hue的配置文件 4.启动hue与oozie的进程 5.页面访问hue 1.停止oozie与hue的进程 bin/oozi ...

  6. 【Hadoop离线基础总结】Hue与Mysql集成

    Hue与Mysql集成 1.修改hue.ini配置文件 这里要去掉#,打开mysql注释,大概在1547行 [[[mysql]]] nice_name="My SQL DB" en ...

  7. 【Hadoop离线基础总结】Hue与Impala集成

    Hue与Impala集成 1.修改hue.ini配置文件 [impala] server_host=node03 server_port=21050 impala_conf_dir=/etc/impa ...

  8. 【Hadoop离线基础总结】Hue与Hive集成

    目录 1.更改hue的配置hue.ini 2.启动hive的metastore以及hiveserver2服务 3.启动hue进程,查看Hive是否与Hue集成成功 1.更改hue的配置hue.ini ...

  9. 【Hadoop离线基础总结】Hue与Hadoop集成

    目录 1.更改所有hadoop节点的core-site.xml配置 2.更改所有hadoop节点的hdfs-site.xml 3.重启hadoop集群 4.停止hue的服务,并继续配置hue.ini ...

随机推荐

  1. WAP 图片 lazyload

    原理是根据屏幕上的坐标找到需要做 lazyload 的区域 1,先监听 scroll 事件 ,scrolling_lt window.addEventListener('scroll', functi ...

  2. node 命令行输入控件 prompt.js

        function print(){ console.log.apply(console , arguments) } var step ,_lstStp ,_onConfirmInput ,_ ...

  3. Linux下DNS服务器搭建详解

    Linux下DNS服务器搭建详解 DNS  即Domain Name System(域名系统)的缩写,它是一种将ip地址转换成对应的主机名或将主机名转换成与之相对应ip地址的一种机制.其中通过域名解析 ...

  4. 固比固布局 圣杯布局 css实现传统手机app布局

    手机app的布局大致上都是头部.内容.底部三部分: 我们需要实现的是头部.底部高度固定:中间内容区域自适应且可以滚动:直接贴代码: css: html,body { width: 100%; heig ...

  5. Install Rails on ubuntu 12.04 LTS

    There are basically there ways to install Rails development environment on your ubuntu linux system, ...

  6. 使用NFS共享硬盘

    1. 安装 sudo apt install nfs-kernel-server   2. 配置   sudo vi /etc/exports   /mnt/NewDisk *(rw,sync,no_ ...

  7. mysql导入数据,涉及到时间转换,乱码问题解决

    表结构: drop table if exists `qi_an_log`;CREATE TABLE `qian_log` (`dt` LONG NOT NULL COMMENT '产生日期,格式yy ...

  8. 你不知道的JavaScript(十)with关键字

    with关键字在JavaScript中不太常用,用来定义一个和对象相关的作用域,在该作用域中可以访问对象的属性或方法而前面无需加上对象名,以达到简化代码的目的. <script type=&qu ...

  9. 51nod 1435 位数阶乘 (手动计算)

    题目: 1435 位数阶乘 题目来源: CodeForces 基准时间限制:1 秒 空间限制:131072 KB 分值: 40 难度:4级算法题 X是一个n位数的正整数 (x=a0a1...an−1) ...

  10. Struts1、Struts2、Hibernate、Spring框架工作原理介绍

    Struts1工作原理 Struts1工作原理图 1.初始化:struts框架的总控制器ActionServlet是一个Servlet,它在web.xml中配置成自动启动的Servlet,在启动时总控 ...