HUE搭配基础
* HUE搭配基础
首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。
简单来讲,就是用图形化的界面来操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库,oozie,flume等等。
官网网站:http://gethue.com/
在官网上可以看到,如下世界知名公司都在用(地球人用了都说好?)

* 安装HUE
官网安装帮助:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html
** 安装依赖

如上图所示,这部分内容是告诉你,安装编译Hue需要依赖哪些Linux安装包,你只需要使用yum命令一次安装就可以了,在此给大家整理好该命令(注意使用root权限安装):
# yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel
尖叫提示:使用yum安装这些包的同时,也会自动安装openJDK的依赖,所以,请自行删除安装后的openJDK,忘记的同学请参考
** 下载HUE
你去官网下载是没有问题的,在此给你开个传送门:
链接:http://pan.baidu.com/s/1pKKSOSr 密码:5r51
** 解压HUE
$ tar -zxf hue-3.7.0-cdh5.3.6.tar.gz -C /opt/modules/cdh/
** 编译HUE
到hue安装目录下,执行make apps
$ make apps
大概等个几分钟之后,就编译成功了。
** 配置Hue
修改Hue.ini文件
文件位置:/opt/modules/cdh/hue-3.7.0-cdh5.3.6/desktop/conf/hue.ini
打开之后,更改如下属性:

其中secret_key密钥的值可以来Hue安装帮助中查看到,如下图位置:

** 启动HUE
完成之后呢,保存退出,我们来使用命令启动Hue
$ build/env/bin/supervisor,出现如下界面表示启动成功:

接下来使用浏览器来查看hue界面:
http://z01:8888,接着我们就看到如下界面:

这句话是在提示你,第一次使用本工具,需要创建一个用户及密码,且会成为hue的超级用户凭证,在此呢,我设置为admin用户名,密码随意,那就123456吧,然后呢就可以见到如下界面了:

* HUE与Hadoop集成
当前集群环境:

** 配置Hadoop文件
hdfs-site.xml
添加如图内容:

core-site.xml
添加如图内容:

httpfs-site.xml
配置内容如图:

我来解释一下:
1、如果没有配置NameNode的HA,HUE可以用WebHDFS来管理HDFS
2、如果配置了NameNodeHA,则HUE只可用HttpFS来管理HDFS
由于第一种方案官方说明中有完整示例,而且基于本例是在完全分布式且HA环境已经部署的情况下搭建的,所以,采用第二种方式。即配置如上,请大家注意。
尖叫提示:
1、Hadoop相关文件配置完成后,scp拷贝到其他机器节点
2、配置完成后呢,记得重启整个Hadoop集群
3、在z01机器节点上,在hadoop根目录下,使用sbin/httpfs.sh start来启动Bootstrap进程,以服务HttpFS管理
** 修改Hue.ini文件,先找到[[hdfs_clusters]]这个标签,然后修改如下图:

** 修改Hue.ini文件,先找到[[yarn_clusters]]这个标签,然后修改如下图:

** 重启HUE并测试
先使用Ctrl+C关闭HUE服务,再使用如下命令重启:
$ build/env/bin/supervisor
测试HDFS点进:File Browser选项查看如图:

测试Yarn点进:Job Browser选项查看如图:

注意红框内的内容,我是按照之前提交任务的人物名来查看任务的历史记录的,可以自行到yarn中查看用户名是什么,如图:

* HUE与Hive集成
** 配置Hive文件
hive-site.xml
HUE与hive集成需要hive开启HiveServer2服务
修改如下内容如图:

** 启动Hive服务
进入Hive根目录,使用命令启动服务,末尾加上&符号,让脚本在后台运行,不至于占用终端:
$ bin/hive --service metastore &
$ bin/hive --service hiveserver2 &
尖叫提示:如果设置了uris,那么必须启动如上两个命令,否则Hive无法正常启动
** 配置Hue.ini
找到[beeswax]这个标签,配置如下:

然后重启Hue服务,在“查询编辑器”中选择Hive,即可看到如下界面,我们之前创建的一个表,查询一下试试:

* HUE与Mysql集成
** 配置Hue.ini
找到[[[mysql]]]标签,修改内容如下:

** 配置完成,重启Hue,点击“DB查询”,看到如图内容:

* Hue与Oozie集成
** 配置Hue.ini
找到[liboozie]以及[oozie]标签,修改内容如下:

** 修改Oozie配置文件
oozie-site.xml
修改一下oozie的时区,如下:

** 启动Oozie相关服务
进入到Oozie安装根目录,然后执行命令:
$ bin/oozied.sh start
然后重启Hue服务,点击Workflow-仪表板-Workflow,之前我们练习的历史记录如下:

配置完成后,可以非常简单方便的使用图形化界面创建Oozie任务,因为过于简单,在此不再赘述,请自行体验。
* 总结
这一节我们使用Hue工具将之前使用的工具和框架通过图形界面化的形式展示出来并操作,方便了日常维护和开发,里面的种种细节,请同学们自行琢磨。
个人微博:http://weibo.com/seal13
QQ大数据技术交流群(广告勿入):476966007
- 作者:Z尽际
链接:https://www.jianshu.com/p/93136579d4d4
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
HUE搭配基础的更多相关文章
- SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...
- 【Hadoop离线基础总结】Hue的简单介绍和安装部署
目录 Hue的简单介绍 概述 核心功能 安装部署 下载Hue的压缩包并上传到linux解压 编译安装启动 启动Hue进程 hue与其他框架的集成 Hue与Hadoop集成 Hue与Hive集成 Hue ...
- [iOS基础控件 - 6.10.1] PickerView 餐点搭配Demo
A.需求 1.使用PickerView做出有3列餐点(水果.主菜.饮料)的搭配Demo 2.选择的餐点实时显示在“显示区” 3.提供“随机”按钮,随机选择菜品搭配 B.实现步骤 1.拖入一个Pic ...
- 【原创】大数据基础之Ambari(5)通过Ambari部署Hue
ambari2.7.3(hdp3.1) 安装 hue4.2 ambari的hdp中原生不支持hue安装,下面介绍如何通过添加service的方式使ambari支持hue安装: 官方:http://ge ...
- 【Hadoop离线基础总结】Hue与oozie集成
目录 1.停止oozie与hue的进程 2.修改oozie的配置文件 3.修改hue的配置文件 4.启动hue与oozie的进程 5.页面访问hue 1.停止oozie与hue的进程 bin/oozi ...
- 【Hadoop离线基础总结】Hue与Mysql集成
Hue与Mysql集成 1.修改hue.ini配置文件 这里要去掉#,打开mysql注释,大概在1547行 [[[mysql]]] nice_name="My SQL DB" en ...
- 【Hadoop离线基础总结】Hue与Impala集成
Hue与Impala集成 1.修改hue.ini配置文件 [impala] server_host=node03 server_port=21050 impala_conf_dir=/etc/impa ...
- 【Hadoop离线基础总结】Hue与Hive集成
目录 1.更改hue的配置hue.ini 2.启动hive的metastore以及hiveserver2服务 3.启动hue进程,查看Hive是否与Hue集成成功 1.更改hue的配置hue.ini ...
- 【Hadoop离线基础总结】Hue与Hadoop集成
目录 1.更改所有hadoop节点的core-site.xml配置 2.更改所有hadoop节点的hdfs-site.xml 3.重启hadoop集群 4.停止hue的服务,并继续配置hue.ini ...
随机推荐
- iOS CoreData 介绍和使用(以及一些注意事项)
iOS CoreData介绍和使用(以及一些注意事项) 最近花了一点时间整理了一下CoreData,对于经常使用SQLite的我来说,用这个真的有点用不惯,个人觉得实在是没发现什么亮点,不喜勿喷啊.不 ...
- 解读HDFS(转载)
是蛮久木有写过关于hadoop的博客了额,虽然最近也看了一些关于linux的基础知识,但似乎把这个东西忘记了,其实时不时回顾一下以前的知识还是蛮有意思的,且行且忆! 我们Hadoop 主要由HDFS和 ...
- 如何将MVC AREA中的某一个页设为起始页
public class RouteConfig { public static void RegisterRoutes(RouteCollection routes) { routes.Ignore ...
- 一天一个算法:C语言解答杨辉三角
杨辉三角形是形如:11 11 2 11 3 3 11 4 6 4 1的三角形,其实质是二项式(a+b)的n次方展开后各项的系数排成的三角形,它的特点是左右两边全 ...
- 移动端video播放时不弹出页面层
移动端视频在播放时会主动弹出页面,有的浏览器不会.对那些会的浏览器进行处理: 直接加上下面三个属性即可,兼容方面就不说了,微信上是很ok的. <video x5-playsinline=&quo ...
- HTTP的请求及响应
前言 本文主要包括以下内容: HTTP是什么? HTTP 请求包括哪些部分? HTTP 响应包括哪些部分? 如何用Chrome开发者工具查看 HTTP 请求及请求的内容? 如何使用 curl 命令? ...
- HTML基础——网站图片显示页面
1.图片标签 <img /> 属性: src:指的是图片显示的路径(位置) 绝对路径:D:\Pictures\Saved Pictures 相对路径: ①同一级:直接写文件名称或者./文件 ...
- ASP.NET MVC 使用FluentScheduler做定时任务
源代码地址: https://github.com/fluentscheduler/FluentScheduler 使用NuGet安装FluentScheduler 这是我实际项目中用到的代码,也可看 ...
- 常见Json字符串反序列化处理方式总结
常用来处理Json字符串序列化 反序列化组件:Newtonsoft.Json (https://www.newtonsoft.com/json) 参考资料https://www.cnblogs.com ...
- Shiro结合Spring boot开发权限管理系统
前一篇文章说了,我从开始工作就想有一个属于自己的博客系统,当然了,我想的是多用户的博客,大家都可以发文章记笔记,我最初的想法就是这样. 博客系统搭建需要使用的技术: 1.基于Spring boot 2 ...