* HUE搭配基础

首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。

简单来讲,就是用图形化的界面来操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库,oozie,flume等等。

官网网站:http://gethue.com/

在官网上可以看到,如下世界知名公司都在用(地球人用了都说好?)

 
 

* 安装HUE

官网安装帮助:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html

** 安装依赖

 
 

如上图所示,这部分内容是告诉你,安装编译Hue需要依赖哪些Linux安装包,你只需要使用yum命令一次安装就可以了,在此给大家整理好该命令(注意使用root权限安装):

# yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel

尖叫提示:使用yum安装这些包的同时,也会自动安装openJDK的依赖,所以,请自行删除安装后的openJDK,忘记的同学请参考

Linux基础(二)

** 下载HUE

你去官网下载是没有问题的,在此给你开个传送门:

链接:http://pan.baidu.com/s/1pKKSOSr 密码:5r51

** 解压HUE

$ tar -zxf hue-3.7.0-cdh5.3.6.tar.gz -C /opt/modules/cdh/

** 编译HUE

到hue安装目录下,执行make apps

$ make apps

大概等个几分钟之后,就编译成功了。

** 配置Hue

修改Hue.ini文件

文件位置:/opt/modules/cdh/hue-3.7.0-cdh5.3.6/desktop/conf/hue.ini

打开之后,更改如下属性:

 
 

其中secret_key密钥的值可以来Hue安装帮助中查看到,如下图位置:

 
 

** 启动HUE

完成之后呢,保存退出,我们来使用命令启动Hue

$ build/env/bin/supervisor,出现如下界面表示启动成功:

 
 

接下来使用浏览器来查看hue界面:

http://z01:8888,接着我们就看到如下界面:

 
 

这句话是在提示你,第一次使用本工具,需要创建一个用户及密码,且会成为hue的超级用户凭证,在此呢,我设置为admin用户名,密码随意,那就123456吧,然后呢就可以见到如下界面了:

 
 

* HUE与Hadoop集成

当前集群环境:

 
NameNode与Resourcemanager均已配置HA与前几节教程一致(Bootstrap一会再说)

** 配置Hadoop文件

hdfs-site.xml

添加如图内容:

 
 

 

core-site.xml

添加如图内容:

 
 

httpfs-site.xml

配置内容如图:

 
 

我来解释一下:

1、如果没有配置NameNode的HA,HUE可以用WebHDFS来管理HDFS

2、如果配置了NameNodeHA,则HUE只可用HttpFS来管理HDFS

由于第一种方案官方说明中有完整示例,而且基于本例是在完全分布式且HA环境已经部署的情况下搭建的,所以,采用第二种方式。即配置如上,请大家注意。

尖叫提示:

1、Hadoop相关文件配置完成后,scp拷贝到其他机器节点

2、配置完成后呢,记得重启整个Hadoop集群

3、在z01机器节点上,在hadoop根目录下,使用sbin/httpfs.sh start来启动Bootstrap进程,以服务HttpFS管理

** 修改Hue.ini文件,先找到[[hdfs_clusters]]这个标签,然后修改如下图:

 
mycluster是我在core-site.xml和hdfs-site.xml中设置的集群名称,请自行查看自己的,如果你遵从了前几节的内容,则我们应该是一致的。

** 修改Hue.ini文件,先找到[[yarn_clusters]]这个标签,然后修改如下图:

 
cluster-yarn1请到yarn-site.xml中查看

** 重启HUE并测试

先使用Ctrl+C关闭HUE服务,再使用如下命令重启:

$ build/env/bin/supervisor

测试HDFS点进:File Browser选项查看如图:

 
可以进行删除,上传等操作

测试Yarn点进:Job Browser选项查看如图:

 
 

注意红框内的内容,我是按照之前提交任务的人物名来查看任务的历史记录的,可以自行到yarn中查看用户名是什么,如图:

 
 

* HUE与Hive集成

** 配置Hive文件

hive-site.xml

HUE与hive集成需要hive开启HiveServer2服务

修改如下内容如图:

 
 

** 启动Hive服务

进入Hive根目录,使用命令启动服务,末尾加上&符号,让脚本在后台运行,不至于占用终端:

$ bin/hive --service metastore &

$ bin/hive --service hiveserver2 &

尖叫提示:如果设置了uris,那么必须启动如上两个命令,否则Hive无法正常启动

** 配置Hue.ini

找到[beeswax]这个标签,配置如下:

 
 

然后重启Hue服务,在“查询编辑器”中选择Hive,即可看到如下界面,我们之前创建的一个表,查询一下试试:

 
 

* HUE与Mysql集成

** 配置Hue.ini

找到[[[mysql]]]标签,修改内容如下:

 
 

** 配置完成,重启Hue,点击“DB查询”,看到如图内容:

 
 

* Hue与Oozie集成

** 配置Hue.ini

找到[liboozie]以及[oozie]标签,修改内容如下:

 
 

** 修改Oozie配置文件

oozie-site.xml

修改一下oozie的时区,如下:

 
 

** 启动Oozie相关服务

进入到Oozie安装根目录,然后执行命令:

$ bin/oozied.sh start

然后重启Hue服务,点击Workflow-仪表板-Workflow,之前我们练习的历史记录如下:

 
 

配置完成后,可以非常简单方便的使用图形化界面创建Oozie任务,因为过于简单,在此不再赘述,请自行体验。

* 总结

这一节我们使用Hue工具将之前使用的工具和框架通过图形界面化的形式展示出来并操作,方便了日常维护和开发,里面的种种细节,请同学们自行琢磨。


个人微博:http://weibo.com/seal13

QQ大数据技术交流群(广告勿入):476966007


作者:Z尽际
链接:https://www.jianshu.com/p/93136579d4d4
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

HUE搭配基础的更多相关文章

  1. SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类

    https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...

  2. 【Hadoop离线基础总结】Hue的简单介绍和安装部署

    目录 Hue的简单介绍 概述 核心功能 安装部署 下载Hue的压缩包并上传到linux解压 编译安装启动 启动Hue进程 hue与其他框架的集成 Hue与Hadoop集成 Hue与Hive集成 Hue ...

  3. [iOS基础控件 - 6.10.1] PickerView 餐点搭配Demo

    A.需求 1.使用PickerView做出有3列餐点(水果.主菜.饮料)的搭配Demo 2.选择的餐点实时显示在“显示区” 3.提供“随机”按钮,随机选择菜品搭配   B.实现步骤 1.拖入一个Pic ...

  4. 【原创】大数据基础之Ambari(5)通过Ambari部署Hue

    ambari2.7.3(hdp3.1) 安装 hue4.2 ambari的hdp中原生不支持hue安装,下面介绍如何通过添加service的方式使ambari支持hue安装: 官方:http://ge ...

  5. 【Hadoop离线基础总结】Hue与oozie集成

    目录 1.停止oozie与hue的进程 2.修改oozie的配置文件 3.修改hue的配置文件 4.启动hue与oozie的进程 5.页面访问hue 1.停止oozie与hue的进程 bin/oozi ...

  6. 【Hadoop离线基础总结】Hue与Mysql集成

    Hue与Mysql集成 1.修改hue.ini配置文件 这里要去掉#,打开mysql注释,大概在1547行 [[[mysql]]] nice_name="My SQL DB" en ...

  7. 【Hadoop离线基础总结】Hue与Impala集成

    Hue与Impala集成 1.修改hue.ini配置文件 [impala] server_host=node03 server_port=21050 impala_conf_dir=/etc/impa ...

  8. 【Hadoop离线基础总结】Hue与Hive集成

    目录 1.更改hue的配置hue.ini 2.启动hive的metastore以及hiveserver2服务 3.启动hue进程,查看Hive是否与Hue集成成功 1.更改hue的配置hue.ini ...

  9. 【Hadoop离线基础总结】Hue与Hadoop集成

    目录 1.更改所有hadoop节点的core-site.xml配置 2.更改所有hadoop节点的hdfs-site.xml 3.重启hadoop集群 4.停止hue的服务,并继续配置hue.ini ...

随机推荐

  1. lambda的函数式接口

    函数式接口就是只包含一个抽象方法的接口A(不包括默认抽象方法,但包括继承来的方法):这个接口用来作为一个可变作用的方法B的参数.函数式接口的抽象方法的参数类型和返回值就是一套签名,这个签名叫做函数描述 ...

  2. windows上通过vnc连接虚拟机中linux系统

    首先要在虚拟机中安装vnc. 虚拟机的设置中要启用VNC连接. watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvaHdzc2c=/font/5a6L5L2T/ ...

  3. MySQL超级简明基本操作攻略,给自己看(一)

    系统:Ubuntu 14.04 LTS 安装: apt-get install mysql //安装数据库 apt-get install mysql-workbench //安装图形界面 使用: 启 ...

  4. node16---cookie session

    03.js var express = require("express"); var app = express(); var db = require("./mode ...

  5. 搞笑OI

    OI难 噫吁嚱,维护难哉!OI之难,难于上青天!哈希及DP,代码何茫然!尔来一千两百A,不见金牌背后难.西当华师有考场,可以横绝CN巅.编译不过壮士死,然后超时爆内存相钩连.上有自主招生之高标,下有由 ...

  6. luogu 1941 飞扬的小鸟

    这道题对于第13个数据点,不知为什么f数组第二位开到2000以下就不能过,求指教 飞扬的小鸟 传送门 题目大意 一个小鸟在\(n*m\)的方阵里,然后有许多管道你们玩过就不多介绍了,然后每一个位置,点 ...

  7. 解决django.db.utils.InternalError: (1049, "Unknown database 'exam_db'")

    先检查seeting数据库配置DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'eaxm_db', ' ...

  8. BZOJ 3626 离线+树链剖分+线段树

    思路: 抄一波yousiki的- 显然,暴力求解的复杂度是无法承受的. 考虑这样的一种暴力,我们把 z 到根上的点全部打标记,对于 l 到 r 之间的点,向上搜索到第一个有标记的点求出它的深度统计答案 ...

  9. nginx的rewrite规则

    301跳转: server { listen 80; server_name www.xiaofan.com; return 301 https://$server_name$request_uri; ...

  10. oralce模糊查询之含有通配符

    oracle中通配符有 '_'和'%'当like  '_ww%'时,会把'_'和'%'当作通配符使用导致查不出含有'_'和'%'的数据.这时用到转译字符 like '\_ww\%' escape '\ ...