* HUE搭配基础

首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。

简单来讲,就是用图形化的界面来操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库,oozie,flume等等。

官网网站:http://gethue.com/

在官网上可以看到,如下世界知名公司都在用(地球人用了都说好?)

 
 

* 安装HUE

官网安装帮助:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html

** 安装依赖

 
 

如上图所示,这部分内容是告诉你,安装编译Hue需要依赖哪些Linux安装包,你只需要使用yum命令一次安装就可以了,在此给大家整理好该命令(注意使用root权限安装):

# yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel

尖叫提示:使用yum安装这些包的同时,也会自动安装openJDK的依赖,所以,请自行删除安装后的openJDK,忘记的同学请参考

Linux基础(二)

** 下载HUE

你去官网下载是没有问题的,在此给你开个传送门:

链接:http://pan.baidu.com/s/1pKKSOSr 密码:5r51

** 解压HUE

$ tar -zxf hue-3.7.0-cdh5.3.6.tar.gz -C /opt/modules/cdh/

** 编译HUE

到hue安装目录下,执行make apps

$ make apps

大概等个几分钟之后,就编译成功了。

** 配置Hue

修改Hue.ini文件

文件位置:/opt/modules/cdh/hue-3.7.0-cdh5.3.6/desktop/conf/hue.ini

打开之后,更改如下属性:

 
 

其中secret_key密钥的值可以来Hue安装帮助中查看到,如下图位置:

 
 

** 启动HUE

完成之后呢,保存退出,我们来使用命令启动Hue

$ build/env/bin/supervisor,出现如下界面表示启动成功:

 
 

接下来使用浏览器来查看hue界面:

http://z01:8888,接着我们就看到如下界面:

 
 

这句话是在提示你,第一次使用本工具,需要创建一个用户及密码,且会成为hue的超级用户凭证,在此呢,我设置为admin用户名,密码随意,那就123456吧,然后呢就可以见到如下界面了:

 
 

* HUE与Hadoop集成

当前集群环境:

 
NameNode与Resourcemanager均已配置HA与前几节教程一致(Bootstrap一会再说)

** 配置Hadoop文件

hdfs-site.xml

添加如图内容:

 
 

 

core-site.xml

添加如图内容:

 
 

httpfs-site.xml

配置内容如图:

 
 

我来解释一下:

1、如果没有配置NameNode的HA,HUE可以用WebHDFS来管理HDFS

2、如果配置了NameNodeHA,则HUE只可用HttpFS来管理HDFS

由于第一种方案官方说明中有完整示例,而且基于本例是在完全分布式且HA环境已经部署的情况下搭建的,所以,采用第二种方式。即配置如上,请大家注意。

尖叫提示:

1、Hadoop相关文件配置完成后,scp拷贝到其他机器节点

2、配置完成后呢,记得重启整个Hadoop集群

3、在z01机器节点上,在hadoop根目录下,使用sbin/httpfs.sh start来启动Bootstrap进程,以服务HttpFS管理

** 修改Hue.ini文件,先找到[[hdfs_clusters]]这个标签,然后修改如下图:

 
mycluster是我在core-site.xml和hdfs-site.xml中设置的集群名称,请自行查看自己的,如果你遵从了前几节的内容,则我们应该是一致的。

** 修改Hue.ini文件,先找到[[yarn_clusters]]这个标签,然后修改如下图:

 
cluster-yarn1请到yarn-site.xml中查看

** 重启HUE并测试

先使用Ctrl+C关闭HUE服务,再使用如下命令重启:

$ build/env/bin/supervisor

测试HDFS点进:File Browser选项查看如图:

 
可以进行删除,上传等操作

测试Yarn点进:Job Browser选项查看如图:

 
 

注意红框内的内容,我是按照之前提交任务的人物名来查看任务的历史记录的,可以自行到yarn中查看用户名是什么,如图:

 
 

* HUE与Hive集成

** 配置Hive文件

hive-site.xml

HUE与hive集成需要hive开启HiveServer2服务

修改如下内容如图:

 
 

** 启动Hive服务

进入Hive根目录,使用命令启动服务,末尾加上&符号,让脚本在后台运行,不至于占用终端:

$ bin/hive --service metastore &

$ bin/hive --service hiveserver2 &

尖叫提示:如果设置了uris,那么必须启动如上两个命令,否则Hive无法正常启动

** 配置Hue.ini

找到[beeswax]这个标签,配置如下:

 
 

然后重启Hue服务,在“查询编辑器”中选择Hive,即可看到如下界面,我们之前创建的一个表,查询一下试试:

 
 

* HUE与Mysql集成

** 配置Hue.ini

找到[[[mysql]]]标签,修改内容如下:

 
 

** 配置完成,重启Hue,点击“DB查询”,看到如图内容:

 
 

* Hue与Oozie集成

** 配置Hue.ini

找到[liboozie]以及[oozie]标签,修改内容如下:

 
 

** 修改Oozie配置文件

oozie-site.xml

修改一下oozie的时区,如下:

 
 

** 启动Oozie相关服务

进入到Oozie安装根目录,然后执行命令:

$ bin/oozied.sh start

然后重启Hue服务,点击Workflow-仪表板-Workflow,之前我们练习的历史记录如下:

 
 

配置完成后,可以非常简单方便的使用图形化界面创建Oozie任务,因为过于简单,在此不再赘述,请自行体验。

* 总结

这一节我们使用Hue工具将之前使用的工具和框架通过图形界面化的形式展示出来并操作,方便了日常维护和开发,里面的种种细节,请同学们自行琢磨。


个人微博:http://weibo.com/seal13

QQ大数据技术交流群(广告勿入):476966007


作者:Z尽际
链接:https://www.jianshu.com/p/93136579d4d4
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

HUE搭配基础的更多相关文章

  1. SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类

    https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...

  2. 【Hadoop离线基础总结】Hue的简单介绍和安装部署

    目录 Hue的简单介绍 概述 核心功能 安装部署 下载Hue的压缩包并上传到linux解压 编译安装启动 启动Hue进程 hue与其他框架的集成 Hue与Hadoop集成 Hue与Hive集成 Hue ...

  3. [iOS基础控件 - 6.10.1] PickerView 餐点搭配Demo

    A.需求 1.使用PickerView做出有3列餐点(水果.主菜.饮料)的搭配Demo 2.选择的餐点实时显示在“显示区” 3.提供“随机”按钮,随机选择菜品搭配   B.实现步骤 1.拖入一个Pic ...

  4. 【原创】大数据基础之Ambari(5)通过Ambari部署Hue

    ambari2.7.3(hdp3.1) 安装 hue4.2 ambari的hdp中原生不支持hue安装,下面介绍如何通过添加service的方式使ambari支持hue安装: 官方:http://ge ...

  5. 【Hadoop离线基础总结】Hue与oozie集成

    目录 1.停止oozie与hue的进程 2.修改oozie的配置文件 3.修改hue的配置文件 4.启动hue与oozie的进程 5.页面访问hue 1.停止oozie与hue的进程 bin/oozi ...

  6. 【Hadoop离线基础总结】Hue与Mysql集成

    Hue与Mysql集成 1.修改hue.ini配置文件 这里要去掉#,打开mysql注释,大概在1547行 [[[mysql]]] nice_name="My SQL DB" en ...

  7. 【Hadoop离线基础总结】Hue与Impala集成

    Hue与Impala集成 1.修改hue.ini配置文件 [impala] server_host=node03 server_port=21050 impala_conf_dir=/etc/impa ...

  8. 【Hadoop离线基础总结】Hue与Hive集成

    目录 1.更改hue的配置hue.ini 2.启动hive的metastore以及hiveserver2服务 3.启动hue进程,查看Hive是否与Hue集成成功 1.更改hue的配置hue.ini ...

  9. 【Hadoop离线基础总结】Hue与Hadoop集成

    目录 1.更改所有hadoop节点的core-site.xml配置 2.更改所有hadoop节点的hdfs-site.xml 3.重启hadoop集群 4.停止hue的服务,并继续配置hue.ini ...

随机推荐

  1. Android ImageView 不显示JPEG图片 及 Android Studio中怎样引用图片资源

    Android ImageView 不显示JPEG图片 今天在写一个小实例,ImageView在xml里面设置的是INVISIBLE,在代码里须要设置成setVisibility(View.VISIB ...

  2. myeclipse配置内存

    1.javaee项目假设耗费的内存过大,须要配置内存大小: 下图是配置tomcat结果:Optional program arguments: -Xms512M -Xmx512M -XX:PermSi ...

  3. HDU 1392 凸包子

    Surround the Trees Problem Description There are a lot of trees in an area. A peasant wants to buy a ...

  4. Sobel算子及C++实现

    Sobel 算子是一个离散的一阶微分算子,用来计算图像灰度函数的近似梯度. 在空间域上Sobel算子很容易实现,执行速度快,对部分噪声具有平滑作用,还能够提供较为精确的边缘方向信息,缺点是边缘定位精度 ...

  5. Cocos结构

    基类:CApplicationProtocol 纯虚函数virtual bool applicationDidFinishLaunching() = 0; CCApplication继承于CCAppl ...

  6. JavaScript中Math常用方法

    title: JavaScript中Math常用方法 toc: false date: 2018-10-13 12:19:31 Math.E --2.718281828459045,算数常量e Mat ...

  7. jquery/zepto在插件编写上的几点区别

    1. 自定义事件的命名空间 jq的时间命名空间是用点“.”,而zepto是用冒号“:” 如 //jquery $(this).trigger('cusevent.pluginname'); //zep ...

  8. Elasticsearch之重要核心概念(cluster(集群)、shards(分配)、replicas(索引副本)、recovery(据恢复或叫数据重新分布)、gateway(es索引的持久化存储方式)、discovery.zen(es的自动发现节点机制机制)、Transport(内部节点或集群与客户端的交互方式)、settings(修改索引库默认配置)和mappings)

    Elasticsearch之重要核心概念如下: 1.cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是 ...

  9. 记我安装Caffe的血泪史(2)

    不知不觉居然花了一个星期来安装Caffe...真是醉了. 接上一篇blog,本以为编译完cuda,opencv之后问题就差不多了(其实本来是没有什么问题的,但硬是被我搞了一堆事情出来....) 出于对 ...

  10. Maven配置文件中配置指定JDK版本

    1. 在setting.xml文件中的<profiles>标签加入如下配置: <profile> <id>jdk-1.8</id> <activa ...