一、概述

  HUE是一个开源的Apache Hadoop UI系统,早期由Cloudera开发,后来贡献给开源社区。它是基于Python Web框架Django实现的。通过使用Hue我们可以通过浏览器方式操纵Hadoop集群。

二、安装

  安装推荐随笔:https://www.cnblogs.com/zlslch/p/6804757.html

  1.下载hue

     http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.5.4.tar.gz

     推荐使用百度云离线下载!

  2.安装依赖 

ant
asciidoc
cyrus-sasl-devel
cyrus-sasl-gssapi
gcc
gcc-c++
krb5-devel
libtidy (for unit tests only,可选)
libxml2-devel
libxslt-devel
make
mvn (from maven package or maven3 tarball)
mysql (我这里不安装了,因为在hive那边已经安装了)
mysql-devel (我这里不安装了,因为在hive那边已经安装了)
openldap-devel
python-devel
sqlite-devel
openssl-devel (for version +)
gmp-devel

    一键安装:

yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel mysql mysql-devel openldap-devel python-devel sqlite-devel openssl-devel gmp-devel

  可以先用rpm看看是否已经安装,可以使用rpm下载再重新安装避免冲突(或者省事先装,冲突了再解决,冲突的概率不大~):

rpm -e --nodeps   ***

  3.解压编译

tar -zxvf hue-3.9.-cdh5.14.0.tar.gz -C /opt/

    进入Hue目录:

make apps

  // 如编译失败,可以删除目录,尝试重新解压编译

  // 失败原因如果是找不到mysqlclilnet:

cp /usr/lib64/mysql/libmysqlclient* /usr/lib/

  其他原因请参考上述博文

三、配置

  1.配置Hue.ini

    路径: $HUE_HOME/desktop/conf/hue.ini

    screct_key可在官网查看:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html

    其他配置项参考上述博文

  2.配置hadoop

    在集群各机器的hdfs-site.xml中配置:

 <property>
      <name>dfs.webhdfs.enabled</name>
      <value>true</value>
    </property>

    在core-site.xml中配置:

<property>
      <name>hadoop.proxyuser.hue.hosts</name>
      <value>*</value>
    </property>
    <property>
      <name>hadoop.proxyuser.hue.groups</name>
      <value>*</value>
    </property>

    如果是HA集群,需要配置成https,此处非HA则不配置:

以及在httpfs-site.xml中修改如下配置
    <property>
      <name>httpfs.proxyuser.hue.hosts</name>
      <value>*</value>
    </property>
    <property>
      <name>httpfs.proxyuser.hue.groups</name>
      <value>*</value>
    </property>
  修改完后,重启HDFS服务。

  3.在Hue.ini中配置Hadoop

    在Hadoop块下修改(推荐使用Notpad++)

    基于上述博文,还需要配置一下database:

[desktop]
http_host=hadoop001
http_port=8888
server_user=hadoop
server_group=hadoop
default_user=hue
default_hdfs_superuser=hadoop
大约500行
[[database]]
engine=mysql
host=bigdata
port=3306
user=hue
password=hue
name=hue
大约600行
[hadoop]
[[[default]]]
fs_defaultfs=hdfs://hadoop001:8020
webhdfs_url=http://hadoop001:50070/webhdfs/v1
hadoop_conf_dir=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
在780行
[beeswax]
hive_server_host=hadoop001
#Port where HiveServer2 Thrift server runs on.
hive_server_port=10000
hive_conf_dir=/home/hadoop/app/hive-1.1.0-cdh5.7.0/conf

    初始化:

初始化数据库
需要输入用户名邮箱密码
[hadoop@hadoop001 bin]$ ./hue syncdb
mysql hue 数据库生成相应的表
[hadoop@hadoop001 bin]$ ./hue migrate
启动hue
[hadoop@hadoop001 bin]$ ./supervisor

  // 配置参考:https://blog.csdn.net/qq_35744460/article/details/89344689

四、错误收集

   0.编译时在usr/lib下找不到lmysqlclinet

    找一下这个文件在哪:

find / -name libmysqlclient_r*

    做个软连接或者cp过去:(或者可以cp到/usr/lib下面去~)

ln -sv  /usr/lib64/mysql/libmysqlclient_r.so.16.0. /usr/lib/libmysqlclient_r.so

   1.找不到hue用户

    需要使用非root用户,新建一个普通用户(如已新建,忽略),授予hue文件夹权限:

useradd hadoop01
passwd hadoop01
chown -R /opt/hue3./

   2.浏览器页面打不开,无法访问,尝试关闭防火墙:

systemctl stop firewalld.service

 或者永久关闭(本机搭建的随意:)

systemctl disable firewalld.service

   3.页面报错:Could not connect to localhost:10000

    在Hive中启动:

 hive --service hiveserver2 &

大数据web管理工具——HUE的更多相关文章

  1. 大数据权限管理工具 Apache Ranger 初识

    资料参考: Apache Ranger – Introduction http://ranger.apache.org/ 阿里云 Ranger简介 Apache Ranger初识 - 阿里云 大数据权 ...

  2. redis cluster集群web管理工具 relumin

    redis cluster集群web管理工具 relumin 下载地址 https://github.com/be-hase/relumin 只支持redis cluster模式 java环境 tar ...

  3. 数据接口管理工具 thx RAP

    RAP是数据接口管理工具.在开发时前端将请求转至RAP,由RAP提供模拟数据:而后端使用RAP测试接口的正确性.这样RAP就成为了开发过程中的强 依赖,进而确保接口文档的实时正确性.RAP采用JSON ...

  4. KVM web管理工具——WebVirtMgr(一)

    WebVirtMgr 介绍     WebVirtMgr采用几乎纯Python开发,其前端是基于Python的Django,后端是基于Libvirt的Python接口,将日常kvm的管理操作变的更加的 ...

  5. Elasticasearch Web管理工具-Cerebro

    cerebro是一个使用Scala,Play Framework,AngularJS和Bootstrap构建的开源(MIT许可)elasticsearch web管理工具.需要Java 1.8或更高版 ...

  6. 大数据之ETL工具Kettle的--1功能介绍

    Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行. 说白了就是,很有必要去理解一般ETL工具必备的特性和功能,这样才更好的掌握Kettle的使用. ...

  7. ZooKeeper可视化Web管理工具收集(待实践)

    原来ZooKeeper是有Web管理后台的.但是仅限于操作ZooKeeper的数据,如果要监控性能,估计要借助Nagios去配合. 这些工具应该ZK UI最好用,下面是收集的一些工具安装教程: htt ...

  8. 大数据可视化呈现工具LightningChart的用法

    LightningChart (LightningChart Ultimate) 软件开发工具包是微软VisualStudio 的一个插件,专攻大数据可视化呈现问题,用于WPF(WindowsPres ...

  9. IT大数据服务管理高级课程(IT服务,大数据,云计算,智能城市)

    个人简历 金石先生是马克思主义中国化的研究学者,上海财经大学经济学和管理学硕士,中国民主建国会成员,中国特色社会主义人文科技管理哲学的理论奠基人之一.金石先生博学多才,对问题有独到见解.专于工作且乐于 ...

随机推荐

  1. linux 命令输出保存为文件的三种方式

    一.ls >2.txt        将ls命令直接保存到home文件夹下的2.txt,命令窗口无显示 二.ls | tee 2.txt    也是直接保存在了home文件夹下的2.txt,命令 ...

  2. dfs 解决八皇后问题 以及其他图搜索问题

    33. N皇后问题 中文 English n皇后问题是将n个皇后放置在n*n的棋盘上,皇后彼此之间不能相互攻击(任意两个皇后不能位于同一行,同一列,同一斜线). 给定一个整数n,返回所有不同的n皇后问 ...

  3. jvm内存模型-和内存分配以及jdk、jre、jvm是什么关系(阿里,美团,京东)

    参考:JVM的垃圾回收机制 总结(垃圾收集.回收算法.垃圾回收器) 1.什么是jvm?(1)jvm是一种用于计算设备的规范,它是一个虚构出来的机器,是通过在实际的计算机上仿真模拟各种功能实现的.(2) ...

  4. 微信之通过AppID和AppSecret获取access_token

    最近在搞微信公众平台这方面的东西,,但实际使用的时候发现和access_token有关的接口都无法正常调用,于是debug了下,发现获取到了AppID和AppSecret,在最后请求access_to ...

  5. Flash完美跨域访问的方法

    先,你要确定以下几点,否则可能无法实现: 1.你要跨到哪个域,你必须能管理那域上文件,因为这里要放一个通行文件. 2.你的Flash如果只有SWF,那不一定能实现,因为有时,Flash的AS中,要加入 ...

  6. POJ - 1981 :Circle and Points (圆的扫描线) hihocoder1508

    题意:给定N个点,然后给定一个半径为R的圆,问这个圆最多覆盖多少个点. 思路:在圆弧上求扫描线. 如果N比较小,不难想到N^3的算法. 一般这种覆盖问题你可以假设有两个点在圆的边界上,那么每次产生的圆 ...

  7. HDU-4794:Arnold(斐波拉契循环节 二次剩余)

    本题我只是个搬运工,主要是抢救补板子,所以自己就没写.https://blog.csdn.net/u013534123/article/details/78058997 题意: 大致题意是给你一个N* ...

  8. 利用requests库访问网站

    1.关于requests库 函数 Response对象包含服务器返回的所有信息,也包含请求的Request信息. 访问百度二十次 import requests def getHTMLText(url ...

  9. 24、python re正则表达式模块

    一.re模块的基本使用 Python里数量词默认是贪婪的,总是尝试匹配尽可能多的字符.正则表达式是用来匹配处理字符串的. 假如你需要匹配文本中的字符\,Python里的使用原生字符串表示:r'\\'表 ...

  10. MANIFEST.MF文件对Import-Package/Export-Package重排列

    众所周知,MANIFEST.MF文件中的空格开头的行是相当于拼接在上一行末尾的.很多又长又乱的Import-Package或者Export-Package,有时候想要搜索某个package却可能被换行 ...