大数据web管理工具——HUE
一、概述
HUE是一个开源的Apache Hadoop UI系统,早期由Cloudera开发,后来贡献给开源社区。它是基于Python Web框架Django实现的。通过使用Hue我们可以通过浏览器方式操纵Hadoop集群。
二、安装
安装推荐随笔:https://www.cnblogs.com/zlslch/p/6804757.html
1.下载hue
http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.5.4.tar.gz
推荐使用百度云离线下载!
2.安装依赖
ant
asciidoc
cyrus-sasl-devel
cyrus-sasl-gssapi
gcc
gcc-c++
krb5-devel
libtidy (for unit tests only,可选)
libxml2-devel
libxslt-devel
make
mvn (from maven package or maven3 tarball)
mysql (我这里不安装了,因为在hive那边已经安装了)
mysql-devel (我这里不安装了,因为在hive那边已经安装了)
openldap-devel
python-devel
sqlite-devel
openssl-devel (for version +)
gmp-devel
一键安装:
yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel mysql mysql-devel openldap-devel python-devel sqlite-devel openssl-devel gmp-devel
可以先用rpm看看是否已经安装,可以使用rpm下载再重新安装避免冲突(或者省事先装,冲突了再解决,冲突的概率不大~):
rpm -e --nodeps ***
3.解压编译
tar -zxvf hue-3.9.-cdh5.14.0.tar.gz -C /opt/
进入Hue目录:
make apps
// 如编译失败,可以删除目录,尝试重新解压编译
// 失败原因如果是找不到mysqlclilnet:
cp /usr/lib64/mysql/libmysqlclient* /usr/lib/
其他原因请参考上述博文
三、配置
1.配置Hue.ini
路径: $HUE_HOME/desktop/conf/hue.ini
screct_key可在官网查看:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html
其他配置项参考上述博文
2.配置hadoop
在集群各机器的hdfs-site.xml中配置:
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
在core-site.xml中配置:
<property>
<name>hadoop.proxyuser.hue.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hue.groups</name>
<value>*</value>
</property>
如果是HA集群,需要配置成https,此处非HA则不配置:
以及在httpfs-site.xml中修改如下配置
<property>
<name>httpfs.proxyuser.hue.hosts</name>
<value>*</value>
</property>
<property>
<name>httpfs.proxyuser.hue.groups</name>
<value>*</value>
</property>
修改完后,重启HDFS服务。
3.在Hue.ini中配置Hadoop
在Hadoop块下修改(推荐使用Notpad++)
基于上述博文,还需要配置一下database:
[desktop]
http_host=hadoop001
http_port=8888
server_user=hadoop
server_group=hadoop
default_user=hue
default_hdfs_superuser=hadoop
大约500行
[[database]]
engine=mysql
host=bigdata
port=3306
user=hue
password=hue
name=hue
大约600行
[hadoop]
[[[default]]]
fs_defaultfs=hdfs://hadoop001:8020
webhdfs_url=http://hadoop001:50070/webhdfs/v1
hadoop_conf_dir=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
在780行
[beeswax]
hive_server_host=hadoop001
#Port where HiveServer2 Thrift server runs on.
hive_server_port=10000
hive_conf_dir=/home/hadoop/app/hive-1.1.0-cdh5.7.0/conf
初始化:
初始化数据库
需要输入用户名邮箱密码
[hadoop@hadoop001 bin]$ ./hue syncdb
mysql hue 数据库生成相应的表
[hadoop@hadoop001 bin]$ ./hue migrate
启动hue
[hadoop@hadoop001 bin]$ ./supervisor
// 配置参考:https://blog.csdn.net/qq_35744460/article/details/89344689
四、错误收集
0.编译时在usr/lib下找不到lmysqlclinet
找一下这个文件在哪:
find / -name libmysqlclient_r*
做个软连接或者cp过去:(或者可以cp到/usr/lib下面去~)
ln -sv /usr/lib64/mysql/libmysqlclient_r.so.16.0. /usr/lib/libmysqlclient_r.so
1.找不到hue用户
需要使用非root用户,新建一个普通用户(如已新建,忽略),授予hue文件夹权限:
useradd hadoop01
passwd hadoop01
chown -R /opt/hue3./
2.浏览器页面打不开,无法访问,尝试关闭防火墙:
systemctl stop firewalld.service
或者永久关闭(本机搭建的随意:)
systemctl disable firewalld.service
3.页面报错:Could not connect to localhost:10000
在Hive中启动:
hive --service hiveserver2 &
大数据web管理工具——HUE的更多相关文章
- 大数据权限管理工具 Apache Ranger 初识
资料参考: Apache Ranger – Introduction http://ranger.apache.org/ 阿里云 Ranger简介 Apache Ranger初识 - 阿里云 大数据权 ...
- redis cluster集群web管理工具 relumin
redis cluster集群web管理工具 relumin 下载地址 https://github.com/be-hase/relumin 只支持redis cluster模式 java环境 tar ...
- 数据接口管理工具 thx RAP
RAP是数据接口管理工具.在开发时前端将请求转至RAP,由RAP提供模拟数据:而后端使用RAP测试接口的正确性.这样RAP就成为了开发过程中的强 依赖,进而确保接口文档的实时正确性.RAP采用JSON ...
- KVM web管理工具——WebVirtMgr(一)
WebVirtMgr 介绍 WebVirtMgr采用几乎纯Python开发,其前端是基于Python的Django,后端是基于Libvirt的Python接口,将日常kvm的管理操作变的更加的 ...
- Elasticasearch Web管理工具-Cerebro
cerebro是一个使用Scala,Play Framework,AngularJS和Bootstrap构建的开源(MIT许可)elasticsearch web管理工具.需要Java 1.8或更高版 ...
- 大数据之ETL工具Kettle的--1功能介绍
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行. 说白了就是,很有必要去理解一般ETL工具必备的特性和功能,这样才更好的掌握Kettle的使用. ...
- ZooKeeper可视化Web管理工具收集(待实践)
原来ZooKeeper是有Web管理后台的.但是仅限于操作ZooKeeper的数据,如果要监控性能,估计要借助Nagios去配合. 这些工具应该ZK UI最好用,下面是收集的一些工具安装教程: htt ...
- 大数据可视化呈现工具LightningChart的用法
LightningChart (LightningChart Ultimate) 软件开发工具包是微软VisualStudio 的一个插件,专攻大数据可视化呈现问题,用于WPF(WindowsPres ...
- IT大数据服务管理高级课程(IT服务,大数据,云计算,智能城市)
个人简历 金石先生是马克思主义中国化的研究学者,上海财经大学经济学和管理学硕士,中国民主建国会成员,中国特色社会主义人文科技管理哲学的理论奠基人之一.金石先生博学多才,对问题有独到见解.专于工作且乐于 ...
随机推荐
- SpringCloud2.0 Hystrix Feign 基于Feign实现断路器 基础教程(七)
1.启动[服务中心]集群,工程名:springcloud-eureka-server 参考 SpringCloud2.0 Eureka Server 服务中心 基础教程(二) 2.启动[服务提供者]集 ...
- flask实战-个人博客-程序骨架、创建数据库模型、临接列表关系 --
编写程序骨架 personalBlog的功能主要分为三部分:博客前台.用户认证.博客后台,其中包含的功能点如下图所示: 数据库 personalBlog一共需要使用四张表,分别存储管理员(Admin) ...
- css 宽高等比
1.利用js 2.容器里添加图片,让图片的等比缩放撑大容器,图片z-index=负数,
- isa objc_msgSend
https://developer.apple.com/library/content/documentation/Cocoa/Conceptual/ObjCRuntimeGuide/Articles ...
- Codeforces Round #552 (Div. 3)-1154E-Two Teams-(模拟+双指针)
http://codeforces.com/contest/1154/problem/E 解题: 举例n=10,k=1 1,2,10,4,7,6,9,8,5,3 第一次,1队先挑2,10,4这三个人 ...
- C++的map用法
图,自动建立表示关键字和键值(key - value)之间的对应关系,两者可以是任何数据类型,key唯一并且自动排序,value不唯一. 1.头文件#include<map> 2.map& ...
- LVS是什么及作用?
LVS的概念和重要性 LVS: 概念:是Linux Virtual Server的简写,意即Linux虚拟服务器,是一个虚拟的服务器集群系统 作用:举例 像有三个小区,但是工作的时间和休息的时间不一样 ...
- 牛客练习赛55 E 树
题目链接: 题意:给出n个点,n-1条边求任意两个点的距离平方的和 解法: f[i]表示这个点的高度 sz[i]表示这个子树的大小 szz[i]表示这个这个子树大小的平方 sum[i]表示这个子树所有 ...
- Daily consumption
Bill record, standard of living, record every consumption, income, expenditure, manage your own life
- 文件夹上传组件webupload插件
javaweb上传文件 上传文件的jsp中的部分 上传文件同样可以使用form表单向后端发请求,也可以使用 ajax向后端发请求 1.通过form表单向后端发送请求 <form id=" ...