3、hue与其他框架的集成

3.1、hue与hadoop的HDFS以及yarn集成

第一步：更改所有hadoop节点的core-site.xml配置

记得更改完core-site.xml之后一定要重启hdfs与yarn集群

<name>hadoop.proxyuser.root.hosts</name>

</property>

<name>hadoop.proxyuser.root.groups</name>

</property>

第二步：更改所有hadoop节点的hdfs-site.xml

<name>dfs.webhdfs.enabled</name>

</property>

第三步：重启hadoop集群

在node01机器上面执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0

sbin/stop-dfs.sh

sbin/start-dfs.sh

sbin/stop-yarn.sh

sbin/start-yarn.sh

第四步：停止hue的服务，并继续配置hue.ini

cd /export/servers/hue-3.9.0-cdh5.14.0/desktop/conf

vim hue.ini

配置我们的hue与hdfs集成

[[hdfs_clusters]]

[[[default]]]

fs_defaultfs=hdfs://node01.hadoop.com:8020

webhdfs_url=http://node01.hadoop.com:50070/webhdfs/v1

hadoop_hdfs_home=/export/servers/hadoop-2.6.0-cdh5.14.0

hadoop_bin=/export/servers/hadoop-2.6.0-cdh5.14.0/bin

hadoop_conf_dir=/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop

配置我们的hue与yarn集成

[[yarn_clusters]]

[[[default]]]

resourcemanager_host=node01

resourcemanager_port=8032

submit_to=True

resourcemanager_api_url=http://node01:8088

history_server_api_url=http://node01:19888

3.2、配置hue与hive集成

如果需要配置hue与hive的集成，我们需要启动hive的metastore服务以及hiveserver2服务（impala需要hive的metastore服务，hue需要hive的hiveserver2服务）

更改hue的配置hue.ini

修改hue.ini

[beeswax]

hive_server_host=node03.hadoop.com

hive_server_port=10000

hive_conf_dir=/export/servers/hive-1.1.0-cdh5.14.0/conf

server_conn_timeout=120

auth_username=root

auth_password=123456

[metastore]

#允许使用hive创建数据库表等操作

enable_new_create_table=true

启动hive的metastore服务

去node03机器上启动hive的metastore以及hiveserver2服务

cd /export/servers/hive-1.1.0-cdh5.14.0

nohup bin/hive --service metastore & （如果配置了hive的环境变量，则可以省略bin/的路径）

nohup bin/hive --service hiveserver2 &（如果配置了hive的环境变量，则可以省略bin/的路径）

重新启动hue，然后就可以通过浏览器页面操作hive了

3.3、配置hue与impala的集成

停止hue的服务进程

修改hue.ini配置文件

[impala]

server_host=node03

server_port=21050

impala_conf_dir=/etc/impala/conf

3.4、配置hue与mysql的集成

找到databases 这个选项，将这个选项下面的mysql注释给打开，然后配置mysql即可,大概在1547行

[[[mysql]]]

nice_name="My SQL DB"

engine=mysql

host=node03.hadoop.com

port=3306

user=root

password=123456

3.5、重新启动hue的服务

cd /export/servers/hue-3.9.0-cdh5.14.0/

build/env/bin/supervisor

3.6、解决hive以及impala执行权限不足的问题

在我们hive当中执行任意的查询，只要是需要跑MR的程序，就会报错，发现权限不够的异常，具体详细信息如下：

INFO  : Compiling command(queryId=root_20180625191616_d02efd23-2322-4f3d-9cb3-fc3a06ff4ce0): select count(1) from mystu

INFO  : Semantic Analysis Completed

INFO  : Returning Hive schema: Schema(fieldSchemas:[FieldSchema(name:_c0, type:bigint, comment:null)], properties:null)

INFO  : Completed compiling command(queryId=root_20180625191616_d02efd23-2322-4f3d-9cb3-fc3a06ff4ce0); Time taken: 0.065 seconds

INFO  : Concurrency mode is disabled, not creating a lock manager

INFO  : Executing command(queryId=root_20180625191616_d02efd23-2322-4f3d-9cb3-fc3a06ff4ce0): select count(1) from mystu

INFO  : Query ID = root_20180625191616_d02efd23-2322-4f3d-9cb3-fc3a06ff4ce0

INFO  : Total jobs = 1

INFO  : Launching Job 1 out of 1

INFO  : Starting task [Stage-1:MAPRED] in serial mode

INFO  : Number of reduce tasks determined at compile time: 1

INFO  : In order to change the average load for a reducer (in bytes):

INFO  :   set hive.exec.reducers.bytes.per.reducer=<number>

INFO  : In order to limit the maximum number of reducers:

INFO  :   set hive.exec.reducers.max=<number>

INFO  : In order to set a constant number of reducers:

INFO  :   set mapreduce.job.reduces=<number>

ERROR : Job Submission failed with exception 'org.apache.hadoop.security.AccessControlException(Permission denied: user=admin, access=EXECUTE, inode="/tmp":root:supergroup:drwxrwx---

我们需要给hdfs上面的几个目录执行权限即可

hdfs dfs -chmod o+x /tmp

hdfs dfs -chmod o+x /tmp/hadoop-yarn

hdfs dfs -chmod o+x /tmp/hadoop-yarn/staging

或者我们可以这样执行

hdfs dfs -chmod -R o+x /tmp

可以将/tmp目录下所有的文件及文件夹都赋予权限

继续执行hive的任务就不会报错了

=========================================================

课程总结：

impala：sql语句的一个查询工具，
特点：比较快
缺点：占用内存大

impala架构：
impala-server：从节点主要用于执行sql语句的查询
impala-catalog：主节点主要用于存储元数据信息
impala-state-store: 主节点主要用于保存一些sql语句的执行状态

impala的安装：没有提供tar.gz的安装包，使用rpm的安装包来进行安装
下载一个rpm的仓库，5个G，所有的大数据软件都可以通过rpm包方式来进行安装

制作本地的yum源搞定
第一个：配置文件
第二个：httpd服务
第三个：rpm的仓库

进行安装搞定

impala的配置：搞定
impala需要三个核心配置文件 hdfs-site.xml core-site.xml hive-site.xml
impala的配置文件也得需要更改

impala的语法的使用：

进入impala-shell之前的一些参数
impala-shell -q 与hive -e 类似，不进入impala的shell交互窗口直接执行sql语句
impala-shell -f 与hive -f 类似，直接执行sql脚本
impala-shell -r 刷新元数据信息，进入impala-shell之前刷新元数据信息，全量的刷新，如果数据量比较大，性能消耗比较大

进入impala-shell之后的一些参数
refresh dbName.tabName 局部的刷新，只刷新某张已经存在的表的元数据信息
invalidate metadata 全量的刷新，，适用于hive当中新建的数据库或者数据库表的情况

impala的建库建表语法：与hive建库建表一模一样，参见hive的表创建

impala的sql语法：与hive的sql语法类似，参见hive的sql语法

impala的数据导入的几种方式：搞定
load datal 这种加载数据的方式，只能从hdfs上面加载数据
insert into table select

impala java 开发了解

------------------------------------------

hue：主要是与其他的各个框架整合使用，hue本身不提供任何的功能

可以与hdfs，以及yarn整合
可以与hive以及impala整合
可以与mysql整合

编译的时候可能会通不过：删了重新编译

第1节 HUE：14、15、16、hue与hdfs、yarn集群、hive、impala、mysql的整合的更多相关文章

剑指offer19：按照从外向里以顺时针的顺序依次打印出每一个数字，4 X 4矩阵： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.
1 题目描述输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下4 X 4矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印 ...
15套java架构师、集群、高可用、高可扩展、高性能、高并发、性能优化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程
* { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展. ...
15套java架构师、集群、高可用、高可扩展、高性能、高并发、性能优化Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程
* { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展 ...
Ubuntu 16.04下Redis Cluster集群搭建（官方原始方案）
前提:先安装好Redis,参考:http://www.cnblogs.com/EasonJim/p/7599941.html 说明:Redis Cluster集群模式可以做到动态增加节点和下线节点,使 ...
16、Redis手动创建集群
写在前面的话:读书破万卷,编码如有神 --------------------------------------------------------------------------------- ...
Ubuntu 16.04下搭建kubernetes集群环境
简介目前Kubernetes为Ubuntu提供的kube-up脚本,不支持15.10以及16.04这两个使用systemd作为init系统的版本. 这里详细介绍一下如何以非Docker方式在Ubun ...
ubuntu 16.04快速安装ceph集群
准备工作假设集群: 选一台作管理机注意: ceph集群引用hostname,而非ip. 172.17.4.16 test16 #hostname必须是test16 172.17.4.17 test ...
Ubuntu 16.04 下Redis Cluster集群搭建
实际操作如下: 准备工作版本:4.0.2 下载地址:https://redis.io/download 离线版本:(链接: https://pan.baidu.com/s/1bpwDtOr 密码: ...
【20171027中】alert(1) to win 第13,14,15,16题
第13题题目: function escape(s) { var tag = document.createElement('iframe'); // For this one, you get t ...

随机推荐

堆（c++）
5分钟速成堆 FBI⚠WARNING 本文要素过多吐槽堆是我迄今为止学过最简单的数据结构我还没学会最小生成树.最短路时就学会了堆实用高效,值得推荐 (如果你看完了这篇文章还不会,你可以直接Co ...
笔记-爬虫部署及运行工具-scrapydweb
笔记-爬虫部署及运行工具-scrapydweb 1. 简介 scrapyd是爬虫部署工具,但它的ui比较简单,使用不是很方便. scrapydweb以scrapyd为基础,增加了ui界面和监 ...
使用pandas读取excel
使用pandas读取excel Excel是微软的经典之作,在这里我们介绍使用Python的pandas数据分析包来解决此问题. pd.read_excel(io, sheet_name = 0, h ...
JAVA中final关键字的作用
一.final关键字的功能概述 final关键字可以用来修饰引用.方法和类. 1.用来修饰一个引用如果引用为基本数据类型,则该引用为常量,该值无法修改: 如果引用为引用数据类型,比如对象.数组,则该 ...
mysql 连接数据库时时区报错
1.url: jdbc:mysql://192.168.0.101:3306/testdb?serverTimezone=UTC,在连接字符后面添加时区设置 2.使用navicat或者直接使用mysq ...
树莓派4B踩坑指南 - （1）系统简介及特性
系统简介及特性 19年双十一入坑树莓派4B,发现不是一般的坑,对于新出来的4B,从外包装壳,到接口,到内核,很多老的资料已经不再适用,又没有什么特别大的论坛可以讨论,只能自己一点点的摸索. 所以将遇到 ...
Systemverilog for design 笔记（七）
转载请标明出处第一章接口(interface) 1.1. 接口的概念接口允许许多信号合成一组由一个端口表示. 1.2. 接口声明 //接口定义 Interface main_bus ...
LeetCode 101.对称二叉树 - JavaScript
题目描述:给定一个二叉树,检查它是否是镜像对称的. 题目分析下面这种二叉树就是镜像对称的,符合题目要求: 1 / \ 2 2 / \ / \ 3 4 4 3 解法 1:递归检查根据题目" ...
ADO.NET基础必背知识
DO.NET 由.Net Framework 数据提供程序和DataSet 两部分构成. .NET FrameWork 是 Connection 连接对象 Command 命令对象 DataRe ...
css 盒子模型应用
盒子模型应用 <!DOCTYPE html> <html> <head> <meta charset="utf-8" /> < ...

第1节 HUE：14、15、16、hue与hdfs、yarn集群、hive、impala、mysql的整合

3、hue与其他框架的集成

3.1、hue与hadoop的HDFS以及yarn集成

第一步：更改所有hadoop节点的core-site.xml配置

第二步：更改所有hadoop节点的hdfs-site.xml

第三步：重启hadoop集群

第四步：停止hue的服务，并继续配置hue.ini

3.2、配置hue与hive集成

更改hue的配置hue.ini

启动hive的metastore服务

3.3、配置hue与impala的集成

3.4、配置hue与mysql的集成

3.5、重新启动hue的服务

3.6、解决hive以及impala执行权限不足的问题

第1节 HUE：14、15、16、hue与hdfs、yarn集群、hive、impala、mysql的整合的更多相关文章

随机推荐

热门专题