Hive记录-使用Hue管理Hive元数据

Hue是一个开源的Apache Hadoop UI系统，由Cloudera Desktop演化而来，最后Cloudera公司将其贡献给Apache基金会的Hadoop社区，它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据，例如操作HDFS上的数据，运行MapReduce Job，执行Hive的SQL语句，浏览HBase数据库等等。
Hue在数据库方面，默认使用的是SQLite数据库来管理自身的数据，包括用户认证和授权，另外，可以自定义为MySQL数据库、Postgresql数据库、以及Oracle数据库。其自身的功能包含有：
对HDFS的访问，通过浏览器来查阅HDFS的数据。
Hive编辑器：可以编写HQL和运行HQL脚本，以及查看运行结果等相关Hive功能。
提供Solr搜索应用，并对应相应的可视化数据视图以及DashBoard。
提供Impala的应用进行数据交互查询。
最新的版本集成了Spark编辑器和DashBoard
支持Pig编辑器，并能够运行编写的脚本任务。
Oozie调度器，可以通过DashBoard来提交和监控Workflow、Coordinator以及Bundle。
支持HBase对数据的查询修改以及可视化。
支持对Metastore的浏览，可以访问Hive的元数据以及对应的HCatalog。
另外，还有对Job的支持，Sqoop，ZooKeeper以及DB（MySQL，SQLite，Oracle等）的支持。

1.安装依赖项

ant

asciidoc

cyrus-sasl-devel

cyrus-sasl-gssapi

gcc

gcc-c++

krb5-devel

libtidy (for unit tests only)

libxml2-devel

libxslt-devel

make

mvn (from maven package or maven3 tarball)

mysql

mysql-devel

openldap-devel

python-devel

sqlite-devel

openssl-devel (for version 7+)

gmp-devel

2.安装hadoop/hbase/hive/zookeeper等

3.官网http://gethue.com下载安装包上传到LINUX服务器上去，解压，进入目录执行make apps，也可以make install安装到/usr/local下

4.修改desktop/conf/pseudo-distributed.ini/hue.ini---按项目实际情况进行配置

[desktop]

   # hue webServer 地址和端口号

   http_host=192.168.66.66

   http_port=8001

  # Webserver runs as this user

   server_user=hue

   server_group=hue

  # This should be the Hue admin and proxy user

   default_user=hue

  # This should be the hadoop cluster admin

   default_hdfs_superuser=root

[hadoop]

    fs_defaultfs=hdfs://xinfang:9000

    webhdfs_url=http://192.168.66.66:50070/webhdfs/v1/

    hadoop_conf_dir=/usr/app/hadoop/etc/hadoop

[[yarn_clusters]]

      # Enter the host on which you are running the ResourceManager

      resourcemanager_host=192.168.66.66

      # The port where the ResourceManager IPC listens on

      resourcemanager_port=8032

      # Whether to submit jobs to this cluster

      submit_to=True

      # URL of the ResourceManager API

      resourcemanager_api_url=http://192.168.66.66:8088

      # URL of the ProxyServer API

      proxy_api_url=http://192.168.66.66:8088

      # URL of the HistoryServer API

      history_server_api_url=http://192.168.66.66:19888

[beeswax]

  # If Kerberos security is enabled, use fully-qualified domain name (FQDN).

  hive_server_host=192.168.66.66

  # Port where HiveServer2 Thrift server runs on.

   hive_server_port=10000

  # Hive configuration directory, where hive-site.xml is located

   hive_conf_dir=/usr/app/hive/conf

[zookeeper]

host_ports=192.168.66.66:2181

  [[[mysql]]]

   engine=mysql

      # IP or hostname of the database to connect to.

      host=192.168.66.66

      # Port the database server is listening to. Defaults are:

      # 1. MySQL: 3306

      # 2. PostgreSQL: 5432

      # 3. Oracle Express Edition: 1521

      port=3306

      # Username to authenticate with when connecting to the database.

      user=root

      # Password matching the username to authenticate with when

      # connecting to the database.

      password=1

#adduser hue ---添加用户

#chmod -R 777 /usr/app/hue-4.0.0 ---授权

5.执行build/env/bin/supervisor

6. 浏览器输入：http://192.168.66.66:8001，创建用户和密码登录即可

Hive记录-使用Hue管理Hive元数据的更多相关文章

Hive记录-Impala jdbc连接hive和kudu参考
1.配置环境Eclipse和JDK 2.加载hive jar包或者impala jar包备注:从CDH集群里面拷贝出来下载地址:https://www.cloudera.com/downloads ...
hue集成hive访问报database is locked
这个问题这应该是hue默认的SQLite数据库出现错误,你可以使用mysql postgresql等来替换 hue默认使用sqlite作为元数据库,不推荐在生产环境中使用.会经常出现database ...
Hive记录-Hive介绍（转载）
1.Hive是什么? Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执 ...
hive的本地安装部署，元数据存储到mysql中
要想使用Hive先要有hadoop集群的支持,使用本地把元数据存储在mysql中. mysql要可以远程连接: 可以设置user表,把localhost改为%,所有可连接.记住删除root其他用户,不 ...
Hive记录-配置远程连接（JAVA/beeline）
1.修改配置hive-site.xml hadoop core-site.xml限制---参考Hive记录-部署Hive环境 2.启动hadoop #sh /usr/app/hadoop/sbi ...
Hue中hive（hive cli）查询结果中显示列名，不带表名
hive cli中显示列名进入hive cli后 set hive.cli.print.header=true; 之后出现列名,但是带了表名前缀,由于网上没找到资料,于是到官网肉眼扫描所有参数,总算 ...
Hive安装与配置--- 基于MySQL元数据
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 其优点是学习成本低,可以通过 ...
HUE配置HIVE
HIVE配置修改hue.ini配置文件 [beeswax] hive_server_host=node1 hive_server_port= hive_conf_dir=/usr/hive-/con ...
【Hadoop离线基础总结】Hue与Hive集成
目录 1.更改hue的配置hue.ini 2.启动hive的metastore以及hiveserver2服务 3.启动hue进程,查看Hive是否与Hue集成成功 1.更改hue的配置hue.ini ...

随机推荐

TCP系列11—重传—1、TCP重传概述
在最开始介绍TCP的时候,我们就介绍了TCP的三个特点,分别是面向连接.可靠.字节流式.前面内容我们已经介绍过了TCP的连接管理,接下来的这部分内容将会介绍与TCP可靠性强关联的TCP重传. 很多网络 ...
SQL之SELECT语句执行顺序及子句功能
1.select 语句的执行顺序 SELECT a.id,a.`product_name`,a.`agreement_copies` i,b.id as statusId from `opmp_pro ...
Android动画总结
本文总结常用属性方法等,详细学习可使用如下郭霖大神文章: Android属性动画完全解析(上),初识属性动画的基本用法 Android属性动画完全解析(中),ValueAnimator和ObjectA ...
Qt__状态栏(statusBar)
转自豆子空间状态栏位于主窗口的最下方,提供一个显示工具提示等信息的地方.一般地,当窗口不是最大化的时候,状态栏的右下角会有一个可以调节大小的控制点:当窗口最大化的时候,这个控制点会自动消失.Qt提供 ...
python贡献度分析20/80定律
#-*- coding: utf-8 -*- #菜品盈利数据帕累托图 from __future__ import print_function import pandas as pd #初始化参数 ...
python之tkinter使用-多选框实现开关操作
# tkinter的Checkbutton实现开关操作 import tkinter as tk root = tk.Tk() root.title('开关') root.geometry('170x ...
BZOJ3453 XLkxc（拉格朗日插值）
显然f(i)是一个k+2项式,g(x)是f(i)的前缀和,则显然其是k+3项式,插值即可.最后要求的东西大胆猜想是个k+4项式继续插值就做完了.注意2p>maxint…… #include< ...
传递闭包（例题POJ3660）
概念: 传递一种关系,例如 a//b b//c 则 a//c 从已知的初始关系中推出最后所有对象之间的关系初始时把所有有关系的标记为1 即a[i][j] = 1 然后用Floyd 推出最后 ...
MT【11】对数放缩题
解答:C 评论:这里讲几个背景知识
Java 实现金额转换代码示例
金额转换,阿拉伯数字的金额转换成中国传统的形式如: (￥1011)→(壹仟零壹拾壹元整)输出. 分析: 金额转换,在开发财务相关软件时会经常用到,也是软件本地化的一个需要.一般开发公司或者团队都有相应 ...

Hive记录-使用Hue管理Hive元数据

Hive记录-使用Hue管理Hive元数据的更多相关文章

随机推荐

热门专题