Hue
Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据. Hue在数据库方面,默认使用的是SQLite数据库来管理自身的数据,包括用户认证和授权,另外,可以自定义为MySQL数据库、Postgresql数据库、以及Oracle数据库
目录:
- 功能介绍 (演示地址: http://gethue.com/)
 - 安装部署
 - Azure 安装CDH
 
功能介绍
- 对HDFS的访问,通过浏览器来查阅HDFS的数据
 - Hive编辑器:可以编写HQL和运行HQL脚本,以及查看运行结果等相关Hive功能
 - 提供Solr搜索应用,并对应相应的可视化数据视图以及DashBoard
 - 提供Impala的应用进行数据交互查询
 - 最新的版本集成了Spark编辑器和DashBoard
 - 支持Pig编辑器,并能够运行编写的脚本任务
 - Oozie调度器,可以通过DashBoard来提交和监控Workflow、Coordinator以及Bundle
 - 支持HBase对数据的查询修改以及可视化
 - 支持对Metastore的浏览,可以访问Hive的元数据以及对应的HCatalog
 - 对Job的支持,Sqoop,ZooKeeper等的支持
 
安装部署
- 安装配置过程参见:http://cloudera.github.io/hue/docs-3.6.0/manual.html
 - hue支持广,依赖多,系统环境有所缺失安装就比较麻烦,如make时会自建一个虚拟的运行环境,导致与系统默认有所偏差,造成编译安装过程遇到一些问题
 - 最简单的安装方式当然是使用CDH的RPM包,但是就要用到CDH的一整套集群环境,毕竟这在已有集群的情况下不太合理,可行性低
 
Azure 安装CDH
- Go to https://ms.portal.azure.com
 - Click on resource groups on the left navigation bar
 - Enter a name for your resource group, pick the subscription and availability region and click on “create”.This will create a resource group that we will use in the cluster setup
 - Click on “New”, then on “Data + Analytics” and then on “Cloudera Enterprise Data Hub”
 - In the blade that opens up, under “Select deployment model”, click on “Resource Manager”, the click “Create”
 - In the blade that opens, click on “Basics, Configure basic settings”; Here, enter the following: User name (Linux user)\password....
 
- Next, click on “Inftrastructure information”;  See screenshot below for where you can customize, and where to leave defaults.
 - Next, click on “Cloudera setup information”; Here, enter the following: Cloudera Manager User Name \ Password \ Cluster Type (two options – POC and Production) \ Number of data nodes
 - Click on user information, enter some details about yourself.
 - Click on “Buy” and then create. This will provision the cluster.
 - Step away for a long break; At the time this post was written, it took more than an hour. You can monitor the progress from the portal.
 
Nodes and Roles
- In the setup, we entered 3 data nodes, and selected Production,The following are the nodes and the roles running on them:
 


Connecting to the cluster
Hue的更多相关文章
- Solr实战:使用Hue+Solr实现标签查询
		
公司最近在研究多条件组合查询方案,Google的一位技术专家Sam和我们讨论了几个备选方案. Sam的信: 我做了进一步研究,目前有这么几种做法: 1) 最直接粗暴,只做一个主index,比如按行业+ ...
 - Ubuntu 14 Trusty安装hue
		
想开始学习一下hive,需要一个使用起来方便的客户端,网上搜了一下发现hue是个很常用的工具.于是,就在自己的ubuntu14系统里,尝试安装hue.下面就是自己的安装步骤,记录如下: 1.先查看自己 ...
 - #数据技术选型#即席查询Shib+Presto,集群任务调度HUE+Oozie
		
郑昀 创建于2014/10/30 最后更新于2014/10/31 一)选型:Shib+Presto 应用场景:即席查询(Ad-hoc Query) 1.1.即席查询的目标 使用者是产品/运营/销售 ...
 - Solr图形化界面banana:除Hue之外的选择
		
最近Hue+Solr 方案原型验证有了一些进展.正好也收到了Google的大数据专家Sam的来件询问进展,我答复如下: Sam, 你好. 已经把Kafka+flume+solr的实时索引搭建起来了, ...
 - hue install
		
http://ju.outofmemory.cn/entry/105162 Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera ...
 - json数据处理实战:Kafka+Flume+Morphline+Solr+Hue数据组合索引
		
背景:Kafka消息总线的建成,使各个系统的数据得以在kafka节点中汇聚,接下来面临的任务是最大化数据的价值,让数据“慧”说话. 环境准备: Kafka服务器*3. CDH 5.8.3服务器*3,安 ...
 - 使用hue+oozi构建任务调度系统
		
oozie调度系统调研 1. 关于oozie的简单说明 oozie应用程序目录结构说明: 一个完整的oozie应用程序一般情况下至少包含三个文件及目录:job.properties.workflow. ...
 - Hue整合Sqoop报空指针异常的解决方法
		
hue是一个Apache基金会下的一个开源图形化管理工具,使用python语言开发,使用的框架是Django.而sqoop也是Apache的一个开源工具,是使用Java语言开发,主要用于进行hdfs和 ...
 - HUE的时区问题
		
转自 http://molisa.iteye.com/blog/1953390 我主要是根据这个说明调整的HUE的时区问题 在使用Cloudera Hue时遇到一问题: 1. 使用Sqoop导入功 ...
 
随机推荐
- ASP.NET输出JSON格式数据
			
找到一个方法,虽然返回的不是json,但是数据格式是可以的 ArrayList eventList = new ArrayList(); ; i < ;i++ ) { Hashtable ht ...
 - [转] 添加新的系统调用 _syscall0(int, mysyscall)
			
实验目的阅读 Linux 内核源代码,通过添加一个简单的系统调用实验,进一步理解Linux操作系统处理系统调用的统一流程.通过用kernel module的方法来实现一个系统调用实验,进一步理解Lin ...
 - [windows]部分前缀以及其意义
			
前缀 意义 CS 类风格选项 CW 创建窗口选项 DT 文本绘制选项 IDI 图标的ID号 MB 消息框选项 SND 声音选项 WM 窗口消息 WS 窗 ...
 - ListView——android菜鸟成长之路
			
ListView的基本用法 建博客这么久了,一直没能写点什么,其实一直想写来着,却又无从下手,今天终于下定决心写点什么,好吧,就ListView吧,这个控件是个搞基控件,所以初学者都会觉得很难,于是乎 ...
 - 解决iOS9下隐藏App返回按钮文字导致的诡异闪屏问题
			
问题的原因竟是一行代码导致的,这行代码的作用是隐藏App返回按钮的文字. 看看这有问题的代码: //将返回按钮的文字position设置不在屏幕上显示 [[UIBarButtonItem appear ...
 - 简述reflow和repaint
			
今天在看面试题的时候遇到reflow和repaint的问题,以前并没有接触过,所以拿来学习一下~ reflow 和 repaint 会拖慢浏览器的速度,而且用户和Web页面都不能在 reflow 和 ...
 - CSS元素定位6-10课
			
<精通CSS.DIV网页样式与布局>视频6-10课总结图: 元素定位 (1)float:left/right; 左浮动:脱离普通文档流向左浮动(即向左对齐):float属性必须应用在块级元 ...
 - sql server 2008中清除数据库日志的sql语句
			
第一步: Use 数据库名 Select NAME,size From sys.database_files 将“数据库名”改为需要清除日志的数据库名字,点击“执行”查询出需要清除的日志名称:**_ ...
 - 10——operator=返回reference to *this
			
注意operator=返回一个引用,便于连锁赋值
 - lua userdata
			
#define metatablename "studentlib.06-11-11" /** * utility functions */ static int pusherro ...
 
			
		





