Kylin的简介与安装部署
一.Kylin的概述
官方网址:http://kylin.apache.org/cn/
Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。

二.Kylin的安装
1.安装环境准备
1)软件要求
- Hadoop: 2.7+, 3.1+ (since v2.5)
 - Hive: 0.13 - 1.2.1+
 - HBase: 1.1+, 2.0 (since v2.5)
 - Spark (可选) 2.1.1+
 - Kafka (可选) 0.10.0+
 - JDK: 1.8+ (since v2.5)
 - OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+
 
2)硬件要求
运行 Kylin 的服务器的最低的配置为 4 core CPU, 16 GB memory 和 100 GB disk。 对于高负载的场景,建议使用 24 core CPU, 64 GB memory 或更高的配置。
3)Hadoop 环境
Kylin 依赖于 Hadoop 集群处理大量的数据集。您需要准备一个配置好 HDFS, YARN, MapReduce, Hive, Hbase, Zookeeper 和其他服务的 Hadoop 集群供 Kylin 运行。最常见的是在 Hadoop client machine 上安装 Kylin,这样 Kylin 可以通过(hive, hbase, hadoop, 以及其他的)命令行与 Hadoop 进行通信。
Kylin 可以在 Hadoop 集群的任意节点上启动。方便起见,您可以在 master 节点上运行 Kylin。但为了更好的稳定性,我们建议您将其部署在一个干净的 Hadoop client 节点上,该节点上 hive, hbase, hadoop, hdfs 命令行已安装好且 client 配置如(core-site.xml, hive-site.xml, hbase-site.xml, 及其他)也已经合理的配置且其可以自动和其它节点同步。运行 Kylin 的 Linux 账户要有访问 Hadoop 集群的权限,包括 create/write HDFS 文件夹, hive 表, hbase 表 和 提交 MR jobs 的权限。
2.Kylin单机安装
1)下载
这里下载最新的适用于 HBase 1.x 的 Kylin 2.5.0
[admin@node21 software]$ wget http://mirrors.tuna.tsinghua.edu.cn/apache/kylin/apache-kylin-2.5.0/apache-kylin-2.5.0-bin-hbase1x.tar.gz
2)解压
解压 tar 包
[admin@node21 software]$ tar zxvf apache-kylin-2.5.-bin-hbase1x.tar.gz -C /opt/module/
[admin@node21 software]$ cd /opt/module/
[admin@node21 module]$ mv apache-kylin-2.5.-bin-hbase1x kylin-2.5.-bin-hbase1x
然后配置环境变量 KYLIN_HOME 指向 Kylin 文件夹
[admin@node21 kylin-2.5.-bin-hbase1x]$ sudo vi /etc/profile
export KYLIN_HOME=/opt/module/kylin-2.5.-bin-hbase1x
export PATH=$PATH:$KYLIN_HOME/bin
[admin@node21 kylin-2.5.-bin-hbase1x]$ . /etc/profile
检查安装环境,如果环境有任何的问题,它会将打印出详细的信息。如果没有 error,意味着环境没问题。
[admin@node21 kylin-2.5.-bin-hbase1x]$ ./bin/check-env.sh
Retrieving hadoop conf dir...
KYLIN_HOME is set to /opt/module/kylin-2.5.0-bin-hbase1x
3)启动Kylin
先启动集群各个服务,然后运行 $KYLIN_HOME/bin/kylin.sh start 脚本来启动 Kylin,服务器启动后,您可以通过查看 $KYLIN_HOME/logs/kylin.log 获得运行时日志。
[admin@node21 kylin-2.5.-bin-hbase1x]$ ./bin/kylin.sh start
Retrieving hadoop conf dir...
KYLIN_HOME is set to /opt/module/kylin-2.5.-bin-hbase1x
Retrieving hive dependency...
Retrieving hbase dependency...
Retrieving hadoop conf dir...
Retrieving kafka dependency...
Retrieving Spark dependency...
...
A new Kylin instance is started by root. To stop it, run 'kylin.sh stop'
Check the log at /opt/module/kylin-2.5.-bin-hbase1x/logs/kylin.log
Web UI is at http://<hostname>:7070/kylin-bash-4.1#
4)WebUI查看
- Kylin 启动后您可以通过浏览器 http://hostname:7070/kylin 查看。初始用户名和密码是 ADMIN/KYLIN。
 - 运行 
$KYLIN_HOME/bin/kylin.sh stop脚本,停止 Kylin。 
3.Kylin集群安装
Kylin的简介与安装部署的更多相关文章
- DB2简介和安装部署
		
一.DB2相关概念 1.DB2体系结构: DB2体系结构中的最高一层是系统,一个系统表示DB2的一个安装.在由很多机器组成 的网络环境中,我们有时=也称系统为数据库分区,一个系统可以包含多个DB2实例 ...
 - ELK日志监控平台安装部署简介--Elasticsearch安装部署
		
最近由于工作需要,需要搭建一个ELK日志监控平台,本次采用Filebeat(采集数据)+Elasticsearch(建立索引)+Kibana(展示)架构,实现日志搜索展示功能. 一.安装环境描述: 1 ...
 - Apache Flume简介及安装部署
		
概述 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的软件. Flume 的核心是把数据从数据源(source)收集过来,再将收集到的数据送到指定的目 ...
 - Redis  (一)Redis简介、安装部署
		
Redis是一个开源的,先进的 key-value 存储可用于构建高性能,可扩展的 Web 应用程序的解决方案. 既然是key-value,对于Java开发来说更熟悉的是Map集合.那就有问题了,有M ...
 - Tomcat简介、安装部署、上线网站
		
资源池 本章资源:点击这里 提取码:upbf tomcat官网:https://tomcat.apache.org/ jpress博客系统安装包下载地址(不是官网):https://gitee.com ...
 - prometheus学习系列三:node_exporter安装部署
		
node_exporter简介 node_exporter安装部署 [root@node00 ~]# cd /usr/src/ [root@node00 src]# wget https://gith ...
 - kylin 系列(一)安装部署
		
kylin 系列(一)安装部署 一.环境说明 1.1 版本选择 cdh 版本下载地址:http://archive.cloudera.com/cdh5/cdh/5/ 软件名称 版本 JDK 1.8 H ...
 - Kylin安装部署
		
一.安装准备 1.操作系统 Centos 7.x 2.时间问题 集群内所有节点时间一定要同步. NTP.Chrony 3.用户 创建hadoop组和hadoop用户,并做ssh免密码登录 4.Hado ...
 - Apache Kylin安装部署
		
0x01 Kylin安装环境 Kylin依赖于hadoop大数据平台,安装部署之前确认,大数据平台已经安装Hadoop, HBase, Hive. 1.1 了解kylin的两种二进制包 预打包的二进制 ...
 
随机推荐
- AWT和Swing的关系
			
1.AWT和Swing都是java中的包. 2.AWT(Abstract Window Toolkit):抽象窗口工具包,早期编写图形界面应用程序的包,AWT是通过调用操作系统的native方法实现的 ...
 - 996ICU与程序猿的个人成长
			
目录 规划 学习 专业领域知识 知识广度 第二职业 理财 借势 添砖加瓦 最近一段时间,996ICU在互联网界引发"大地震",从普通员工.行业大佬甚至官媒都进行了发声,大家对这个问 ...
 - A+ B
			
题目描述 读入两个小于100的正整数A和B,计算A+B. 需要注意的是:A和B的每一位数字由对应的英文单词给出. 输入描述: 测试输入包含若干测试用例,每个测试用例占一行,格式为"A + B ...
 - Linux 重启网卡失败 Job for network.service failed because the control process exited with error code. See "systemctl status network.service" and "journalctl -xe" for details.
			
linux下重启网卡使用命令 : service network restart 时报错: [root@slave01 hadoop]# service network restart Startin ...
 - 集大软件工程15级个人作业Week1
			
集大软件工程15级个人作业Week1 孙志威 201521123077 博客园主页 码云地址 阅读参考材料,并回答下面几个问题 (1)回想一下你初入大学时对网络工程专业的畅想 当初你是如何做出选择网络 ...
 - 20155333 2016-2017-2 《Java程序设计》第六周学习总结
			
20155333 2016-2017-2 <Java程序设计>第六周学习总结 教材学习内容总结 流(Stream)是对「输入输出」的抽象,注意「输入输出」是相对程序而言的 InputStr ...
 - cpp与其他语言相比较
			
new 相当于 malloc ,delete 相当于 free ,用法一样 c++ 有 namespace,可以避免类名污染 namespace xx{} c++ 有类 这个与 c#.as3比较 ...
 - Flask最强攻略 - 跟DragonFire学Flask - 第四篇 Flask 中的模板语言 Jinja2 及 render_template 的深度用法
			
是时候开始写个前端了,Flask中默认的模板语言是Jinja2 现在我们来一步一步的学习一下 Jinja2 捎带手把 render_template 中留下的疑问解决一下 首先我们要在后端定义几个字符 ...
 - spring boot + es
			
用Elasticsearch构建电商搜索平台 refs: http://www.sojson.com/blog/176.html
 - mongodb系列~mongodb慢语句(2)
			
一简介:今天遇到一个慢日志的排查和解决过程 二 版本:3.0.6 三 架构:分片集群 四 具体过程 1 程序响应很慢,具体日志寻找定点sql(mongodb慢日志记录在log日志里) awk '$NF ...