一.Kylin的伪分布式安装

一.伪分布式安装kylin

2018年4月15日

15:06

安装需要的环境

1. hadoop集群环境：由于安装的是CDH5.14.0的版本，所以相关组件都是跟5.14.0相关

2. spark采用的是2.2.1版本，是根据hadoop2.6.0进行编译的

3. kylin采用的是2.3.1，根据cdh5.7进行编译的

安装过程

启动hadoop集群以及hiveserver2和metastore服务（否则kylin无法访问hive的元数据）

nohup hive --service hiveserver2 2>>~/log 1>>/dev/null &

nohup hive --service metastore >> ~/abc.log &

注意：此时hive-site.xml文件中必须有如下配置：

<name>hive.metastore.uris</name>

<value>thrift://huabingood:9083</value>

<description>远程访问的metastore所在的地址于端口</description>

</property>

下载解压

配置环境变量

1. 将kylin_home的路径添加到配置文件中

2. 将Hcatalog_HOME的配置，这个配置在hive安装目录下的hcatalog文件夹中

export hive_dependency=/home/hadoop/hive/conf:/home/hadoop/hive/lib/*:/home/hadoop/hive/hcatalog/share/hcatalog/hive-hcatalog-core-2.0.0.jar

3. 注意：是每个节点的配置文件都要添加

配置kylin.sh

1. 在kylin安装目录下的bin/kylin.sh

2. export KYLIN_HOME= // 显式声明kylin_home

3. export export HBASE_CLASSPATH_PREFIX=${tomcat_root}/bin/bootstrap.jar:${tomcat_root}/bin/tomcat-juli.jar:${tomcat_root}/lib/*:$hive_dependency:$HBASE_CLASSPATH_PREFIX //在HBASE_CLASSPATH_PREFIX中显示增加$hive_dependency依赖

配置kylin_hive_conf.xml文件

1. 只需要将hive表的元数据信息的服务的地址在哪里开启即可（是启动metastore服务的那台主机IP）

<name>hive.metastore.uris</name>

<value>thrift://huabingood:9083</value>

<description>远程访问的metastore所在的地址于端口</description>

</property>

修改kylin.properties配置文件（这个不配置也能使用，不建议配置）

1. 注意，网上流传的这些配置的修改都落后了

kylin.rest.servers=master:7070

#定义kylin用于MR jobs的job.jar包和hbase的协处理jar包，用于提升性能。

kylin.job.jar=/home/hadoop/kylin/lib/kylin-job-1.6.0-SNAPSHOT.jar

kylin.coprocessor.local.jar=/home/hadoop/kylin/lib/kylin-coprocessor-1.6.0-SNAPSHOT.jar

2. 真正的配置是这些

kylin.server.cluster-servers=

kylin.engine.mr.job-jar=

kylin.storage.hbase.coprocessor-local-jar=

检查配置环境（实际上就是创建在hdfs上的路径）

1. ${kylin_home}/bin/check-env.sh

启动kylin

1. ${kylin_home}/bin/kylin.sh start

2. ${kylin_home}/bin/kylin.sh stop

webUI访问

1. http://hostname:7070/kylin

安装过程中的报错

java.lang.NoClassDefFoundError: org/apache/hadoop/hive/conf/HiveConf

1. 这个错误完全是kylin找不到hive的jar包导致的。我们只需将hive安装目录下lib中的jar包放到kylin安装目录下的lib中即可

2. 网上有说需要修改hadoop-env.sh配置文件，添加如下内容：

export HBASE_HOME=/data/hbase

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HBASE_HOME/lib/ # 添加classpath时，要将以前的加上，否则就是覆盖，会导致问题

java.lang.RuntimeException: cannot get HiveTableMeta

1. 查看表名是否写错

2. 如果表名没错的话，hiveserver2以及metastore是否开启；是否在hive-site.xml中配置了hive.metastore.uris属性

3. 将hive-stie.xml放到（建议使用软连接）kylin安装目录下的conf中，即使已经有了kylin_hive_conf.xml

org.apache.kylin.job.exception.ExecuteException: org.apache.kylin.job.exception.ExecuteException: java.lang.NoClassDefFoundError: org/apache/hive/hcatalog/mapreduce/HCatInputFormat

1. 网上说是HBASE_HOME别的设置覆盖掉了，导致系统找不到hbase的路径，就会报这个错误。

参考文献

https://segmentfault.com/a/1190000011506398

一.Kylin的伪分布式安装的更多相关文章

HBase基础和伪分布式安装配置
一.HBase(NoSQL)的数据模型 1.1 表(table),是存储管理数据的. 1.2 行键(row key),类似于MySQL中的主键,行键是HBase表天然自带的,创建表时不需要指定 1.3 ...
Zookeeper 初体验之——伪分布式安装（转）
原文地址: http://blog.csdn.net/salonzhou/article/details/47401069 简介 Apache Zookeeper 是由 Apache Hadoop 的 ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
hbase伪分布式安装（单节点安装）
hbase伪分布式安装(单节点安装) http://hbase.apache.org/book.html#quickstart 1. 前提配置好java,环境java变量上传jdk ...
ZooKeeper：win7上安装单机及伪分布式安装
zookeeper是一个为分布式应用所设计的分布式的.开源的调度服务,它主要用来解决分布式应用中经常遇到的一些数据管理问题,简化分布式应用,协调及其管理的难度,提高性能的分布式服务. 本章的目的:如何 ...
Hbase伪分布式安装
前面的文章已经讲过hadoop伪分布式安装,这里直接介绍hbase伪分布式安装. 1. 下载hbase 版本hbase 1.2.6 2. 解压hbase 3. 修改hbase-env.sh 新增如下内 ...
伪分布式安装core-site.xml和hdfs-site.xml配置文件
hadoop的伪分布式安装流程如下所示: 其中core-site.xml和hdfs-site.xml是两个很重要的配置文件. core-site.xml <configuration> & ...
指导手册02：伪分布式安装Hadoop(ubuntuLinux)
指导手册02:伪分布式安装Hadoop(ubuntuLinux) Part 1:安装及配置虚拟机 1.安装Linux. 1.安装Ubuntu1604 64位系统 2.设置语言,能输入中文 3.创建 ...
hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位二.实现Linux服务器联网功能网络适配器双击选择VMn ...

随机推荐

Android中的layout_gravity和gravity的区别
在Android的布局中,除了padding和margin容易弄混之外,还有layout_gravity和gravity.按照字面意思来说,layout_gravity就是相对于layout来设置的. ...
Alpha冲刺博客合集
Alpha冲刺序列: Alpha冲刺Day1:Alpha No.1 Alpha冲刺Day2:Alpha No.2 Alpha冲刺Day3:Alpha No.3 Alpha冲刺Day4:Alpha No ...
从0开始的LeetCode生活—9. Palindrome Number（回文数）
题目大意: 判断输入的数字是不是回文数.所谓回文数就是正反读都一样的数字,比如说11,121,1221这样子的数字.负数不会是回文数. 解题思路: 思路一:如果这个数是负数,则返回false,否则用一 ...
201621123050 《Java程序设计》第9周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结集合与泛型相关内容. 1.2 选做:收集你认为有用的代码片段 ①foreach循环 for (String e : map.keyS ...
位图（BitMap）
位图引入:2.给40亿个不重复的无符号整数,没排过序.给一个无符号整数,如何快速判断一个数是否在这40亿个数中. [腾讯] 思路:如果内存够的话,40亿个整型使用位图存储需要500M左右的空间. 分 ...
Beta冲刺Day7
项目进展李明皇今天解决的进度部分数据传递和使用逻辑测试林翔今天解决的进度服务器端查看个人发布的action,修改已发布消息状态的action,仍在尝试使用第三方云存储功能保存图片孙敏铭 ...
iOS Storyboard unwind segues使用小结
使用storyboard开发的时候,经常会在一个scene上添加一个button,再拖拽这个button到某个想要关联的页面,最后选择push的方式跳转.这样scene_A和scene_B就有了一个& ...
eclipse下maven一些配置方法汇总
随着eclipse的不同版本的变更:对maven插件的安装也有着不同的差异:之前也在一些版本的eclipse上安装成功地,但是最近又遇到了一些麻烦,故将这些方法记录下来: 大家都知道的最常用的一种方式 ...
loadrunner下载资源时步骤下载超时 (120 seconds) 已过期
下载资源所用时间超过120秒时,就会报出这个错误,解决方法是设置加大超时时间运行时设置(快捷键F4) Internet 协议--首选项--高级--选项--General--步骤下载超时(秒) 可以把 ...
技术文档分享_linux中生成考核用的GPT分区表结构修复
注:历史版本,后期改用python实现了实验一: 目的:用于生成大量模拟破坏GPT分区结构案例,并生成唯一方式修复后的评判方法.故障:在一个完整的GPT分区磁盘上,丢失了GPT主分区表,或备份分区表 ...

一.Kylin的伪分布式安装

一.Kylin的伪分布式安装的更多相关文章

随机推荐

热门专题