关于Kylin的介绍和使用请参考之前的文章
《分布式大数据多维分析（OLAP）引擎Apache Kylin安装配置及使用示例》
Kylin对外提供的是SQL查询接口，基于Kylin构建OLAP多维分析系统，第一种方案是针对业务，定制开发一个前端界面，将界面上用户的选择和操作，翻译成SQL，提交给Kylin查询。另一种方案则是将Kylin与BI工具整合起来，借助BI工具，对Kylin中的Cube进行查询分析。Kylin本身对于BI工具Tableau可以非常好的整合使用，我自己下载了Tableau的试用版，效果确实不错，官方文档中也给出了详细的教程：

http://kylin.apache.org/cn/docs15/tutorial/tableau_91.html

可惜，Tableau是商业软件，收费的。

本文介绍另一个开源免费的BI工具–Saiku。
Saiku是一个轻量级的OLAP分析引擎，用户可以在非常友好的界面下利用OLAP和内存引擎进行向下钻取，过滤、分类、排序和生成图表。Saiku利用Mondrian完成了界面?MDX?SQL
的转换，最终将SQL通过JDBC提交给Kylin执行。

Github上已经有大神提供了编译好的相关jar包下载：

https://github.com/mustangore/kylin-mondrian-interaction

按照里面的说明，很简单就完成了Saiku+Kylin的整合部署。

Saiku中配置Kylin数据源

在浏览器输入Saiku的WEB地址：http://172.16.212.17:8080/
用户名密码为:admin/admin

STEP1：编写Mondrian Schema文件

<?xml version="1.0"?>
<Schema name="ad_schema">
<Cube name="lxw1234_ad_cube2">
<Table name="AD_REPORT" />
<Dimension name="地域">
<Hierarchy hasAll="false">
<Table name="AD_REPORT"></Table>
<Level name="省份" column="PROVINCE" table="AD_REPORT"></Level>
<Level name="城市" column="CITY" table="AD_REPORT"/>
</Hierarchy>
</Dimension>
<Measure name="曝光数" column="IMP_PV" aggregator="sum" datatype="Integer" />
<Measure name="唯一曝光数" column="COOKIEID_IMP" aggregator="distinct-count" datatype="Integer" />
<Measure name="点击数" column="CLK_PV" aggregator="sum" datatype="Integer" />
<Measure name="唯一点击数" column="COOKIEID_CLK" aggregator="distinct-count" datatype="Integer" />
</Cube>
</Schema>

STEP2：添加Kylin数据源

进入Saiku管理控制台，点击”Add Schema”，将编写好Schema文件上传。

接着点击”Add Data Source”，添加数据源：

STEP3：创建查询

回到Saiku Home主页，点击”Create a new query”，创建查询：

在多维数据下拉菜单中，选择Schema文件中定义好的Cube，自动获取指标和维度，双击指标和维度，在右边的区域即可自动进行查询展示。

Saiku中同样支持上钻、下钻、过滤、排序等操作。

存在的问题

在试用期间，发现两个严重的问题，导致Saiku和Kylin的整合甚至不能继续：

1. 事实表和维度表的join方式：

Mondrian中统一使用内关联(Inner
Join)的方式将事实表和维度表关联，而Kylin中，我的Cube是将事实表和维度表进行左关联(Left Join)生成的，因此不支持Inner
Join的查询。除非像我例子中的，把左右的维度名称都放置到事实表中，不和维度表关联，这样就没有问题。

2. Count Distinct的问题：

Mondrian对于Count Distinct的指标会翻译成SELECT COUNT(*) FROM (SELECT DISTINCT …)的形式，这种查询SQL提交给Kylin，并不支持，因此对于Count Distinct类型的指标无法查询分析。

看来要想很好的使用Saiku+Kylin，这两个问题还有待研究解决。

转自：lxw的大数据田地 » 使用Saiku+Kylin构建多维分析OLAP平台

【转】Kylin系列-使用Saiku+Kylin构建多维分析OLAP平台的更多相关文章

Saiku_学习_03_Saiku+Kylin构建多维分析OLAP平台
一.技术选型参见:Saiku+Kylin多维分析平台探索 1.saiku Saiku 作为分析平台,提供可视化的操作,能方便的对数据进行查询.分析,并提供图形化显示 2.kylin Kylin 作为 ...
Saiku + Kylin 多维分析平台探索
背景为了应对各种数据需求,通常,我们的做法是这样的: 对于临时性的数据需求:写HQL到Hive里去查一遍,然后将结果转为excel发送给需求人员. 对于周期性的.长期性的数据需求:编写脚本,结合Hi ...
《基于Apache Kylin构建大数据分析平台》
Kyligence联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿武汉市云升科技发展有限公司董事长,<智慧城市-大数据.物联网和云计算之应用>作者 ...
Kylin系列之二：原理介绍
Kylin系列之二:原理介绍 2018年4月15日 15:52 因何而生 Kylin和hive的区别 1. hive主要是离线分析平台,适用于已经有成熟的报表体系,每天只要定时运行即可. 2. Kyl ...
Kylin系列（一）—— 入门
因为平常只会使用kylin而不知其原理,故写下此篇文章.文章不是自己原创,是看过很多资料,查过很多博客,有自己的理解,觉得精华的部分的一个集合.算是自己对Kylin学习完的一个总结和概括吧 ...
kylin 系列（一）安装部署
kylin 系列(一)安装部署一.环境说明 1.1 版本选择 cdh 版本下载地址:http://archive.cloudera.com/cdh5/cdh/5/ 软件名称版本 JDK 1.8 H ...
Kylin使用笔记-0: kylin介绍
APACHE KYLIN™ 概览 Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发 ...
Jenkins持续集成企业实战系列之Jenkins手动构建-----04
注:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任. 最初接触Jenkins也是由于公司需求,根据公司需求Java代码项目升级的.(公司是 ...
Jenkins系列之-—06 Ant构建
一.Ant 简介&构建环境 Apache Ant 是由 Java 语言开发的工具构建ant环境: 1). 安装jdk,设置JAVA_HOME ,PATH ,CLASS_PATH 2). 下载 ...

随机推荐

ios多播委托
在现实中回调的需求也分两种一对一的回调. 一对多的回调. 对于一对一的回调,在IOS中使用delegate.block都能实现.而一对多的回调基本就是通知中心了. 假如现在有一个需求,我们以图片下载 ...
Centos6.5+Redmine
花了两天时间,基于centos6.5操作系统,搭建了redmine环境,在这里记录下过程中遇到的问题以及搭建流程. centos6.5; redmine2.5.0; Ruby1.9.3; step 1 ...
OC仿支付宝输入UITextField输入车牌号
效果图,如果使用,出现任何问题请告知,或者下方留言,我好以及改正 .h文件: #import <UIKit/UIKit.h> @interface LicenseKeyBoardView ...
what's the python之字符编码与文件处理
用文本编辑器打开一个文件就是把一个文件读入了内存中 ,所以打开文件的操作也是在内存中的,断电即消失,所以若要保存其内容就必须点击保存让其存入硬盘中 python解释器执行py文件的原理 : 第一阶段: ...
dxRibbonRadialMenu控件使用
设计视图双击dxRibbonRadialMenu1增加项目增改显示文字增加图标列表代码很简单,从当前鼠标位置打开,屏蔽系统右键 procedure TForm1.cxMemo1ContextP ...
aop 日志统一处理
AOP是Aspect Oriented Programing的简称,面向切面编程.AOP适合于那些具有横切逻辑的应用:如性能监测,访问控制,事务管理.缓存.对象池管理以及日志记录.AOP将这些分散在各 ...
Spark SQL内置函数
Spark SQL内置函数官网API:http://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.fun ...
extjs model store学习笔记
http://docs.sencha.com/extjs/6.2.0/guides/core_concepts/data_package.html // 定义一个ModelExt.define('My ...
Apache 强制Http跳转Https
找到网站根目录的.htaccess文件,添加如下代码 RewriteEngine On RewriteCond %{SERVER_PORT} RewriteRule ^(.*)$ https://%{ ...
26-Python3 面向对象
26-Python3 面向对象 ''' 面向对象技术简介 ''' ''' 类定义 ''' ''' 类对象 ''' class MyClass: i = 12345 def f(self): retur ...

【转】Kylin系列-使用Saiku+Kylin构建多维分析OLAP平台