用schema workbench 设置cube的维度结构

saiku 使用的cube,会将不同维度的查询转化为sql语句。

schema中,

cube的事实表和dimension表进行自然连接,具体的dimension设置是,dimension设置界面上foreign key(事实表的某一列)与hierarchy设置界面上primaryKey(dimension表的主键)。关联是通过这两个列进行对比,所以一定要指定正确。

而,level设置界面上的Column是实现group by 的

写一个一个小例子:

mdx语句

SELECT

NON EMPTY {[Measures].[Downloads]} ON COLUMNS,

NON EMPTY TopCount({Hierarchize(CrossJoin([dimDate.default].[day].[2014-01-03], [compare_app.default].[appName].Members))},20,[downloads]) ON ROWS

FROM [aso]

注意[dimDate.default]中default为层级名。要设定好,才能正确的引用level。我为hierarchy起名为default,因为就一个。

转换为对应的sql语句为:

SELECT

 `dimdate`.`year` AS `c0`,

 `dimdate`.`yearname` AS `c1`,

 `dimdate`.`month` AS `c2`,

 `dimdate`.`monthname` AS `c3`,

 `dimdate`.`datevalue` AS `c4`,

 `dimappnamenew_1`.`app_name` AS `c5`

FROM

 `dimdate` AS `dimdate`,

 `factdownloadsnew` AS `factdownloadsnew`,

 `dimappnamenew` AS `dimappnamenew_1`

WHERE

 `factdownloadsnew`.`date_time` = `dimdate`.`datevalue`

AND `factdownloadsnew`.`app_link_hash` = `dimappnamenew_1`.`app_link_hash`

AND(

 `dimdate`.`datevalue` = '2014-01-03'

 AND `dimdate`.`month` = '1'

 AND `dimdate`.`year` = '2014'

)

GROUP BY

 `dimdate`.`year`,

 `dimdate`.`yearname`,

 `dimdate`.`month`,

 `dimdate`.`monthname`,

 `dimdate`.`datevalue`,

 `dimappnamenew_1`.`app_name`

ORDER BY

 ISNULL(`dimdate`.`year`)ASC,

 `dimdate`.`year` ASC,

 ISNULL(`dimdate`.`month`)ASC,

 `dimdate`.`month` ASC,

 ISNULL(`dimdate`.`datevalue`)ASC,

 `dimdate`.`datevalue` ASC,

 ISNULL(

  `dimappnamenew_1`.`app_name`

 )ASC,

 `dimappnamenew_1`.`app_name` ASC

这里我遇到一个问题,这个维度查询关联是按applinkhash进行,

结果如下:

而同样实现前20排名返回语句,用app_id进行关联:

SELECT

NON EMPTY {[Measures].[Downloads]} ON COLUMNS,

NON EMPTY TopCount({Hierarchize(CrossJoin([dimDate.default].[day].[2014-01-03], [dimApp.appName].[appName].Members))},20,[downloads]) ON ROWS

FROM [aso]

结果如下(不同):

两个结果不同。如,360用app_id统计的少了很多。

问题分析:applinkhash是一一对应的,而app_id也是一一对应的。二者比对应该相同。

app_id统计少了,是什么原因?

在原表中进行查询,直接统计360手机卫士的downloads,证明app_id是正确的。app_link_hash对比,会多统计一些。

原因如下:360手机卫士有两个version,5.0和4.3,两条记录applink,applinkhash相同,只有version不同,所以比对上有两个关联上了,导致累加到了一起。

另外,saiku中呈现的名字也是在schema里设置,对应关系:

schema名-------------最开始,saiku里面选择的schema

下一级

cube名----------------------saiku在每个schema下的名

下一级

dimension名(维度名)-----------------saiku呈现cube下为文件夹名

下一级

level名-------------------saiku可以拖拉使用的对象的

数据cube的schema与sql的对应的关系的更多相关文章

  1. 查询oracle数据库,返回的数据是乱码。 PL/SQL正常。

    查询oracle数据库,返回的数据是乱码. PL/SQL正常. 解决方案如下:

  2. SQLSERVER:大容量导入数据时保留标识值 (SQL Server)

    从MSDN上看到实现大容量导入数据时保留标识值得方法包含三种: MSDN链接地址为:https://msdn.microsoft.com/zh-cn/library/ms178129.aspx 感觉M ...

  3. MySQL数据导出为Excel, json,sql等格式

    MySQL数据经常要导出为Excel, json,sql等格式,通过步骤都很多,麻烦,现在通过Treesoft可以方便的导出你要的数据格式. 1.在线执行SQL,在数据列表中有相应按钮,方便的将数据导 ...

  4. 【mybatis】mybatis执行一个update方法,返回值为1,但是数据库中数据并未更新,粘贴sql语句直接在数据库执行,等待好久报错:Lock wait timeout exceeded; try restarting transaction

    今天使用mybatis和jpa的过程中,发现这样一个问题: mybatis执行一个update方法,返回值为1,但是数据库中数据并未更新,粘贴sql语句直接在数据库执行,等待好久报错:Lock wai ...

  5. 2016/05/13 thinkphp 3.2.2 ① 数据删除及执行原生sql语句 ②表单验证

    [数据删除及执行原生sql语句] delete()  返回受影响的记录条数 $goods -> delete(30);   删除主键值等于30的记录信息 $goods -> delete( ...

  6. Oracle取查询结果数据的第一条记录SQL

    Oracle取查询结果数据的第一条记录SQL: ; ;

  7. 在SQL Server中实现关系模型的阶梯到级别3的t -SQL DML

    在SQL Server中实现关系模型的阶梯到级别3的t -SQL DML 格雷戈里·拉森(Gregory Larsen),2017/08/02(第一次出版:2011 /11/09) 原文链接:http ...

  8. 在SQL Server中实现关系模型

    使用SQL Server的Transact-SQL(T-SQL)方言,此楼梯将为您提供如何使用SQL Server表中的数据的基本了解. DML是数据操作语言,是处理数据的语言的一个方面.它包括SEL ...

  9. 到T-SQL DML 三级的阶梯:在SQL server中实现关系模型

    作者: Gregory Larsen, 2017/08/02 (第一次出版: 2011/11/09) 翻译:谢雪妮,许雅莉,赖慧芳,刘琼滨 译文: 系列 该文章是阶梯系列的一部分:T-SQL DML的 ...

随机推荐

  1. Windows 为右键菜单瘦身

    当你想删除右键菜单中某些选项时,一种比较合适的思路是: 1.如果软件本身提供了控制选项,那么直接在该软件设置即可.没必要在注册表操作.比如360安全卫士和360杀毒都提供了这种机制. 值得一提的是,3 ...

  2. 24 服务AIDL

    AIDL远程访问服务的方法 创建一个接口类写上方法 然后修改后缀java为aidl 在服务中创建一个类继承Stub类 在远程访问服务的进程把AIDL文件复制(包名不能改变) XXXX.Stub.asI ...

  3. 详解EBS接口开发之库存事务处理-物料批次导入

    库存事务处理-物料批次导入 --系统批次表 SELECT * FROM MTL_LOT_NUMBERS T; --API创建批次 inv_lot_api_pub.create_inv_lot(x_re ...

  4. Hazelcast集群原理分析

    简介 hazelcast其中一个很重要的应用就是可以将多个应用服务器组成一个分布式环境的应用,形成一个cluster.这个cluster可以选举出一个master来对外工作.而cluster中的各台服 ...

  5. java中的interface接口

    接口:java接口是一些方法表征的集合,但是却不会在接口里实现具体的方法. java接口的特点如下: 1.java接口不能被实例化 2.java接口中声明的成员自动被设置为public,所以不存在pr ...

  6. JQuery其他常用函数

    isArray(obj)                      检测obj否为一个数组对象 isFunction(obj)                 检测obj否为一个函数 isEmptyO ...

  7. Android 5.1.1 源码目录结构

    点击打开链接 最近公司培训新同事,我负责整理一点关于android的基础知识,遥想当年,刚接触android,也是一头雾水, 啥都不懂,就是靠看文档和视频,对android有一个初步了解,然后就通过查 ...

  8. 使用maven将项目打成jar包

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/20 ...

  9. HMM:隐马尔科夫模型-前向算法

    http://blog.csdn.net/pipisorry/article/details/50722376 目标-解决HMM的基本问题之一:已知HMM模型λ及观察序列O,如何计算P(O|λ)(计算 ...

  10. synchronized和volatile比较

    synchronized和volatile比较 volatile不需要加锁,比synchronized更轻量级,不会阻塞线程 从内存可见性角度讲,volatile读相当于加锁,volatile写相当于 ...