DAX是一种专门用于计算数据模型的业务公式的语言,本文以Power BI的关系来学习数据模型。

一,理解数据模型

数据模型是由一组表和关系构成的结构,表和表之间由关系链接,如下图所示的产品数据模型:

表格是组织数据的二维结构,由行和列构成,其本身是一个最简单的数据模型。当要描述更复杂的数据模型时,就需要使用多张表。在具有多个表的数据模型中,表和表之间的数据具有关联性,通过关系把相关联的两个表连接起来,并设置关系的类型和方向。

关系用于连接两个表,是数据模型的重要组成部分,关系具有以下几个特点:

  • 用来创建关系的列(通常在两个表中都有相同的名称)被称为关系的键。
  • 在表格数据模型中,关系只能在单列上创建。多列关系不被引擎支持。
  • 关系的类型有两种:一对一(1:1),一对多(1:*)。
  • 根据关系的类型,关系两端的表承担的角色是不同的,在一对多关系中,1端称为关系的一方,多端称为关系的多方。
  • 在关系的一方,关系的列是表的主键,值是唯一的。在关系的多方,关系的列在多方表中允许存在重复值。
  • 在每一个关系中,都有一个或两个小箭头。箭头指示自动过滤关系的方向。
  • 关系按照方向可以形成一个链条,在链条上可以对数据进行过滤。

二,理解关系

关系有两个属性:类型和方向,在Power BI中,创建的关系需要指定关系的类型(Cardinality)和关系的方向(Cross filter direction),如下图所示:

1,关系的类型

关系的类型有两种:1对1,1对多

  • 1对1 :表示关系两端的列都是唯一列,不存在重复值;
  • 1对多 :表示关系两端的列,1方是唯一列,不存在重复值;而多方的列允许存在重复值。

关系的类型是由关系两端的列值的唯一性决定的,当列值是唯一时,该端是“1方”,当列值允许存在重复值时,该端是“多方”。

注:PowerBI支持多对多关系。

2,关系的方向

在关系中,箭头的方向就是关系的方向,箭头指示在应用关系时对值进行自动过滤的方向。在Power BI中,关系的方向有Single和Both两种,分别表示单向和双向。

每一个关系都有一个或两个方向的过滤,过滤总是从关系的一方到多方。如果关系是双向的(也就是说,它有两个箭头),那么过滤也会从多方到单方。

关系的方向跟计算的上下文有很大的关系,对CALCULATE()函数计算的结果影响非常大。

三,理解关系的工作方式

SQL查询和DAX之间存在很多的相似性,SQL和DAX之间最明显的区别在于模型中的关系工作方式。

在SQL查询中,你可以在表格之间设置外键来声明关系,但是引擎在查询中从不使用这些外键,除非你对它们很明确。例如,如果你有一个客户表和一个销售表,其中CustomerKey是客户的主键和销售中的外键,那么你可以编写一个查询:

SELECT c.FullName as CustomerName,
SUM ( s.SalesAmount ) AS SumOfSales
FROM dbo.FactSales s
LEFT JOIN dbo.DimCustomers c
ON s.CustomerKey = c.CustomerKey
GROUP BY c.FullName
order by c.FullName

即使您使用外键声明了模型中的关系,您仍然需要显式地在查询中声明联接条件。但是,在DAX中,关系是模型的一部分,它们都是外部连接。一旦在模型中定义了,您就不再需要在查询中指定联接类型:当您使用与主表相关的列时,DAX在查询中使用一个自动的左外连接。因此,您可以在DAX中编写和以上TSQL等价的查询:

SumOfSalesTable = SUMMARIZE (
FactSales,
DimCustomers[FullName],
"SumOfSales", SUM (FactSales[SalesAmount])
)

在DAX中不需要像TSQL那样显示指定连接的条件,DAX根据FactSales表和DimCustomers表之间关系,推断出销售和客户之间的关系,自动跟随模型计算出按照FullName分组后每个客户的所有订单总额。

对SUMMARIZE()函数做一个小结:

结论1,主表和相关表的连接是左外连接

FactSales是主表,主表和其相关的列使用左外连接,这就意味着,如果主表FactSales中插入DimCustomers中不存在值,那么FullName会显示为Blank。

我做了个实验,向FactSales表中插入一个无效的CustomerKey:

在刷新PowerBI的FactSales表之后,发现DAX中的FullName列多了一个空值:

 结论2,主表是多方

在SUMMARIZE函数连接两个表时,主表是多方。

参考文档:

【DAX圣经】第一章:DAX是什么?

DAX 第一篇:数据模型的更多相关文章

  1. Zookeeper 入门第一篇

    转载原文地址: ZooKeeper学习总结 第一篇:ZooKeeper快速入门 ZooKeeper学习总结 第二篇:ZooKeeper深入探讨 ZooKeeper学习第一期---Zookeeper简单 ...

  2. Entity Framework 6.0 入门系列 第一篇

    Entity Framework 6.0 入门系列 第一篇 好几年前接触过一些ef感觉不是很好用,废弃.但是 Entity Framework 6.0是经过几个版本优化过的产物,性能和功能不断完善,开 ...

  3. Flink入门-第一篇:Flink基础概念以及竞品对比

    Flink入门-第一篇:Flink基础概念以及竞品对比 Flink介绍 截止2021年10月Flink最新的稳定版本已经发展到1.14.0 Flink起源于一个名为Stratosphere的研究项目主 ...

  4. 从0开始搭建SQL Server AlwaysOn 第一篇(配置域控)

    从0开始搭建SQL Server AlwaysOn 第一篇(配置域控) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www.cnb ...

  5. Python爬虫小白入门(四)PhatomJS+Selenium第一篇

    一.前言 在上一篇博文中,我们的爬虫面临着一个问题,在爬取Unsplash网站的时候,由于网站是下拉刷新,并没有分页.所以不能够通过页码获取页面的url来分别发送网络请求.我也尝试了其他方式,比如下拉 ...

  6. Three.js 第一篇:绘制一个静态的3D球体

    第一篇就画一个球体吧 首先我们知道Three.js其实是一个3D的JS引擎,其中的强大之处就在于这个JS框架并不是依托于JQUERY来写的.那么,我们在写这一篇绘制3D球体的文章的时候,应该注意哪些地 ...

  7. 深入学习jQuery选择器系列第一篇——基础选择器和层级选择器

    × 目录 [1]id选择器 [2]元素选择器 [3]类选择器[4]通配选择器[5]群组选择器[6]后代选择器[7]兄弟选择器 前面的话 选择器是jQuery的根基,在jQuery中,对事件处理.遍历D ...

  8. 【第一篇】ASP.NET MVC快速入门之数据库操作(MVC5+EF6)

    目录 [第一篇]ASP.NET MVC快速入门之数据库操作(MVC5+EF6) [第二篇]ASP.NET MVC快速入门之数据注解(MVC5+EF6) [第三篇]ASP.NET MVC快速入门之安全策 ...

  9. Android基础学习第一篇—Project目录结构

    写在前面的话: 1. 最近在自学Android,也是边看书边写一些Demo,由于知识点越来越多,脑子越来越记不清楚,所以打算写成读书笔记,供以后查看,也算是把自己学到所理解的东西写出来,献丑,如有不对 ...

随机推荐

  1. selenium + ChromeDriver 实战系列之启信宝(一)

    之前写了一篇selenium + ChromeDriver的一些入门的知识,这篇博客里面找了启信宝这个网站,简单的进行了一个实战练习.本篇博客的结构如下:       首先会给出一些使用seleniu ...

  2. 随机森林分类器(Random Forest)

    阅读目录 1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Pyth ...

  3. Android开发参考资料

    Android入门第九篇之AlertDialog: http://blog.csdn.net/hellogv/article/details/5955959 Android的AlertDialog详解 ...

  4. EF日志记录,包括记录Linq生成的Sql

    <interceptors> <interceptor type="System.Data.Entity.Infrastructure.Interception.Datab ...

  5. Node EE方案 -- Rockerjs在微店的建设与发展

    本文是根据2019.4.13日参加 "Node-Party"论坛使用的PPT,加上笔者新的思考与沉淀而来.在此再次感谢贝贝网前端部门和芋头君以及相关与会人员的支持! -- 微店杨力 ...

  6. Delphi 中 断言 Assert 用法

    procedure Assert(expr : Boolean [; const msg: string]); 用法:   Assert(表达式,[显示信息]); 如果为假, assert会产生一个E ...

  7. 【Linux】Linux下设备网卡以及硬件管理等

    这是Linux下网络硬件管理的基础知识,虽然平时用到的可能比软件的少一点,但是作为基础命令,还是需要记住,以免用时又得查询. 本文参考官方文档:https://wiki.ubuntu.com.cn/% ...

  8. Google Breakpad 在 windows下捕获程序崩溃报告

    http://blog.csdn.net/goforwardtostep/article/details/56304285

  9. ABP开发框架前后端开发系列---(11)菜单的动态管理

    在前面随笔<ABP开发框架前后端开发系列---(9)ABP框架的权限控制管理>中介绍了基于ABP框架服务构建的Winform客户端,客户端通过Web API调用的方式进行获取数据,从而实现 ...

  10. Tido 习题-二叉树-最高分

    题目描述 老师想知道从某某同学到某某同学当中,分数最高的是多少.现在请你编程模拟老师的询问.当然,老师有时候需要更新某位同学的成绩. 输入 输入包含多组测试数据.每组输入第一行是两个正整数N和M(0& ...