本章分为两个部分:

  1. 窗口函数
  2. GROUPING 运算符

它们用于以「窗口」为单位的排序、计算总和等任务.

OLAP 函数

OLAP 定义:OLAP 是 OnLIne Analytical Processing 的简称,意思是对数据库数据进行实时分析处理
OLAP 函数定义: 为了实现 OLAP 的标准 SQL 功能.

语法

<OLAP function> ([PARTITION BY <collist>]
ORDER BY <collist>)

窗口定义:通过 PARTITION BY 分组后的记录集合称为窗口.它代表「范围」的概念.

要点与 Keyword:

  1. OLAP function :即窗口函数.可用的窗口函数有两类,第一类为专用窗口函数(例如: RANK, DENSE_RANK, ROW_NUMBE), 另一类为聚合函数(例如: SUM, AVG, COUNT, MAX, MIN)
  2. PARTITION BY :[可选的]设定执行窗口函数的的对象范围.
  3. ORDER BY: 指定按照哪一列、何种顺序(可指定 ASC/DESC 来指定升序和降序)执行窗口函数.
  4. 窗口函数不能用在 WHERE 子句和 GROUP BY 子句中.

专用窗口函数

RANK 函数,DENSE_RANK 函数, ROW_NUMBER 函数均是专用窗口函数,可以用于排序,它们的不同之处在于:
若三条记录并列第一,结果分别为:

  1. RANK: 1,1,1,4
  2. DENSE_RANK: 1,1,1,2
  3. ROW_NUMBER:1,2,3,4

框架

定义:在窗口中指定的更加详细的汇总范围的备选功能,该汇总功能的汇总范围称为框架.

语法

举例:
用于计算当前行、上一行、下一行的 sale_price 的平均值

SELECT product_id, product_name, sale_price,
AVG (sale_price) OVER (ORDER BY product_id
ROWS BETWEEN 1 PRECEDING AND
1 FOLLOWING) AS moving_avg
FROM Product;

在 OVER 子句中指定 PRECEDING关键词(意为当前行的上一行) 和 FOLLOWING 关键词(意为当前行的下一行),来确定窗口函数执行的范围

GROUPING 运算符

问题源

由于 GROUP BY 子句只指定聚合键,因此结果中只有小计,因此不能同时得到总计.
普通解决办法是使用 UNION ,但标准 SQL 引入了 GROUPING 运算符,用于得到不同汇总范围下的汇总结果.
GROUPING 运算法包括以下3种:

  1. ROLLUP
  2. CUBE
  3. GROUPING SET

语法:

用于 GROUP BY 子句中:格式如下
GROUP BY <function>(<col1><col2>,...)
<function> 为函数

ROLLUP 运算符

定义:

一次计算出不同聚合键集合的结果

语法:

比如:
GROUP BY ROLLUP(<col1><col2>)
得到下面三种组合的汇总结果:
① GROUP BY () :称为「超级分组」,其默认的键值为 NULL,结果为未使用 GROUP BY 的合集行.
② GROUP BY(<col1>)
③ GROUP BY(<col1>,<col2>)

ROLLUP 是“卷起”的意思,比如卷起百叶窗、窗帘卷,等等.其名称也形象地说明了该操作能够得到像从小计到合计这样,从最小的聚合级开始,聚合单位逐渐扩大的结果.

GROUPING 函数——区分 NULL 与汇总

由于超级分组以 NULL 为聚合键,当存在以 NULL 为聚合键的其他分组时,就难以区分超级分组和其他分组,因此可以使用 GROUPING 函数配合 CASE 语句加以区分

格式:

SELECT CASE WHEN GROUPING(product_type) = 1
THEN '商品种类 合计'
ELSE product_type END AS product_type,
CASE WHEN GROUPING(regist_date) = 1
THEN '登记日期 合计'
ELSE CAST(regist_date AS VARCHAR(16)) END AS regist_date,
SUM(sale_price) AS sum_price
FROM Product
GROUP BY ROLLUP(product_type, regist_date);

以上为 GROUPING 配合 CASE 语句同时得到小计和总计的范例.

语法:

当参数列的值为超级分组产生的 NULL 时返回1, 其他情况返回 0

CUBE 运算符

定义:得到聚合键的所有组合的结果,组合的个数为 2n

GROUPING SETS 运算符

定义:只得到指定的列作为聚合键的汇总

三个运算符之间的关系

聚合键的数目从多到少依次为:

  1. CUBE
  2. ROLLUP
  3. GROUPING SETS

《SQL 基础教程》第八章:SQL 高级处理的更多相关文章

  1. 《SQL基础教程》+ 《SQL进阶教程》 学习笔记

    写在前面:本文主要注重 SQL 的理论.主流覆盖的功能范围及其基本语法/用法.至于详细的 SQL 语法/用法,因为每家 DBMS 都有些许不同,我会在以后专门介绍某款DBMS(例如 PostgreSQ ...

  2. [SQL基础教程] 5-1视图

    [SQL基础教程] 5-1视图 视图和表 从SQL角度看视图就是一张表 视图与表的差别 表保存了实际的数据,视图保存的是SELECT语句: 视图的优点 节省存储空间: 将常用的Select 语句保存成 ...

  3. [SQL基础教程] 4-4 事务

    [SQL基础教程] 4 数据更新 4-4 事务 事务 需要在同一处理单元中执行的一系列更新处理的集合 创建事务 事务开始语句; DML语句1; DML语句2; . . . 事务结束语句; 事务开始语句 ...

  4. [SQL基础教程] 4-3 数据的更新(UPDATE)

    [SQL基础教程] C4 数据更新 4-3 数据的更新(UPDATE) UPDATE UPDATE <表名> SET <列名> = <表达式>; UPDATE &l ...

  5. [SQL基础教程] 4-2 数据删除(DELETE)

    [SQL基础教程] C4 数据更新 4-2 数据删除(DELETE) DROP TABLE / DELETE DROP TABLE - 完全删除表 DELETE - 仅删除数据,保留表容器 DELET ...

  6. [SQL基础教程] 4-1 数据的插入(INSERT)

    [SQL基础教程] C4 数据更新 4-1 数据的插入(INSERT) INSERT INSERT INTO <表名>(列1,列2...) VALUES(值1,值2...); 清单 用() ...

  7. [SQL基础教程] 3-4 对查询结果进行排序/ORDER BY

    [SQL基础教程] 3-4 对查询结果进行排序/ORDER BY ORDER BY SELECT <列名1>,<列名2>,<列名2>... FROM ORDER B ...

  8. [SQL基础教程] 3-3 HAVING

    [SQL基础教程] 3-3 HAVING HAVING子句 SELECT col_1,col_2 FROM table GROUP BY col_1,col_2 HAVING col_1 = '2'; ...

  9. [SQL基础教程] 3-2 对表进行分组

    [SQL基础教程] 3-2 对表进行分组 GROUP BY SELECT <列名1>,<列名2>,... FROM <表名> GROUP BY <列名1> ...

  10. [SQL基础教程] 3-1 对表进行聚合查询

    [SQL基础教程] 3-1 对表进行聚合查询 聚合函数 用于合计的函数称为聚合函数或者集合函数 COUNT SUM AVG MAX MIN SELECT COUNT(*) FROM table; SE ...

随机推荐

  1. TerminateProcess实现关闭任意程序

    #include <Windows.h> #include <tchar.h> int WINAPI _tWinMain(HINSTANCE hInstance, HINSTA ...

  2. 读C#图解教程的笔记

    第一章记录: 格式化字符串 Console.WriteLine("{0:D}", 123456789);//表示十进制字符串 Console.WriteLine("{0: ...

  3. 灵雀云:etcd 集群运维实践

    [编者的话]etcd 是 Kubernetes 集群的数据核心,最严重的情况是,当 etcd 出问题彻底无法恢复的时候,解决问题的办法可能只有重新搭建一个环境.因此围绕 etcd 相关的运维知识就比较 ...

  4. laravel ServiceProvider 加载顺序

    主要看一下代码: public function registerConfiguredProviders(){//读取app的配置,然后,分成两部分Illuminate开始的,和其他的 $provid ...

  5. 【JavaScript】数组

    [声明一个数组]var a=[1,1,1]; [定义数组的长度]var a=new Array(2); [特殊数组]arguments[0][可以不用声明,当数组内没有东西时可以直接通过方法的参数自动 ...

  6. Flask实战-留言板-使用Faker生成虚拟数据

    使用Faker生成虚拟数据 创建虚拟数据是编写Web程序时的常见需求.在简单的场景下,我们可以手动创建一些虚拟数据,但更方便的选择是使用第三方库实现.流行的python虚拟数据生成工具有Mimesis ...

  7. 1.字符串操作:& 2.英文词频统计预处理

    1.字符串操作: 解析身份证号:生日.性别.出生地等. ID = input('请输入十八位身份证号码: ') if len(ID) == 18: print("你的身份证号码是 " ...

  8. Linux基础命令---mpstat显示cpu使用

    mpstat mpstat指令用来显示cpu的使用状况,将内容显示到标准输出.处理器0是第一个.还报告了所有处理器之间的全球平均活动.mpstat命令既可以在SMP机器上使用,也可以在UP机器上使用, ...

  9. 通过浏览器F12开发工具快速获取别的网站前端代码的方法

    通过浏览器F12开发工具快速获取别的网站前端代码的方法 说明:直接另存为网页是比较老的做法,会有很多没用的东西下载下来.通过F12开发工具,sources获取到的是比较好的,有目录结构的源文件.

  10. java线程学习之notify方法和notifyAll方法

    notify(通知)方法,会将等待队列中的一个线程取出.比如obj.notify();那么obj的等待队列中就会有一个线程选中并且唤醒,然后被唤醒的队列就会退出等待队列.活跃线程调用等待队列中的线程时 ...