神奇的 SQL ,高级处理之 Window Functions → 打破我们的局限!
开心一刻
今天儿子跟老婆聊天
儿子:妈妈,我为什么没有两个爸爸呀
老婆:每个人都只有一个爸爸呀,你看谁有两个爸爸了
儿子一脸真诚的看着老婆:那你为什么就有两个爸爸呢
老婆一脸疑惑的望向儿子:我哪有两个爸爸了?
儿子有点不服气,温柔地说道:你管爷爷叫爸爸,你管姥爷还叫爸爸,这不就是两个爸爸吗
老婆轻声解释道:虽然我管他们两个都叫爸爸,但是姥爷才是我的爸爸,爷爷是爸爸的爸爸,是我公公,明白了吗
儿子两眼朝天上看了下,若有所思道:公公不是太监吗
老婆惊讶道:什么太监呀,我说的公公和你说的公公不是一回事,你这一天天的脑子里都想什么呢
儿子生气道:你不用解释了,待会我就告诉奶奶,你说爷爷是太监
什么是窗口函数
Window Function 也称为 OLAP(Online Analytical Processing)函数
对数据库数据进行实时分析处理,例如市场分析、财务报表等,是标准的 SQL 功能
中文翻译过来,叫 窗口函数 ,或者 开窗函数 ,在 Oracle 中也称 分析函数
与 聚合函数 一样,也是对集合进行聚合计算,但和 聚合函数 又不一样,使用 聚合函数 时,每组只返回一个值,但 开窗函数 可以为组中的每一行返回一个值
你们懂我说的意思吧

现在不懂也没关系哈,继续往下看,看完之后你肯定就懂了
支持情况
既然 窗口函数 是 标准 SQL 功能 ,那关系型数据库应该都支持吧
Oracle 11g 、 SQL Server 2008 、 DB2 9.7 、 PostgreSQL 8.4 都支持窗口函数
但 MySQL 从 8 开始才支持, MySQL5.7 及之前的版本不支持 窗口函数
关于对标准 SQL 的支持以及支持程度,还得看各个数据库厂商,有的支持的早、支持的全,也有的支持的晚、支持的少
但随着时间的推移,标准 SQL 终将能在所有的 DBMS 中使用
窗口函数的语法
基本语法如下

看着很简单,但却很陌生,我们将其进行拆分下
1、 窗口函数 ,命名一般是见名知意,表明这个函数要实现的功能
2、 OVER 子句, OVER 是约定好的固定写法,其内容是规则的指定,告诉 窗口函数 以怎样的规则去实现功能
PARTITION BY 类似 GROUP BY ,指定分组规则
ORDER BY 就跟我们平时使用的 ORDER BY 一样,指定排序规则
看完这个语法介绍,我相信大家还是很懵,我非常理解大家

但先别慌,结合案例来看,慢慢就懂了
能够作为窗口函数使用的函数分两种
1、专用窗口函数,如: RANK 、 ROW_NUMBER 、 DENSE_RANK 等等
2、能够作为窗口函数的聚合函数,如: SUM 、 AVG 、 COUNT 、 MAX 、 MIN
后续的案例演示我们基于 MySQL8.0.30 ,初始表 tbl_ware 及数据如下

CREATE TABLE `tbl_ware` (
`ware_id` BIGINT(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '商品id',
`ware_name` VARCHAR(100) NOT NULL COMMENT '商品名称',
`ware_category` VARCHAR(100) NOT NULL COMMENT '商品类别',
`sale_unit_price` INT COMMENT '销售单价',
`purchase_unit_price` INT COMMENT '进货单价',
`registration_date` DATE COMMENT '等级日期',
PRIMARY KEY (`ware_id`) USING BTREE
) ENGINE=InnoDB COMMENT='产品'; INSERT INTO tbl_ware VALUES
(1,'T恤衫','衣服',100, 50,'2023-12-15'),
(2,'打孔器','办公用品',25, 10,'2023-12-15'),
(3,'运动T恤','衣服',150, 50,'2023-12-15'),
(4,'菜刀','厨房用具',75, 30,'2023-12-15'),
(5,'高压锅','厨房用具',600, 200,'2023-12-15'),
(6,'叉子','厨房用具',7, 3,'2023-12-15'),
(7,'菜板','厨房用具',98, 30,'2023-12-15'),
(8,'圆珠笔','办公用品',5, 2,'2023-12-15');
专用窗口函数
这些函数是标准 SQL 定义的 OLAP 专用函数,通过函数名很容易看出其 OLAP 的用途
RANK
从名字可知,该函数用来排名、排序
1、假设我们对 tbl_ware 按售价从高到低进行排名, SQL 该如何写
相信大家很容易就写出来了: SELECT * FROM tbl_ware ORDER BY sale_unit_price DESC;
用 RANK 也能实现: SELECT *, RANK() OVER(ORDER BY sale_unit_price DESC) AS ranking FROM tbl_ware;

2、假设我们对 tbl_ware 按类别进行分组,然后组内按售价从高到低进行排名, SQL 又该如何写
有小伙伴一看到分组二字,第一反应肯定想到了 GROUP BY ,不只是你们,我也是一样的
但 GROUP BY 往往结合 聚合函数 使用,分组后每组只能得到一个值,显然满足不了需求
但 RANK 可以: SELECT *, RANK() OVER(PARTITION BY ware_category ORDER BY sale_unit_price DESC) AS ranking FROM tbl_ware;

PARTITION BY 对表的横向进行分组,类似 GROUP BY ,但不具备聚合功能
ORDER BY 则决定了纵向排序的规则,与 SELECT 子句末尾的 ORDER BY 子句完全相同
通过 PARTITION BY 分组后的记录集合称为“窗口”,代表“范围”。这也是 窗口函数 名称的由来
DENSE_RANK
一看名字就知道跟 RANK 有关系,为了对比它俩的区别,需要补充几条数据

INSERT INTO tbl_ware VALUES
(9,'带帽卫衣','衣服', 150, 90, '2023-12-15'),
(10,'砍骨刀','厨房用具', 150, 69, '2023-12-15');

RANK 排序时,如果存在相同位次的记录,会跳过之后的位次,如: 1,2,2,2,5 , 3,4 被跳过了
DENSE_RANK 排序时,如果存在相同位次的记录,则不会跳过之后的位次,如: 1,2,2,2,3,4
ROW_NUMBER
获取行数或者行号
如果我们想按售价从高到低排序后,获取每一行的行号, SQL 可写成: SELECT *, ROW_NUMBER() OVER(ORDER BY sale_unit_price DESC) AS row_num FROM tbl_ware;

如果再加上一个分组: SELECT *, ROW_NUMBER() OVER(PARTITION BY ware_category ORDER BY sale_unit_price DESC) AS row_num FROM tbl_ware;

此刻大家应该想起点什么了

分组取前N条,是不是很适合用这种方式实现?
我都跟你们实现好了:MySQL 分组排序后 → 如何取前N条或倒数N条
还有其他的 专用窗口函数 就不一一做介绍了,大家可以去各个数据库的官网进行查阅
聚合函数的窗口化使用
所有的 聚合函数 都能用作窗口函数,其语法和 专用窗口函数 完全相同
作为窗口化使用后, 聚合函数 实现的效果就发生了很大的变化,我们来看具体案例
SUM
作为 聚合函数 , SUM 的作用想必大家都很清楚了
但是窗口化之后了,我们来看看效果

发现什么了?
并不是一个单独的汇总值,而是逐行汇总,是不是有点意思?
如果再加上分组

分组后,对每一组进行逐行汇总
AVG
类比 SUM ,我们直接看分组的情况

分组后,对每一组的每一行求历史平均值
其他 聚合函数 的窗口化就不一一演示了,相信大家也都明白了
窗口函数的适用范围
通过上述的几个案例,相信大家对这个问题已经有了一个大致的答案
窗口函数 只能在 SELECT 子句中使用,不能在 WHERE 子句或者 GROUP BY 子句中使用,为什么了?
因为 窗口函数 是对 WHERE 子句或者 GROUP BY 子句处理后的“结果”进行的逐行操作
我们换个角度来看, 窗口函数 是不会改变结果行数的,而 WHERE 是会改变结果行数的,那把 窗口函数 放到 WHERE 子句的意义何在?
所以一不做二不休,直接在语法上做了这样的限制: 窗口函数 只能在 SELECT 子句中使用
总结
1、 窗口函数 是标准的 SQL 功能,而非特定数据库的功能
SQL 功能的落地还得依赖各个数据库厂商
提供了标准,数据库厂商不一定实现,或者说暂时不实现
2、 窗口函数 与 聚合函数 并非矛盾,二者是互补关系
3、之所以对 窗口函数 这么陌生,主要是我们使用太少,但是其在报表分析方面还是很有作用的
4、 窗口函数 的使用范围很有限,你可以随意使用,报语法错误了再调整呗
参考
《SQL 基础教程》
神奇的 SQL ,高级处理之 Window Functions → 打破我们的局限!的更多相关文章
- Oracle SQL高级编程——分析函数(窗口函数)全面讲解
Oracle SQL高级编程--分析函数(窗口函数)全面讲解 注:本文来源于:<Oracle SQL高级编程--分析函数(窗口函数)全面讲解> 概述 分析函数是以一定的方法在一个与当前行相 ...
- MySQL 8.0.2: Introducing Window Functions
July 18, 2017MySQL, SQLDag Wanvik MySQL 8.0.2 introduces SQL window functions, or analytic functions ...
- oracle sql 高级编程 历史笔记整理
20130909 周一 oracle sql 开发指南 第7章 高级查询 1.层次化查询select level,ttt.*,sys_connect_by_path(ttt.col1,',') fro ...
- SQL 高级查询(层次化查询,递归)
SQL 高级查询 前面我们写了一下 SQL 的极简入门,今天来说点高级查询.没看到的朋友可以点击下面链接查看. 1 小时 SQL 极速入门(一) 1 小时 SQL 极速入门(二) 1 小时 SQL 极 ...
- SQL高级查询技巧
SQL高级查询技巧 1.UNION,EXCEPT,INTERSECT运算符 A,UNION 运算符 UNION 运算符通过组合其他两个结果表(例如 TABLE1 和 TABLE2)并消去表中任何重 ...
- 13Microsoft SQL Server SQL 高级事务,锁,游标,分区
Microsoft SQL Server SQL高级事务,锁,游标,分区 通过采用事务和锁机制,解决了数据库系统的并发性问题. 9.1数据库事务 (1)BEGIN TRANSACTION语句定义事务的 ...
- 一些SQL高级函数
一些SQL高级函数 Posted on 2010-08-08 21:34 moss_tan_jun 阅读(311) 评论(0) 编辑 收藏 长度与分析用 datalength(Char_expr) 返 ...
- 神奇的 SQL 之谓词 → 难理解的 EXISTS
前言 开心一刻 我要飞的更高,飞的更高,啊! 谓词 SQL 中的谓词指的是:返回值是逻辑值的函数.我们知道函数的返回值有可能是数字.字符串或者日期等等,但谓词的返回值全部是逻辑值(TRUE/FALSE ...
- oracle学习笔记(十七) PL/SQL高级应用
PL/SQL高级应用 动态SQL 在PL/SQL中,不能直接执行DDL(create,alter,drop),得使用动态SQL,当然,除了DDL,动态SQL也可以执行DML(select,insert ...
- 神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(二)
开心一刻 一头母牛在吃草,突然一头公牛从远处狂奔而来说:“快跑啊!!楼主来了!” 母牛说:“楼主来了关我屁事啊?” 公牛急忙说:“楼主吹牛逼呀!” 母牛大惊,拔腿就跑,边跑边问:“你是公牛你怕什么啊? ...
随机推荐
- Hugging News #0821: Hugging Face 完成 2.35 亿美元 D 轮融资
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...
- java与es8实战之五:SpringBoot应用中操作es8(带安全检查:https、账号密码、API Key)
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览 本篇是<java与es8实战>系 ...
- 高德Android高性能高稳定性代码覆盖率技术实践
前言 代码覆盖率(Code coverage)是软件测试中的一种度量方式,用于反映代码被测试的比例和程度. 在软件迭代过程中,除了应该关注测试过程中的代码覆盖率,用户使用过程中的代码覆盖率也是一个非 ...
- 以程序员为视角,关于商品详情API接口的说明
商品详情API接口是现代电商平台中非常重要的一部分,它提供了获取淘宝商品详细信息的能力.作为一个程序员,了解如何调用这个API接口是非常关键的. 首先,我们需要明确的是,API接口是应用程序与服务 ...
- 【matplotlib基础】--图例
Matplotlib 中的图例是帮助观察者理解图像数据的重要工具.图例通常包含在图像中,用于解释不同的颜色.形状.标签和其他元素. 1. 主要参数 当不设置图例的参数时,默认的图例是这样的. impo ...
- redis单机、主从、哨兵、集群以及redisson分布式锁
1.搭建集群 Linux系统的Redis各版本下载路径:https://download.redis.io/releases/,建议下载5.0以上的版本,下载后进行解压安装 (1)单机版 安装环境 y ...
- Vue-入门vue,及第一个vue程序
一.初始Vue 什么是vue Vue (发音为 /vjuː/,类似 view) 是一款用于构建用户界面的 JavaScript 框架.它基于标准 HTML.CSS 和 JavaScript 构建,并提 ...
- pci p2p
概述 在2018年,针对pci支持p2pdma的驱动合入主线,没记错的话应该是4.20. 补丁如下: commit 52916982af48d9f9fc01ad825259de1eb3a9b25e A ...
- 如何用ppt打印9张一面,并且去除边距?
如何用ppt打印9张一面,并且去除边距? 方法其实很简单,答主不要在ppt软件的打印选项里设置[每页打印9张幻灯片],而是使用默认的[每页打印1张幻灯片]. 然后去[打印机属性]里设置,我是 ...
- idea修改默认maven配置
idea修改默认maven配置 方法一 (不推荐) 打开project.default.xml文件,在其中加入如下几行配置. 代码如下 保存修改之后新建一个maven项目查看效果 方法二 新增Proj ...