SQL进阶系列之10HAVING子句又回来了
写在前面
HAVING子句的处理对象是集合而不是记录
各队,全队点名
--各队,全体点名!
CREATE TABLE Teams
(member CHAR(12) NOT NULL PRIMARY KEY,
team_id INTEGER NOT NULL,
status CHAR(8) NOT NULL);
INSERT INTO Teams VALUES('乔', 1, '待命');
INSERT INTO Teams VALUES('肯', 1, '出勤中');
INSERT INTO Teams VALUES('米克', 1, '待命');
INSERT INTO Teams VALUES('卡伦', 2, '出勤中');
INSERT INTO Teams VALUES('凯斯', 2, '休息');
INSERT INTO Teams VALUES('简', 3, '待命');
INSERT INTO Teams VALUES('哈特', 3, '待命');
INSERT INTO Teams VALUES('迪克', 3, '待命');
INSERT INTO Teams VALUES('贝斯', 4, '待命');
INSERT INTO Teams VALUES('阿伦', 5, '出勤中');
INSERT INTO Teams VALUES('罗伯特', 5, '休息');
INSERT INTO Teams VALUES('卡根', 5, '待命');
-- 找出全队全员处于待命状态的队伍
-- NOT EXISTS法
SELECT team_id,member FROM Teams AS T1
WHERE NOT EXISTS (SELECT * FROM Teams AS T2 WHERE T1.team_id = T2.team_id AND status <> '待命' );
-- HAVING方法
SELECT team_id FROM Teams GROUP BY team_id HAVING COUNT(*) = SUM(CASE WHEN status = '待命' THEN 1 ELSE 0 END);
-- 变通方法1
SELECT team_id FROM Teams GROUP BY team_id HAVING MAX(status) = '待命' AND MIN(status) ='待命';
-- 变通方法2
SELECT team_id, CASE WHEN MAX(status) = '待命' AND MIN(status) = '待命' THEN '全都在待命' ELSE '队长!人手不够' END AS status
FROM Teams
GROUP BY team_id;
单重集合与多重集合
--单重集合与多重集合
CREATE TABLE Materials
(center CHAR(12) NOT NULL,
receive_date DATE NOT NULL,
material CHAR(12) NOT NULL,
PRIMARY KEY(center, receive_date));
INSERT INTO Materials VALUES('东京' ,'2007-4-01', '锡');
INSERT INTO Materials VALUES('东京' ,'2007-4-12', '锌');
INSERT INTO Materials VALUES('东京' ,'2007-5-17', '铝');
INSERT INTO Materials VALUES('东京' ,'2007-5-20', '锌');
INSERT INTO Materials VALUES('大阪' ,'2007-4-20', '铜');
INSERT INTO Materials VALUES('大阪' ,'2007-4-22', '镍');
INSERT INTO Materials VALUES('大阪' ,'2007-4-29', '铅');
INSERT INTO Materials VALUES('名古屋', '2007-3-15', '钛');
INSERT INTO Materials VALUES('名古屋', '2007-4-01', '钢');
INSERT INTO Materials VALUES('名古屋', '2007-4-24', '钢');
INSERT INTO Materials VALUES('名古屋', '2007-5-02', '镁');
INSERT INTO Materials VALUES('名古屋', '2007-5-10', '钛');
INSERT INTO Materials VALUES('福冈' ,'2007-5-10', '锌');
INSERT INTO Materials VALUES('福冈' ,'2007-5-28', '锡');
-- 找出原料出现重复的产地
SELECT center
FROM Materials
GROUP BY center
HAVING COUNT(*) <> COUNT(DISTINCT material);
-- 另一种写法
SELECT center,CASE WHEN COUNT(*) <> COUNT(DISTINCT material) THEN '存在重复' ELSE '不存在重复' END AS status
FROM Materials
GROUP BY center;
-- EXISTS写法
SELECT center,material
FROM Materials AS M1
WHERE EXISTS (SELECT * FROM Materials AS M2 WHERE M1.center = M2.center AND M1.receive_date <> M2.receive_date AND M1.material = M2.material);
寻找缺失的编号:升级版
--寻找缺失的编号:升级版
CREATE TABLE SeqTbl
( seq INTEGER NOT NULL PRIMARY KEY);
--不存在缺失编号(起始值=1)
DELETE FROM SeqTbl;
INSERT INTO SeqTbl VALUES(1);
INSERT INTO SeqTbl VALUES(2);
INSERT INTO SeqTbl VALUES(3);
INSERT INTO SeqTbl VALUES(4);
INSERT INTO SeqTbl VALUES(5);
-- 如果有查询结果,说明存在缺失的编号
SELECT '存在缺失的编号' AS gap FROM SeqTbl HAVING COUNT(*) <> MAX(seq) --只适用于从1开始的序列
-- 如果有查询结果,说明存在缺失的编号:只调查数列的连续性
SELECT '存在缺失的编号' AS gap FROM SeqTbl HAVING COUNT(*) <> MAX(seq) - MIN(seq) + 1;
-- 不论是否存在都返回一行结果
SELECT CASE WHEN COUNT(*) = 0 THEN '空表'
WHEN COUNT(*) = MAX(seq) - MIN(seq) + 1 THEN '不存在缺失编号'
ELSE '存在缺失编号' END AS gap
FROM SeqTbl;
-- 查找最小的缺失编号
SELECT CASE WHEN COUNT(*) = 0 OR MIN(seq) > 1 THEN 1
ELSE (SELECT MIN(seq+1) FROM SeqTbl AS S1 WHERE NOT EXISTS (SELECT * FROM SeqTbl AS S2 WHERE S2.seq = S1.seq + 1)) END
FROM SeqTbl;
为集合设置详细的条件
--为集合设置详细的条件
CREATE TABLE TestResults
(student CHAR(12) NOT NULL PRIMARY KEY,
class CHAR(1) NOT NULL,
sex CHAR(1) NOT NULL,
score INTEGER NOT NULL);
INSERT INTO TestResults VALUES('001', 'A', '男', 100);
INSERT INTO TestResults VALUES('002', 'A', '女', 100);
INSERT INTO TestResults VALUES('003', 'A', '女', 49);
INSERT INTO TestResults VALUES('004', 'A', '男', 30);
INSERT INTO TestResults VALUES('005', 'B', '女', 100);
INSERT INTO TestResults VALUES('006', 'B', '男', 92);
INSERT INTO TestResults VALUES('007', 'B', '男', 80);
INSERT INTO TestResults VALUES('008', 'B', '男', 80);
INSERT INTO TestResults VALUES('009', 'B', '女', 10);
INSERT INTO TestResults VALUES('010', 'C', '男', 92);
INSERT INTO TestResults VALUES('011', 'C', '男', 80);
INSERT INTO TestResults VALUES('012', 'C', '女', 21);
INSERT INTO TestResults VALUES('013', 'D', '女', 100);
INSERT INTO TestResults VALUES('014', 'D', '女', 0);
INSERT INTO TestResults VALUES('015', 'D', '女', 0);
-- 查出75%以上的学生分数都在80分以上的班级
SELECT class
FROM TestResults
GROUP BY class
HAVING COUNT(*) * 0.75 <= SUM(CASE WHEN score >= 80 THEN 1 ELSE 0 END);
-- 查出分数在50分以上的男生比女生多的班级
SELECT class
FROM TestResults
GROUP BY class
HAVING SUM(CASE WHEN score >= 50 AND sex = '男' THEN 1 ELSE 0 END) > SUM(CASE WHEN score >= 50 AND sex = '女' THEN 1 ELSE 0 END);
-- 比较男生和女生平均分的SQL语句(2):对空集求平均值后返回NULL
SELECT class
FROM TestResults
GROUP BY class
HAVING AVG(CASE WHEN sex = '男' THEN score ELSE NULL END) < AVG(CASE WHEN sex = '女' THEN score ELSE NULL END);
小结
常用调查集合性质的条件极其用途
No | 条件表达式 | 用途 |
---|---|---|
1 | COUNT(DISTINCT col)=COUNT(col) | col列没有重复值 |
2 | COUNT(*)=COUNT(col) | col列没有空值 |
3 | COUNT(*)=MAX(col) | col列没有缺失(起始是1) |
4 | COUNT(*)=MAX(col)-MIN(col)+1 | col列是连续的编号 |
5 | MIN(col)=MAX(col) | col列是相同值或NULL |
6 | MIN(col)*MAX(col)>0 | col列全是正数或全是负数 |
7 | MIN(col)*MAX(col)<0 | col列的最大值是正数,最小值是负数 |
8 | MIN(ABS(col)) | col最少有一个0 |
9 | MIN(col-常量) = -MAX(col-常量) | col列的最大值和最小值与指定常量等距 |
- SQL指定搜索条件时,最重要的是搞清楚搜索的实体是集合还是集合的元素
- 如果一个实体对应着一行数据,那么就是元素,所以使用WHERE子句
- 如果一个实体对应着多行数据,那么就是集合,所以使用HAVING子句
- HAVING子句 可以通过聚合函数针对集合指定各种条件
- 如果通过CASE表达式生成特征函数,那么无论多么复杂的条件都可以描述
- HAVING子句很强大
练习题
/* 练习题1-10-1:单重集合与多重集合的一般化 */
CREATE TABLE Materials2
(center VARCHAR(32) NOT NULL,
receive_date DATE NOT NULL,
material VARCHAR(32) NOT NULL,
orgland VARCHAR(32) NOT NULL,
PRIMARY KEY(center, receive_date, material));
INSERT INTO Materials2 VALUES('东京', '2007-04-01', '锡', '智利');
INSERT INTO Materials2 VALUES('东京', '2007-04-12', '锌', '泰国');
INSERT INTO Materials2 VALUES('东京', '2007-05-17', '铝', '巴西');
INSERT INTO Materials2 VALUES('东京', '2007-05-20', '锌', '泰国');
INSERT INTO Materials2 VALUES('大阪', '2007-04-20', '铜', '澳大利亚');
INSERT INTO Materials2 VALUES('大阪', '2007-04-22', '镍', '南非');
INSERT INTO Materials2 VALUES('大阪', '2007-04-29', '铅', '印度');
INSERT INTO Materials2 VALUES('名古屋', '2007-03-15', '钛', '玻利维亚');
INSERT INTO Materials2 VALUES('名古屋', '2007-04-01', '钢', '智利');
INSERT INTO Materials2 VALUES('名古屋', '2007-04-24', '钢', '阿根廷');
INSERT INTO Materials2 VALUES('名古屋', '2007-05-02', '镁', '智利');
INSERT INTO Materials2 VALUES('名古屋', '2007-05-10', '钛', '泰国');
INSERT INTO Materials2 VALUES('福冈', '2007-05-10', '锌', '美国');
INSERT INTO Materials2 VALUES('福冈', '2007-05-28', '锡', '俄罗斯');
/* 练习题1-10-1:单重集合与多重集合的一般化
-- 找出产品和原产地都一样的center
SELECT center
FROM Materials2 AS M1
WHERE EXISTS (SELECT * FROM Materials2 AS M2 WHERE M1.center = M2.center AND M1.receive_date <> M2.receive_date AND M1.material = M2.material AND M1.orgland = M2.orgland )
GROUP BY center;
/* 练习题1-10-1:单重集合与多重集合的一般化
选择(材料, 原产国)组合有重复的生产地 */
SELECT center
FROM Materials2
GROUP BY center
HAVING COUNT(material || orgland) <> COUNT(DISTINCT material || orgland);
/* 练习题1-10-2:多个条件的特征函数 */
CREATE TABLE TestScores
(student_id INTEGER NOT NULL,
subject VARCHAR(16) NOT NULL,
score INTEGER NOT NULL,
PRIMARY KEY (student_id, subject));
INSERT INTO TestScores VALUES(100, '数学', 100);
INSERT INTO TestScores VALUES(100, '语文', 80);
INSERT INTO TestScores VALUES(100, '理化', 80);
INSERT INTO TestScores VALUES(200, '数学', 80);
INSERT INTO TestScores VALUES(200, '语文', 95);
INSERT INTO TestScores VALUES(300, '数学', 40);
INSERT INTO TestScores VALUES(300, '语文', 50);
INSERT INTO TestScores VALUES(300, '社会', 55);
INSERT INTO TestScores VALUES(400, '数学', 80);
-- 找出数学分数在80分以上,且语文分数在50分以上的学生
SELECT student_id
FROM TestScores
WHERE subject IN ('语文','数学')
GROUP BY student_id
HAVING SUM(CASE WHEN subject = '数学' AND score > 80 THEN 1
WHEN subject = '语文' AND score > 50 THEN 1
ELSE 0 END)=2;
SQL进阶系列之10HAVING子句又回来了的更多相关文章
- SQL进阶系列之4HAVING字句的力量
写在前面 SQL是面向集合的语言,与面向过程和面向对象语言都不一样 寻找缺失的编号 /* 寻找缺失的编号 */ CREATE TABLE SeqTbl (seq INTEGER PRIMARY KEY ...
- SQL进阶系列之7用SQL进行集合运算
写在前面 集合论是SQL语言的根基,因为这种特性,SQL也被称为面向集合语言 导入篇:集合运算的几个注意事项 注意事项1:SQL能操作具有重复行的集合(multiset.bag),可以通过可选项ALL ...
- SQL进阶系列之12SQL编程方法
写在前面 KISS -- keep it sweet and simple 表的设计 注意命名的意义 英文字母 + 阿拉伯数字 + 下划线"_" 属性和列 编程的方针 写注释 注意 ...
- SQL进阶系列之11让SQL飞起来
写在前面 SQL的性能优化是数据库使用者必须面对的重要问题,本节侧重SQL写法上的优化,SQL的性能同时还受到具体数据库的功能特点影响,这些不在本节讨论范围之内 使用高效的查询 参数是子查询时,使用E ...
- SQL进阶系列之8EXISTS谓词的用法
写在前面 支撑SQL和关系数据库的基础理论:数学领域的集合论和逻辑学标准体系的谓词逻辑 理论篇 什么是谓词?谓词是返回值为真值(true false unknown)的函数 关系数据库里,每一个行数据 ...
- SQL进阶系列之6用关联子查询比较行与行
写在前面 使用SQL对同一行数据进行列间的比较很简单,只需要在WHERE子句里写上比较条件就可以了,对于不同行数据进行列间比较需要使用自关联子查询. 增长.减少.维持现状 需要用到行间比较的经典场景是 ...
- SQL进阶系列之5外连接的用法
写在前面 SQL本身是作为一种数据提取工具而出现,使用SQL生成各种定制化报表和非定制化报表并非SQL原本用途的功能,但这并不意味着SQL无法实现这些功能. 用外连接进行行列转换(1)(行 → 列): ...
- SQL进阶系列之3三值逻辑与NULL
写在前面 普通编程语言里的布尔型只有true和false两个值,这种逻辑体系被称为二值逻辑,而SQL语言里,还有第三个值unknown,因此SQL的逻辑体系被称为三值逻辑. Why SQL存在三值逻辑 ...
- SQL进阶系列之0窗口函数
窗口函数 What's 窗口函数? 窗口函数也称为OLAP(OnLine Analytical Processing)函数,目前MySQL还不支持. 窗口函数的语法 <窗口函数> OVER ...
随机推荐
- LwIP应用开发笔记之六:LwIP无操作系统TCP客户端
上一篇我们基于LwIP协议栈的RAW API实现了一个TCP服务器的简单应用,接下来一节我们来实现一个TCP客户端的简单应用. 1.TCP简述 TCP(Transmission Control Pro ...
- GPRS 智能门禁控制器
本模块居于GPRS 2G网络,信号覆盖广,而且好. 主要用于微信门禁等,提供用户服务端搭建及相关接口. 您可以向门禁发送开门信号,并提醒开门成功的信号反馈. 同时支持发送开门ID号,并反馈成功ID号
- Prometheus监控教程——从入门到放弃
Prometheus的安装还是比较简单的 下载地址如下 https://prometheus.io/download/ 解压,修改配置,运行.默认监听9090端口 [root@localhost ~] ...
- shell中 >/dev/null 2>&1是什么意思
原文地址:http://juke.outofmemory.cn/entry/295292 我们经常能在 shell 脚本中发现 >/dev/null 2>&1 这样的语句.以前的我 ...
- linux用户态和内核态理解
1.特权级 Intel x86架构的cpu一共有0-4四个特权级,0级最高,3级最低,硬件上在执行每条指令时都会对指令所具有的特权级做相应的检查.硬件已经提供了一套特权级使用的相关机制 ...
- Qt休眠
QTest::qSleep(250); //unresponsive QTest::qWait(250); //stay responsive QThread::usleep(100); //mill ...
- noi openjudge 1768:最大子矩阵
链接:http://noi.openjudge.cn/ch0406/1768/ 描述已知矩阵的大小定义为矩阵中所有元素的和.给定一个矩阵,你的任务是找到最大的非空(大小至少是1 * 1)子矩阵. 比如 ...
- 【剑指offer】链表中的倒数第k个结点
输入一个链表,输出该链表中倒数第k个结点. 分析: 定义两个结点p1和p2都指向头节点,p1先走k-1步,然后p1和p2一起走,当p1走到链表尾部时,p2指向的结点就是倒数第k个结点 遍历一遍链表即可 ...
- Java多线程编程(3)--线程安全性
一.线程安全性 一般而言,如果一个类在单线程环境下能够运作正常,并且在多线程环境下,在其使用方不必为其做任何改变的情况下也能运作正常,那么我们就称其是线程安全的.反之,如果一个类在单线程环境下运作 ...
- leetcode的Hot100系列--347. 前 K 个高频元素--hash表+直接选择排序
这个看着应该是使用堆排序,但我图了一个简单,所以就简单hash表加选择排序来做了. 使用结构体: typedef struct node { struct node *pNext; int value ...