T-SQL基础(四)之集合运算
三个运算符
T-SQL支持三个集合运算符:UNION、INTERSECT、EXCEPT。
集合运算符查询的一般形式如下:
Query1
<set_operator>
Query2
-- 这里,ORDER BY子句对最终结果集进行排序
[ORDER BY...]
ORDER BY
在逻辑查询处理方面,集合运算符应用于两个查询结果集,且外部的ORDER BY
子句(如果有的话)应用于集合运算所得到的结果集。
每个独立的查询可以使用除了ORDER BY
之外的所有逻辑查询处理阶段,原因如下:
ORDER BY
会对查询结果集进行排序排序后的结果集不在表示一个集合而是游标
集合运算符只能用于集合间运算
因此,每个独立的查询语句中不能使用ORDER BY
子句。
其它查询逻辑
对集合运算结果集使用除ORDER BY
之外的查询逻辑则易引发逻辑错误:
USE WJChi;
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION ALL
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
WHERE Age>26;
-- 上述写法等价于(注意WHERE条件)
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION ALL
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
WHERE U2.Age>26;
可以借助表表达式对集合运算符运算结果集使用ORDER BY
之外的查询逻辑:
USE WJChi;
SELECT * FROM
(
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION ALL
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
) AS T
WHERE T.Age>26;
上述查询也可使用派生表之外的表表达式,如:CTE。
集合的列
用于集合运算符的两个查询必须返回相同列数且对应列数据类型相互兼容的结果集。在进行比较运算时,集合运算符会认为两个NULL值是相等的。
集合运算符返回结果集中的列名是第一个查询中的列名:
USE WJChi;
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
ORDER BY Age
返回结果如下:
UNION
UNION
用于获取两个集合的并集。
UNION
运算符有两种形式:UNION
、UNION ALL
:
UNION
USE WJChi;
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
ORDER BY Age
返回结果如下:
UNION ALL
USE WJChi;
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
UNION ALL
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
ORDER BY Age
返回结果如下:
从上面两个结果集中可以看到,UNION
与UNION ALL
的区别是:UNION
会去除结果集中的重复元素,而UNION ALL
不会,从性能上来讲,UNION ALL
优于UNION
。严格来讲,UNION ALL
运算结果集不能称为集合,因为集合不存在重复元素。
INTERSECT
INTERSECT
用于获取两个集合的交集,分为:INTERSECT
和INTERSECT ALL
两种形式,二者区别同UNION
运算符。
INTERSECT
可以使用内联接或者EXSITS
谓词来替代INTERSECT
,但在比较运算时,INTERSECT
将两个NULL值视为相等,而替代方案不会。
INTERSECT
只关注行的内容是否相同,不关注行出现的次数:
USE WJChi;
SELECT Name AS 姓名,Age FROM dbo.UserInfo AS U1
INTERSECT
SELECT Name,Age AS 年龄 FROM dbo.UserInfo AS U2
ORDER BY Age;
INTERSECT ALL
SQL标准中包含INTERSECT ALL
,但在SQL Server2014中未实现该特性,在SQL Server2014中使用INTERSECT ALL
会报错:
不支持 INTERSECT 运算符的 'ALL' 版本。
UNION ALL
中ALL
的含义是返回所有重复行。与之类似,INTERSECT ALL
中ALL
的含义是不删除交集中的重复项。换个角度看,INTERSECT ALL
不仅关心两侧存在的行,还关心每一侧行出现的次数,即:
如果某一数据在第一个输入中出现了a次,在第二个输入中出现了b次,那么在运算结果中该行出现min(a,b)次。
下面,我们借助开窗函数ROW_NUMBER()
实现了INTERSECT ALL
的效果:
USE WJChi;
SELECT
ROW_NUMBER() OVER(PARTITION BY Name,Age ORDER BY Age) AS RowNumber,
Name,Age
FROM dbo.UserInfo;
经过开窗函数ROW_NUMBER()
的处理后,原本相同的数据被视为不同。
USE WJChi;
-- 实现INTERSECT ALL效果
SELECT T.Name,T.Age FROM
(
SELECT
ROW_NUMBER() OVER(PARTITION BY Name,Age ORDER BY Age) AS RowNumber,
Name,Age
FROM dbo.UserInfo INTERSECT SELECT
ROW_NUMBER() OVER(PARTITION BY Name,Age ORDER BY Age) AS RowNumber,
Name,Age
FROM dbo.UserInfo
) AS T
ORDER BY T.Age;
查询结果如下:
EXCEPT
EXCEPT
用于获取两个集合的差集,与UNION
与INTERSECT
类似,EXCEPT
也分为两种形式:EXCEPT
和EXCEPT ALL
。同样,SQL Server2014也不支持EXCEPT ALL
特性。
Query1
EXCEPT
Query2
EXCEPT
与UNION
、INTERSECT
不同,EXCEPT
运算符对于两个查询的先后顺序有要求:EXCEPT
返回存在于Query1中出现且不在Query2中出现的行,EXCEPT
只关注行是否重复,而不关注行出现的次数。
可以使用外联接或者NOT EXISTS
来替代EXCEPT
,但在比较运算时,EXCEPT
将两个NULL值视为相等,而替代方案不会。
准备如下数据:
USE WJChi;
SELECT Name,Age FROM #temp;
SELECT Name,Age FROM dbo.UserInfo;
那么,下面两条SQL的运算结果集均不包含任何数据:
SELECT Name ,Age FROM #temp
EXCEPT
SELECT Name,Age FROM dbo.UserInfo
ORDER BY Age;
SELECT Name ,Age FROM dbo.UserInfo
EXCEPT
SELECT Name,Age FROM #temp
ORDER BY Age;
EXCEPT ALL
EXCEPT ALL
与EXCEPT
的差异在于,EXCEPT ALL
不止考虑行是否重复,还会考虑行出现的次数:
如果某一数据在第一个输入中出现了a次,在第二个输入中出现了b次,那么在运算结果中该行出现a-b次。若a<b则运算结果中不包含该行。
同样,我们借助开窗函数ROW_NUMBER()
来实现EXCEPT ALL
效果:
USE WJChi;
SELECT
T.Name,T.Age
FROM
(
SELECT
ROW_NUMBER() OVER(PARTITION BY Name,Age ORDER BY Age) AS RowNumber,
Name,Age
FROM #temp EXCEPT SELECT
ROW_NUMBER() OVER(PARTITION BY Name,Age ORDER BY Age) AS RowNumber,
Name,Age
FROM dbo.UserInfo
) AS T
ORDER BY T.Age;
小结
标准SQL支持三个集合运算符:UNION
、INTERSECT
、EXCEPT
,每个运算符均支持两种行为:去重(不带ALL关键字)和保留重复项(带上ALL关键字)。
T-SQL未提供对INTERSECT ALL
与EXCEPT ALL
的支持,我们可以通过开窗函数ROW_NUMBER()
来实现。
另外需要注意一点,集合运算符认为两个NULL
是相等的。
推荐阅读
T-SQL基础(四)之集合运算的更多相关文章
- SQL基础学习_06_集合运算和联结
集合运算 1. 并集:UNION 例: SELECT shohin_id, shohin_mei FROM Shohin UNION SELECT shohin_id ...
- SQL基础--查询之四--集合查询
SQL基础--查询之四--集合查询
- SQL Server中的集合运算: UNION, EXCEPT和INTERSECT
SQL Server中的集合运算包括UNION(合并),EXCEPT(差集)和INTERSECT(相交)三种. 集合运算的基本使用 1.UNION(合并两个查询结果集,隐式DINSTINCT,删除重复 ...
- SQL基础四(例子)
------------------------------------------------ --分别创建student/course/score表 Create table student ( ...
- 详解SQL集合运算
以前总是追求新东西,发现基础才是最重要的,今年主要的目标是精通SQL查询和SQL性能优化. 本系列[T-SQL基础]主要是针对T-SQL基础的总结. [T-SQL基础]01.单表查询-几道sql查询题 ...
- SQL Server温故系列(4):SQL 查询之集合运算 & 聚合函数
1.集合运算 1.1.并集运算 UNION 1.2.差集运算 EXCEPT 1.3.交集运算 INTERSECT 1.4.集合运算小结 2.聚合函数 2.1.求行数函数 COUNT 2.2.求和函数 ...
- 集合运算 & 聚合函数
SQL 查询之集合运算 & 聚合函数 1.集合运算 1.1.并集运算 UNION 1.2.差集运算 EXCEPT 1.3.交集运算 INTERSECT 1.4.集合运算小结 2.聚合函数 ...
- [SQL] SQL 基础知识梳理(七)- 集合运算
SQL 基础知识梳理(七)- 集合运算 目录 表的加减法 联结(以列为单位) 一.表的加减法 1.集合:记录的集合(表.视图和查询的执行结果). 2.UNION(并集):表的加法 -- DDL:创建表 ...
- SQL基础教程(第2版)第7章 集合运算:7-2 联结(以列为单位对表进行联结)
第7章 集合运算:7-2 联结(以列为单位对表进行联结) ■联结的特定语法和过时语法 ● 联结( JOIN)就是将其他表中的列添加过来,进行“添加列”的集合运算.UNION是以行(纵向)为单位进行操作 ...
随机推荐
- HTML5元素标记释义
HTML5元素标记释义 标记 类型 意义 介绍 文件标记 <html> ● 根文件标记 让浏览器知道这是HTML 文件 META标记 <head> ● 开头 提供文件整体信息 ...
- TFIDF<细读>
概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术.TF-IDF是一种统计方法,用以评估一字词对于一个文 ...
- Jenkins获取运行job的用户名
1. Jenkins获取运行job的用户名 需要安装user build vars plugin 插件,然后就可以取到$BUILD_USER_ID变量. user build vars plugin下 ...
- 打开Python IDLE时的错误:Subprocess Startup Error
比较常见的是这个 方法1: 修改[Python目录]\Lib\idlelib\PyShell.py文件,在1300行附近,将def main():函数下面 use_subprocess = True ...
- eclipse对于标签的配置不会出现自动提示的解决
解决办法:引入 mybatis-3-config.dtd 文件Window-preferences-搜索 xml-xml catalog在 User Specified Entries 目录下 add ...
- Oracle实战笔记(第一天)
导读 笔记内容来自韩顺平老师的视频<玩转Oracle实战教程>,可以结合笔记进行观看.第一天视频中还有Oracle的介绍和安装等内容,很容易搜索到,这里就不再进行总结. 目录 1.命令行工 ...
- JavaScript笔记整理
整理一篇工作中的JavaScript脚本笔记,不定时更新,笔记来自网上资料或者自己经验归纳. (1) 获取Url绝对路径 function getUrlRelativePath() { var url ...
- Scala - 快速学习03 - 基础语法
1- 变量 变量 mutable variable 在程序运行过程中其值可能发生改变的量 关键词var定义变量,定义时直接进行求值 常量 immutable variable 在程序运行过程中其值不会 ...
- python函数学习1
函数1 (1)定义: def 函数名(参数列表) 函数体 (2)参数传递: 在python中,一切都是对象,类型也属于对象,变量是没有类型的. a = [1,2,3] a = "hellow ...
- 基于python的OpenCV图像1
目录 1. 读入图片并显示 import cv2 img = cv2.imread("longmao.jpg") cv2.imshow("longmao", i ...