SQL进阶系列之2自连接

写在前面

一般地，SQL的连接运算根据其特征的不同，有着不同的名称，比如内连接、外连接、交叉连接等，这些连接大多是以不同的表或视图为对象进行的，针对相同的表进行的连接成为自连接。理解自连接有助于我们理解SQL面向集合的语言特性。

可重排列、排列、组合

CREATE TABLE Products

(name VARCHAR(16) PRIMARY KEY,

 price INTEGER NOT NULL);

--可重排列·排列·组合

INSERT INTO Products VALUES('苹果',	50);

INSERT INTO Products VALUES('橘子',	100);

INSERT INTO Products VALUES('香蕉',	80);

--排序

DELETE FROM Products;

INSERT INTO Products VALUES('苹果',	50);

INSERT INTO Products VALUES('橘子',	100);

INSERT INTO Products VALUES('葡萄',	50);

INSERT INTO Products VALUES('西瓜',	80);

INSERT INTO Products VALUES('柠檬',	30);

INSERT INTO Products VALUES('香蕉',	50);

--不聚合，查看集合的包含关系

DELETE FROM Products;

INSERT INTO Products VALUES('橘子',	100);

INSERT INTO Products VALUES('葡萄',	50);

INSERT INTO Products VALUES('西瓜',	80);

INSERT INTO Products VALUES('柠檬',	30);

-- 可重排列(3*3种结果)

SELECT P1.name AS name_1,P2.name AS name_2 FROM Products P1,Products P2;

-- 排列($P_3^2$种结果)

SELECT P1.name AS name_1,P2.name AS name_2 FROM Products P1,Products P2 WHERE P1.name <> P2.name;

-- 组合($C_3^2$种结果)

SELECT P1.name AS name_1,P2.name AS name_2 FROM Products P1,Products P2 WHERE P1.name > P2.name;

-- 组合 非等值自连接

SELECT P1.name AS name_1,P2.name AS name_2,P3.name AS name_3 FROM Products P1,Products P2,Products P3 WHERE P1.name > P2.name AND P2.name > P3.name;

删除重复行

-- 用于删除重复行的SQL语句(1)：使用极值函数(仅支持Oracle)

DELETE FROM Products P1 WHERE rowid < (SELECT MAX(P2.rowid) FROM Product P2 WHERE P1.name = P2.name AND P1.price = P2.price)

-- 用于删除重复行的SQL语句(1)：使用非等值连接

DELETE FROM Products P1 WHERE EXISTS (SELECT * FROM Products P2 WHERE P1.name = P2.name AND P1.price = P2.price AND P1.rowid < P2.rowid)

查找局部不一致的列

--查找局部不一致的列

CREATE TABLE Addresses

(name VARCHAR(32),

 family_id INTEGER,

 address VARCHAR(32),

 PRIMARY KEY(name, family_id));

INSERT INTO Addresses VALUES('前田义明', '100', '东京都港区虎之门3-2-29');

INSERT INTO Addresses VALUES('前田由美', '100', '东京都港区虎之门3-2-92');

INSERT INTO Addresses VALUES('加藤茶',   '200', '东京都新宿区西新宿2-8-1');

INSERT INTO Addresses VALUES('加藤胜',   '200', '东京都新宿区西新宿2-8-1');

INSERT INTO Addresses VALUES('福尔摩斯',  '300', '贝克街221B');

INSERT INTO Addresses VALUES('华生',  '400', '贝克街221B');

SELECT DISTINCT A1.name,A2.name FROM Addresses A1,Addresses A2 WHERE A1.family_id = A2.family_id AND A1.address <> A2.address;

DELETE FROM Products;

INSERT INTO Products VALUES('苹果',	50);

INSERT INTO Products VALUES('橘子',	100);

INSERT INTO Products VALUES('葡萄',	50);

INSERT INTO Products VALUES('西瓜',	80);

INSERT INTO Products VALUES('柠檬',	30);

INSERT INTO Products VALUES('草莓',	100);

INSERT INTO Products VALUES('香蕉',	100);

-- 用于查找价格相同但商品名称不同的记录的SQL语句

SELECT DISTINCT P1.name,P1.price FROM Products P1,Products P2 WHERE P1.price = P2.price AND P1.name <> P2.name;

排序

-- 窗口函数（OLAP函数/分析函数）依赖特定数据库的实现

SELECT name,price,

	   RANK() OVER (ORDER BY price DESC) AS rank_1, -- 跳过并列

	   DENSE_RANK() OVER (ORDER BY price DESC) AS rank_2 --不跳过并列

FROM Products;

SELECT P1.name,P1.price,

(SELECT COUNT(P2.price)

 FROM Products P2 WHERE P1.price < P2.price) + 1 AS rank_1

 FROM Products P1 ORDER BY rank_1;

-- 添加DISTINCT，类似于DENSE_RANK函数

SELECT P1.name,P1.price,

(SELECT COUNT(DISTINCT P2.price)

 FROM Products P2 WHERE P1.price <  P2.price) + 1 AS rank_1

 FROM Products P1 ORDER BY rank_1;

-- 排序 使用自连接

SELECT P1.name,MAX(P1.price) AS price,COUNT(P2.price)+1 AS rank_1 FROM Products AS P1

LEFT JOIN Products AS P2 ON P1.price < P2.price GROUP BY P1.name ORDER BY rank_1;

-- 不聚合，查看结合的包含关系

SELECT P1.name,P2.name FROM Products AS P1

LEFT JOIN Products AS P2 ON P1.price < P2.price;

-- 如果这里不是用LEFT JOIN而使用INNER JOIN?

小结

自连接经常和非等值连接结合起来使用
自连接和GROUP BY结合使用可以生成递归集合
将自连接看做不同表直接的连接更容易理解
应把表看做行的集合，用面向集合的方法来思考
自连接的性能开销更大，应尽量给用于连接的列建立索引

练习题

-- 练习题 1-2-1 可重组合

-- 可重组合

SELECT P1.name,P2.name FROM Products AS P1,Products AS P2 WHERE P1.name >= P2.name;

-- 练习题 1-2-2 分地区排序

-- 方法一 窗口函数

SELECT  district,name,price,RANK () OVER (PARTITION BY district ORDER BY price DESC)

FROM DistrictProducts;

-- 自连接(关联子查询)

SELECT DP1.district,DP1.name,DP1.price,(SELECT COUNT(DP2.price)+1 FROM DistrictProducts DP2 WHERE DP1.district = DP2.district AND DP1.price < DP2.price) AS rank_1

FROM DistrictProducts DP1;

-- 更新位次

/* 练习题1-2-3：自连接 */

SELECT P1.district, P1.name,

       MAX(P1.price) AS price,

       COUNT(P2.name) +1 AS rank_1

  FROM DistrictProducts P1 LEFT OUTER JOIN DistrictProducts P2

    ON  P1.district = P2.district

   AND P1.price < P2.price

 GROUP BY P1.district, P1.name;

SQL进阶系列之2自连接的更多相关文章

SQL进阶系列之9用SQL处理数列
写在前面关系模型的数据结构里,并没有顺序的概念,但SQL处理有序集合也有坚实的理论基础生成连续编号 --生成连续编号 CREATE TABLE Digits (digit INTEGER PRIM ...
SQL进阶系列之7用SQL进行集合运算
写在前面集合论是SQL语言的根基,因为这种特性,SQL也被称为面向集合语言导入篇:集合运算的几个注意事项注意事项1:SQL能操作具有重复行的集合(multiset.bag),可以通过可选项ALL ...
SQL进阶系列之6用关联子查询比较行与行
写在前面使用SQL对同一行数据进行列间的比较很简单,只需要在WHERE子句里写上比较条件就可以了,对于不同行数据进行列间比较需要使用自关联子查询. 增长.减少.维持现状需要用到行间比较的经典场景是 ...
SQL进阶系列之4HAVING字句的力量
写在前面 SQL是面向集合的语言,与面向过程和面向对象语言都不一样寻找缺失的编号 /* 寻找缺失的编号 */ CREATE TABLE SeqTbl (seq INTEGER PRIMARY KEY ...
Linq To Sql进阶系列（六）用object的动态查询与保存log篇
动态的生成sql语句,根据不同的条件构造不同的where字句,是拼接sql 字符串的好处.而Linq的推出,是为了弥补编程中的 Data != Object 的问题.我们又该如何实现用object的动 ...
SQL进阶系列之12SQL编程方法
写在前面 KISS -- keep it sweet and simple 表的设计注意命名的意义英文字母 + 阿拉伯数字 + 下划线"_" 属性和列编程的方针写注释注意 ...
SQL进阶系列之10HAVING子句又回来了
写在前面 HAVING子句的处理对象是集合而不是记录各队,全队点名 --各队,全体点名! CREATE TABLE Teams (member CHAR(12) NOT NULL PRIMARY K ...
SQL进阶系列之11让SQL飞起来
写在前面 SQL的性能优化是数据库使用者必须面对的重要问题,本节侧重SQL写法上的优化,SQL的性能同时还受到具体数据库的功能特点影响,这些不在本节讨论范围之内使用高效的查询参数是子查询时,使用E ...
SQL进阶系列之8EXISTS谓词的用法
写在前面支撑SQL和关系数据库的基础理论:数学领域的集合论和逻辑学标准体系的谓词逻辑理论篇什么是谓词?谓词是返回值为真值(true false unknown)的函数关系数据库里,每一个行数据 ...

随机推荐

[LeetCode] 689. Maximum Sum of 3 Non-Overlapping Subarrays 三个非重叠子数组的最大和
In a given array nums of positive integers, find three non-overlapping subarrays with maximum sum. E ...
[编程开发]STB image读取学习
为了便于学习图像处理并研究图像算法, 俺写了一个适合初学者学习的小小框架. 麻雀虽小五脏俱全. 采用的加解码库:stb_image 官方:http://nothings.org/ stb_image. ...
乐橙平台大华监控Android端实时预览播放
一.初始化首先我们需要到乐橙开放平台下载android对应的开发包,将sdk中提供的jar和so文件添加到项目中: 二.获取监控列表监控列表我们是通过从自家后台服务器中获取的,这个自己根据需要调整 ...
Navicat 8 For Mysql 数据库的导出与加载
方便断断续续的数据库实验课,避免每次都要重新写入数据,可使用Navicat的数据库导出功能数据库的导出 1.选择要导出的数据库,右键点击“转存SQL文件”选项. 2.填写文件名字,选择位置,点击“保 ...
常见的几种异常类型 Exception
常见异常类型:Java中的异常分为两大类: 1.Checked Exception(非Runtime Exception) 2.Unchecked Exception(Runtime Exceptio ...
ContainsExtensions不分区大小写
public static class ContainsExtensions { public static bool Contains(this string source, string valu ...
Shell编程学习记录
一.shell中单引号和双引号的区别: 1).单引号属于强引用,它会忽略所有被引起来的字符的特殊处理,被引用起来的字符会被原封不动的使用,唯一需要注意的点是不允许引用自身: 2).双引号属于弱引用, ...
day35——生产者消费者模型、线程
day35 进程:生产者消费者模型编程思想,模型,设计模式,理论等等,都是交给你一种编程的方法,以后你遇到类似的情况,套用即可生产者消费者模型的三要素生产者:产生数据的消费者:接收数据做进一步 ...
测试PHP-FPM的工作流中的疑惑点
顺序比较乱,想到什么测试什么,测试环境 PHP7.2 和 MariaDB10.3.11 PHP-FPM是 master/worker 多进程模型master负责和web-server通讯,把接受到请求 ...
java之hibernate之session中对象的生命周期
1. session是用来执行对象的crud操作,并且session是对象事务工厂.session是线程级别的,所以生命周期比较短. 2.session中对象的生命周期图: 3.session中对象的 ...

SQL进阶系列之2自连接

写在前面

可重排列、排列、组合

删除重复行

查找局部不一致的列

排序

小结

练习题

SQL进阶系列之2自连接的更多相关文章

随机推荐

热门专题