Join 和 apply 用法
在关系型数据库系统中,为了满足第三范式(3NF),需要将满足“传递依赖”的表分离成单独的表,通过Join 子句将相关表进行连接,Join子句共有三种类型:外连接,内连接,交叉连接;外连接分为:left join、right join、full join;内链接是:inner join,交叉连接是:cross join。
一,Join子句的组成
Join子句由连接表,连接类型和On子句组成,伪代码如下:
from Left_Table
[inner|left|right|full] join Right_Table
[on condition]
1,根据位置,将参与Join的两个表分为左表和右表
- 在Join子句中,左表和右表进行笛卡尔集合运算,左表中的任意一行都和右表中的所有行进行“组合”,生成虚拟表(Virtual Table),虚拟表的数据行总数Rows(VT)=Rows(left_table)*Rows(right_table);
- 左表和右表进行Join操作,没有先后顺序,这点和Apply子句不同,Apply子句的左表先于右表执行运算;
2,连接类型
在外连接中,left,right和full关键字标识Join子句的"保留表":在进行外连接查询时,保留表中的数据全部返回,不会被on子句过滤。
3,On子句,用于都虚拟表进行过滤
在on子句表达式中,常用的运算符是相等(=),也可以使用不等(>,<>),like等运算符,返回的结果是布尔值;
on子句表达式的操作数,可以是表列(Column),常量,表达式,例如;
- on left_table.column=right_table.column
- on left_table.column=value
- on left_table.column+xx=value
- 不过滤:比如设置on 1=1
4,On子句决定Join的顺序
如果一个查询包含多个Join子句,那么On子句决定Join子句执行的顺序;执行Join的顺序是:tb和tc先执行连接操作,ta和tb后执行连接操作。
from ta
left join tb
left join tc
on tb.column=tc.column
on ta.column=tb.column
5,On子句过滤和Where子句过滤
On子句的执行顺序先于where子句,在进行过滤时,On子句无法过滤保留表,但是where子句能够过滤保留表;
对于inner join,由于没有保留表,所以,在On子句和where子句中进行过滤,结果是一样的,但是,建议明确区分where子句和on子句的职能,on子句用于过滤连接的虚拟表,where用于对最终的结果集进行过滤。
例如:在On子句中,ta.column2=value1 不会过滤左表ta,如果不满足该条件,那么右表相应的数据列设置为NULL,left关键字保证左表中的所有数据行都返回;where子句(ta.column3=value2)过滤左表ta;
from ta
left join tb
on ta.column1=ta.column1
and ta.column2=value1
where ta.column3=value2
二,创建测试代码
create table dbo.ta
(
a int not null,
b int not null
)
go
create table dbo.tb
(
ca int not null,
cb int not null
)
go insert into dbo.ta(a,b)
values(1,1),(2,1)
go insert into dbo.tb(ca,cb)
values(1,1),(3,1)
go
三,left join(左外连接)
1,left join算法
把左表作为保留表,返回左表的全部数据,对于右表中不匹配on子句条件数据行,返回NULL;
select *
from dbo.ta a
left join dbo.tb b
on a.a=b.ca
2,使用常量过滤左表
在左外连接中,左表会返回所有数据,对于“and left_table.column=value”,是在第一个条件成立时,对返回的结果进行过滤,而左表数据会全部返回,当不满足条件时,设置右表数据为NULL;
select *
from dbo.ta a
left join dbo.tb b
on a.a=b.ca and a.a=1
3,使用where子句过滤左表
where子句是对结果集进行过滤的最后一个Filter
select *
from dbo.ta a
left join dbo.tb b
on a.a=b.ca
where a.a=1
4,使用where子句过滤右表
如果使用where子句对右表进行过滤,一般可以转换成inner join
select *
from dbo.ta a
left join dbo.tb b
on a.a=b.ca
where b.ca=1
四,right join(右外连接)
right join 算法是把右表作为保留表,将右表中的数据全部显示出来,对于左表中匹配不到的数据行,将其字段值设置为NULL;
select *
from dbo.ta a
right join dbo.tb b
on a.a=b.ca
五,inner join(内连接)
算法是:inner join没有保留表,只返回满足 on 子句条件的数据行,对于不满足on子句条件的数据行,不返回
select *
from dbo.ta a
inner join dbo.tb b
on a.a=b.ca
六,full join(全连接)
算法是:full join 把左表和右表都作为保留表,如果左表和右表中的数据行满足On子句条件,那么显示数据行数据,如果不匹配,则相应的字段设置为null。
select *
from dbo.ta a
full join dbo.tb b
on a.a=b.ca
七,cross join(交叉连接)
算法是:cross join 是对左表和游标进行笛卡尔乘积,cross join没有on子句,笛卡尔乘积是将左表中的任意一行数据和右表中的所有数据行进行组合,cross join 将笛卡尔乘积后的结果直接显示出来
select *
from dbo.ta a
cross join dbo.tb b
八,自连接用于累积求和
自连接是指一个table 和自己进行join,例如以下语句,表 dbo.ta和自身进行inner join,计算b字段的累积和。
select t1.a,sum(t2.b) as b
from dbo.ta t1
inner join dbo.ta as t2
on t1.a>=t2.a
group by t1.a
在实际的产品环境中,经常利用自联结进行累加求和的计算,例如有如下一个Table:dbo.FinanceMonth,每个月的产量是Quantity,计算一年内到该月份为止的所有月份的Quantity的累积值。
create table dbo.FinanceMonth
(
MonthNum int not null,
quantity int not null
)
go
;with cte as
(
select 1 as MonthNum,
100 as quantity
union all
select MonthNum+1,quantity+100
from cte
where MonthNum<12
)
insert into dbo.FinanceMonth
select MonthNum, quantity
from cte
使用自链接计算累积值
select a.MonthNum,sum(b.quantity) as TotalQuantity
from dbo.FinanceMonth a
inner join dbo.FinanceMonth b
on a.MonthNum>=b.MonthNum
group by a.MonthNum
order by a.MonthNum
九,apply 用法
1,join和apply的区别
join 子句左表和右表的计算是不分先后的,从性能上考虑,最好把小表作为左表,当右表数据量大的时候,会减少查询的时间消耗。apply子句的左表和右表是区分先后顺序的,apply是先计算左表,后计算右表,因此apply子句不是集合操作语句。如果右表是一个表值函数,apply会先取得左表中的一行记录的值,作为参数值传递给表值函数进行计算,左表中的一行记录和“右表”进行笛卡尔乘积做为最终结果。如果右表查询出来的结果是空的,那么右表字段设置为null。
select *
from dbo.ta a
outer apply (
select *
from dbo.tb b
where a.a=b.ca) p
从查询结果上看,跟left join是相同的,但是在性能上,outer apply 比left join要差,因为TSQL 擅长集合操作,使用集合的思想编写的代码性能一般都很高,left join是集合操作语句,性能优于outer apply
虽然apply性能低,但是也有其用武之地,当需要按照顺序进行连接时,apply是最好的选择。
2,apply的两种用法
outer apply 和cross apply的相同点是:
- 先计算左表,后计算右表;
- 对左表中的每一行记录,右表都要“逐行”计算,类似于相关子查询,实际上,TSQL对apply进行优化之后,并不是逐行,而是逐N行;
outer apply 和cross apply的不同点是:
- outer apply:将左表作为保留表,如果右表没有匹配行,那么右表中的字段会设置为null,类似于left join。
- cross apply:没有保留表,对于左表中的一行记录,如果右表中没有匹配行,那么该行记录不显示在最终结果集中,类似于inner join。
select *
from dbo.ta a
cross apply (
select *
from dbo.tb b
where a.a=b.ca) p
十,join语句的应用
1,使用cross join能够快速产生大量顺序数字
cross join的结果集中数据行的数量是:左表数据行数和右表数据行数的乘积,由于每个table都有10个数字(从0到9),4个table进行cross join能够快速产生10的4次方,即10000个顺序数字。
;with num as
(
select n
from(values(0),(1),(2),(3),(4),(5),(6),(7),(8),(9)) as p(n)
)
select a.n+b.n*10+c.n*100+d.n*1000 as n
--into dbo.num
from num a
cross join num b
cross join num c
cross join num d
order by n
2,使用left join 查询不存在于右表的数据行
如果左表中的数据不存于右表,那么右表的字段是null,通过在 where 子句中设置filter,能够查询出存在于左表,但是不存在于右表的数据行
select *
from dbo.ta t1
left join dbo.tb t2
on t1.a=t2.ca
where t2.ca is null;
Join 和 apply 用法的更多相关文章
- Join 和 Apply 用法全解
在关系型数据库系统中,为了满足第三范式(3NF),需要将满足“传递依赖”的表分离成单独的表,通过Join 子句将相关表进行连接,Join子句共有三种类型:外连接,内连接,交叉连接:外连接分为:left ...
- SQL中order by;group up;like;关联查询join on的用法
排序order by的用法: 1.order by 字段名1 asc/desc, 字段名2 asc/desc,... 先按照字段名1的升序/降续给表进行排列 然后 按照字段名2的升序/降续给表进行排列 ...
- python join()阻塞的用法
join()阻塞的用法,用来检测线程有没有完全执行完毕 #!/usr/bin/env python#-*- coding:utf-8 -*-import threadingimport time de ...
- python中的filter、map、reduce、apply用法
1. filter 功能: filter的功能是过滤掉序列中不符合函数条件的元素,当序列中要删减的元素可以用某些函数描述时,就应该想起filter函数. 调用: filter(function,seq ...
- mysql union 和 left join 结合查询用法
union 和 left join 结合查询用法 SELECT u.nickname,z.group_comming_type,z.id,z.user_id,z.title,z.create_time ...
- SQL JOIN 和 UNION 用法
1 SELECT Persons.LastName, Persons.FirstName, Orders.OrderNo FROM Persons, Orders WHERE Persons.Id_P ...
- 连接、关联、JOIN、APPLY(SQL Server)
连接方式 连接类型 个人总结 阐述(生成两个集合的约束笛卡儿积) INNER JOIN 内连接 关联相同的(用于查找关联的信息) FROM C AS c INNER JOIN D AS d ON ...
- T-SQL中的APPLY用法(半翻译)
本文接上文:T-SQL 中的CROSS JOIN用法(半翻译) 同样可用于微软认证70-461: Querying Microsoft SQL Server 2012考试的学习中. --------- ...
- T-SQL中的APPLY用法
原文出处:http://www.sqlservercentral.com/articles/Stairway+Series/121318/ 从SQL Server 2005开始,微软添加了一个新的运算 ...
随机推荐
- 【转】OBJECT_ID和DATA_OBJECT_ID的区别
在user_objects等视图里面有两个比较容易搞混的字段object_id和data_object_id这两个字段基本上有什么大的区别呢?object_id其实是对每个数据库中数据对象的唯一标识d ...
- java-并发-活性
浏览以下内容前,请点击并阅读 声明 一个并发程序以适时方式执行的能力叫活性.以下部分介绍最常见的一种活性问题,死锁,并简单介绍其他两种活性问题,饥饿和活锁. 死锁 死锁描述了一种情况:两个或两个以上的 ...
- WPF中获取鼠标相对于桌面位置
var transform = PresentationSource.FromVisual(this).CompositionTarget.TransformFromDevice; var mouse ...
- 基于redis的点赞功能设计
前言 点赞其实是一个很有意思的功能.基本的设计思路有大致两种, 一种自然是用mysql等 数据库直接落地存储, 另外一种就是利用点赞的业务特征来扔到redis(或memcache)中, 然后离线刷回m ...
- U-Boot Driver Model领域模型设计
需求分析 在2014年以前,uboot没有一种类似于linux kernel的设备驱动模型,随着uboot支持的设备越来越多,其一直受到如下问题困扰: 设备初始化流程都独立实现,而且为了集成到系统,需 ...
- [8.3] Magic Index
A magic index in an array A[0...n-1] is defined to be an index such that A[i] = i. Given a sorted ar ...
- 【BFS】POJ 3414
直达 -> POJ 3414 Pots 相似题联动–>HDU 1495 非常可乐 题意:两个壶倒水,三种操作,两个桶其中一个满足等于C的最少操作,输出路径.注意a,b互倒的时候能不能倒满, ...
- scala - multiple overloaded alternatives of method bar define default arguments
同名同位置默认参数不能overload def bar(i:Int,s:String="a"){} def bar(i:String,s:String="b") ...
- 深入浅出 妙用Javascript中apply、call、bind
apply.call 在 javascript 中,call 和 apply 都是为了改变某个函数运行时的上下文(context)而存在的,换句话说,就是为了改变函数体内部 this 的指向. Jav ...
- WebService的一些案例
既然要实现WebService,首先先来创建一个Service类 package cn.happy.webservice; import javax.jws.WebService; import ja ...