“NOT_IN”与“NULL”的邂逅
今天处理了一个因“NOT IN”与“NULL”邂逅导致的问题,值得思考和总结,记录在此,供参考。(感谢John抛出的问题)
我们以实验的形式先再现一下这个问题,然后对其分析,最后给出几种解决方案。
1.创建实验表T,并分别初始化三条数据,注意T2表中包含一条空(NULL)数据。
sec@ora10g> insert into t1 values (1);
sec@ora10g> insert into t1 values (2);
sec@ora10g> insert into t1 values (3);
sec@ora10g> insert into t2 values (1);
sec@ora10g> insert into t2 values (null);
sec@ora10g> insert into t2 values (3);
sec@ora10g> commit;sec@ora10g> select * from t1;sec@ora10g> select * from t2;
sec@ora10g> select * from t1 where x not in (select x from t2);
sec@ora10g> select * from t1 where x in (select x from t2);
sec@ora10g> select * from t1 where x not in (select x from t2 where x is not null);
sec@ora10g> select * from t1 where not exists (select * from t2 where t1.x=t2.x);
sec@ora10g> select t1.* from t1, t2 where t1.x = t2.x(+) and t2.x is null;
2.确认T1表和T2表的数据内容
X
----------
1
2
3
X
----------
1
3
3.再现问题
尝试使用“NOT IN”方法获得不在T2表中出现的T1表数据。
no rows selected
问题已重现,明明T1中的数据“2”在T2表中没有,为什么没有返回结果呢?
原因:当子查询返回含有“NULL”记录时,使用NOT IN时将不会有返回记录。
解析:可以这么理解这个现象:Oracle中的NULL是一个不确定的状态。以T1表中的记录“2”为例,在与T2表中的NULL进行比较时,NULL既可以是“2”,也可以不是“2”,因为判断不了他们的关系,所以只能返回空记录,此乃无奈之举。
4.为什么使用“IN”可以返回“正确”的结果?
X
----------
1
3
这是显然的,因为T2表中确确实实的存在着记录“1”和记录“3”,因此“1”和“3”被返回。不过,注意,NULL依然是一个不确定的状态,因此在T1表中的“2”与NULL比较之后仍然是个不确定的结果,因此“2”是不会被返回的。这里给我们的一个错觉:T1表中的“2”与T2表中NULL不同(他们其实也可能相同)。
5.诸多解决方案
1)排除“NOT IN”子查询中存在的NULL值
X
----------
2
2)使用“NOTEXISTS”改写
X
----------
2
3)使用“外连接”改写
X
----------
2
道理是相通的,想想为什么使用“NOT EXISTS”和“外连接”方法改写后就可以成功?(给大家一个机会,这里不赘述。)
6.小结
这里描述的的案例可以用“陷阱”来形容,不过对于这个“陷阱”我们是有诸多解决方案进行规避的。
遇到问题在沉着、冷静+淡定之后,终有柳暗花明之时。希望您也有思考之后豁然开朗之悦。
Good luck.
secooler
10.02.09
-- The End --
=========================================
IN & NOT IN & EXISTS & NOT EXISTS & TABLE JION
当子查询有返回null值时,not in不会有结果返回,如:
SQL> select ename from emp where deptno not in(10,20,null)
2 /
no rows selected
原因是:
deptno not in(10, 20, null) ===>
not (deptno in(10, 20, null)) ===>
not (deptno=10 or deptno=20 or deptno=null) ===>
deptno<>10 and deptno<>20 and deptno<>null ===>
deptno<>10 and deptno<>20 and unkown ===>
deptno<>10 and deptno<>20 and false ===>false
下面是两个在NOT IN中使用子查询的例子,先看没有null的情况:
SQL> select ename, deptno from emp;
ENAME DEPTNO
---------- ----------
SMITH 20
ALLEN 30
WARD 30
JONES 20
MARTIN 30
BLAKE 30
CLARK 10
SCOTT 20
KING 10
TURNER 30
ADAMS 20
JAMES 30
FORD 20
MILLER 10
14 rows selected.
SQL> select dname from dept where deptno not in(select deptno from emp);
DNAME
--------------
OPERATIONS
再看子查询包含null值的情况:
SQL> insert into emp(empno, ename,deptno)
2 values(9999,LAW,null)
3 /
1 row created.
SQL> select ename, deptno from emp;
ENAME DEPTNO
---------- ----------
LAW
SMITH 20
ALLEN 30
WARD 30
JONES 20
MARTIN 30
BLAKE 30
CLARK 10
SCOTT 20
KING 10
TURNER 30
ADAMS 20
JAMES 30
FORD 20
MILLER 10
15 rows selected.
SQL> select dname from dept where deptno not in(select deptno from emp);
no rows selected
SQL> select dname from dept
2 where deptno not in(select deptno from emp where deptno is not null)
3 /
DNAME
--------------
OPERATIONS
而子查询包含null时,用in却不会有问题:
SQL> select ename,deptno from emp where deptno in(10,20,null)
2 /
ENAME DEPTNO
---------- ----------
SMITH 20
JONES 20
CLARK 10
SCOTT 20
KING 10
ADAMS 20
FORD 20
MILLER 10
8 rows selected.
IN一般可以改为EXISTS:
SQL> select dname from dept
2 where deptno in(select deptno from emp)
3 /
DNAME
--------------
RESEARCH
SALES
ACCOUNTING
SQL> select dname from dept
2 where exists(select * from emp where emp.deptno=dept.deptno)
3 /
DNAME
--------------
RESEARCH
SALES
ACCOUNTING
而NOT IN一般可以改为NOT EXISTS:
SQL> select dname from dept
2 where deptno not in(select deptno from emp where deptno is not null)
3 /
DNAME
--------------
OPERATIONS
SQL> select dname from dept
2 where not exists(select * from emp where dept.deptno=emp.deptno)
3 /
DNAME
--------------
OPERATIONS
使用NOT EXISTS,即使子查询中包含NULL值,也会得到正确结果。原因是:
select * from emp where dept.deptno=null不会有返回值,这样,EXISTS(select * from emp where dept.deptno=null)返回的布尔值为false,而 NOT(false)显然为TRUE,其他条件与之作and后,依然得到true。
而在NOT IN子句中,是NOT(deptno=null),即NOT(unkown),结果依然为unkown,而unkown被当作false,其他条件与之作and后,最后得到false。
NOT EXISTS(select * from emp where dept.deptno=null) ===>
NOT (false) ===>TRUE
所以子查询中的null不会影响其他的查询结果。
EXISTS可以改为使用表连接语法:
SQL> select dname from dept
2 where exists(select * from emp where emp.deptno=dept.deptno)
3 /
DNAME
--------------
RESEARCH
SALES
ACCOUNTING
SQL> select
“NOT_IN”与“NULL”的邂逅的更多相关文章
- 《深入理解JAVA虚拟机》笔记1
java程序运行时的内存空间,按照虚拟机规范有下面几项: )程序计数器 指示下条命令执行地址.当然是线程私有,不然线程怎么能并行的起来. 不重要,占内存很小,忽略不计. )方法区 这个名字很让我迷惑. ...
- thinkjs与Fine Uploader的邂逅
最近在做一个内部系统,需要一个无刷新的上传功能,找了许久,发现了一个好用的上传工具-Fine Uploader,网上也有不少关于它的介绍,对我有不少的启发,结合我的使用场景简单的介绍一下它与t ...
- 当php邂逅windows通用上传缺陷
早上逛乌云发现了PKAV大牛的一篇文章,针对php和windows文件上传的分析,思路很YD,果断转之与大家分享. 虽然此文可能有许多的限制条件,但是如果你认真阅读会发现,其实还是比较实用的. 另外一 ...
- Redis 实战篇:GEO助我邂逅附近女神
码老湿,阅读了你的巧用数据类型实现亿级数据统计之后,我学会了如何游刃有余的使用不同的数据类型(String.Hash.List.Set.Sorted Set.HyperLogLog.Bitmap)去解 ...
- 【小计】新人Tostring前忘记Null判断的处理
ToString和string.Concat(可屏蔽Null的异常)性能相差不大,一些中小项目完全可以用Concat(新人容易忘记判断Null的情况,遇到太多了,所以建议重写tostring方法,内部 ...
- 和 Thrift 的一场美丽邂逅
一. 与 Thrift 的初识 也许大多数人接触 Thrift 是从序列化开始的.每次搜索 “java序列化” + “方式”.“对比” 或 “性能” 等关键字时,搜索引擎总是会返回一大堆有关各种序列化 ...
- SQL Server-聚焦NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL性能分析(十八)
前言 本节我们来综合比较NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL的性能,简短的内容,深入的理解,Always to review the basics. ...
- 异步 HttpContext.Current 为空null 另一种解决方法
1.场景 在导入通讯录过程中,把导入的失败.成功的号码数进行统计,然后保存到session中,客户端通过轮询显示状态. 在实现过程中,使用的async调用方法,出现HttpContext.Curren ...
- js中的null 和undefined
参考链接:http://blog.csdn.net/qq_26676207/article/details/53100912 http://www.ruanyifeng.com/blog/2014/0 ...
随机推荐
- jquery统计页面的pv/ip及停留时间等
我们在做网站的时候经常需要统计网站的访问信息,这里介绍一个用jquery写的一个统计方法 新建一个js文件jun_record.js 代码如下: var start; var end; var tim ...
- python讲一个列表写入excel表中
连接为http://blog.csdn.net/a491057947/article/details/47614263 http://www.crifan.com/export_data_to_exc ...
- C++编程优化心得(持续更新)
1. 对齐原则.比如64位总线,每次寻址读取8B.编程时注意变量地址,尽量消耗总线最少的寻址次数.堆内存申请时,系统严格按照对齐原则分配,故而使用时候也尽量不要跨寻址边界. 2. 需要的时候,可为了效 ...
- C#学习笔记----枚举、结构、方法及构造函数的总结
一.枚举 语法: [public] enum 枚举名 { 值1, 值2, 值3, ........ } public:访问修饰符.公开的公共的,哪都可以访问. enum:关键字,声明枚举的关键字 枚举 ...
- 网页版电子表格控件tmlxSpreadsheet免费下载地址
tmlxSpreadsheet 是一个由JavaScript 和 PHP 写成的电子表格控件(包含WP插件, Joomla插件等等).. 程序员可以容易的添加一个类似Excel功能的,可编辑的表格功能 ...
- 【OpenCV】图像的遍历
Mat类的两种遍历比较快的方式,分别给出了按行和按列遍历,以及运行过程图. 原图: 按行遍历过程图 按列遍历过程图 代码如下: //ptr逐行访问 void ptrScanX(Mat& src ...
- xcode armv6 armv7 armv7s arm64
目前ios的指令集有以下几种: armv6 iPhone iPhone2 iPhone3G 第一代和第二代iPod Touch armv7 iPhone4 iPhone4S armv7s iPhone ...
- Myeclipse+Axis2+Tomcat开发webService
1. 下载文件: 需要在axis2官网下载两种类型的axis2文件,bin版和war版(下载地址:http://axis.apache.org/axis2/java/core/download.cg ...
- Zookeeper源码编译为Eclipse工程(转)
原文地址:http://blog.csdn.net/jiyiqinlovexx/article/details/41179293 为了深入学习ZooKeeper源码,首先就想到将其导入到Eclispe ...
- (基础篇)php中理解print EOT分界符和echo EOT的用法区别
html与php编写中echo可以同时输出多个字符串,并不需要圆括号. print只可以同时输出一个字符串,需要圆括号. print的用法和C语言很像,所以会对输出内容里的%做特殊解释. echo无返 ...