本人曾去某金融软件公司面试,交流中面试官问的一个问题是:“如果有 A、B 两张表,A 表中有 2 条数据,B 表中有 200 条数据,请问 SELECT * FROM A,B 能查出多少条数据?”。

听到这个问题的瞬间我就懵了,因为我自己也做过近两年的面试官,所以我首先会想的就是他问这么没有实际意义(实际开发中几乎 100% 的查询都需要条件)的问题是想考察我什么呢?同时我心里也在想,这种逗号的写法本质上就是内连接,那答案是笛卡尔积吗?我刚想对面试官说:“我没这么写过,但我分析这种写法的结果应该是笛卡尔积,也就是 2×200 等于 400……”,正在组织语言的时候被面试官打断了,他说:“没关系!我就问问!……”

现在我们来仔细研究下这个问题

首先来创建 t6、t7、t8 共 3 张表,创建语句如下:

CREATE TABLE t6 AS SELECT LEVEL f1,6 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=6;
CREATE TABLE t7 AS SELECT LEVEL f1,7 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=7;
CREATE TABLE t8 AS SELECT LEVEL f1,8 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=8;

然后来看看各个表中的数据分步

SQL> SELECT t6.* FROM t6;

        F1         F2         F3
---------- ---------- ----------
1 6 0
2 6 0
3 6 0
4 6 0
5 6 0
6 6 0 6 rows selected SQL> SELECT t7.* FROM t7; F1 F2 F3
---------- ---------- ----------
1 7 0
2 7 0
3 7 0
4 7 0
5 7 0
6 7 0
7 7 0 7 rows selected SQL> SELECT t8.* FROM t8; F1 F2 F3
---------- ---------- ----------
1 8 0
2 8 0
3 8 0
4 8 0
5 8 0
6 8 0
7 8 0
8 8 0 8 rows selected

接下来开始我们的实验

SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f1=t7.f1; -- res: 6
SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f2=t7.f2; -- res: 0
SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 JOIN t7 ON 1=2; -- res: 0

在 t6 和 t7 两张表中:f1 字段值中的 1~6 是相等的,所以结果集行数是 6×1 等于 6;f2 字段值则完全不想等,所以结果集行数是 6×0 等于 0;f3 字段值全都相等,所以结果集行数是 6×7 等于 42。

SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f1=t7.f1; -- res: 6
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f2=t7.f2; -- res: 6
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON 1=2; -- res: 6

左连接的时候,会返回左边表中的所有行,如果左边表中的行在右边表中没有匹配行,则结果集中右边表中的列返回空值。在这里,t7.f1 与 t6.f1 有 6 行唯一匹配,所以结果集行数是 6×1 等于 6;t7.f2 与 t6.f2 完全不匹配,所以结果集行数就是 6;t7.f3 中有 7 行能匹配 t6.f3 中的任意行,所以结果集行数是 6×7 等于 42。

接下来回到本文一开始提出的那个问题,先看查询结果:

SELECT COUNT(1) res FROM t6,t7; -- res: 42

事实上这是一个交叉连接(一定有人会晕倒),交叉连接的标准写法是:

SELECT COUNT(1) res FROM t6 CROSS JOIN t7; -- res: 42

也许是工作久了的原因,可能大部分人都还记得内连接和外连接(左连接、右连接、全连接),因为内链接和左连接还经常用。同时,估计大部分人和我一样,已经把三大连接中的交叉连接给忘得一干二净了,原因也很简单,长时间没用了!

交叉连接最典型的特点就是没有 WHERE 子句,交叉连接返回连接表中所有数据行的笛卡尔积,在关系数据库中的笛卡尔积的结果就是交叉连接所涉及的表中行数之积。

其实 CROSS JOIN 后面也是可以跟 WHERE 子句的,不过那样它就相当于内连接了。我觉得可以理解为不写条件就相当于条件恒等,这时的结果集行数就是两个表中数据行数的乘积,也就是所谓的笛卡尔积。

最后附上同样从来都用不到的全连接的验证结果

SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f1=t7.f1; -- res: 7
SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f2=t7.f2; -- res: 13
SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 FULL OUTER JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 FULL OUTER JOIN t7 ON 1=2; -- res: 13

最最后附上全连接的定义:完全外部连接返回左边表和右边表中的所有行。当某行在一个表中没有匹配行时,则另一个表中的列将包含空值。如果表之间有匹配行,则整个结果集的行包含基表的数据。

本文链接http://www.cnblogs.com/hanzongze/p/oracle-sql-rows.html

版权声明:本文为博客园博主 韩宗泽 原创,作者保留署名权!欢迎通过转载、演绎或其它传播方式来使用本文,但必须在明显位置给出作者署名和本文链接!个人博客,能力有限,若有不当之处,敬请批评指正,谢谢!

Oracle 查询结果集行数分析的更多相关文章

  1. 查询执行成本高(查询访问表数据行数多)而导致实例 CPU 使用率高是 MySQL 非常常见的问题

    MySQL CPU 使用率高的原因和解决方法_产品性能_常见问题_云数据库 RDS 版-阿里云 https://help.aliyun.com/knowledge_detail/51587.html ...

  2. Oracle查询库中记录数大于2千万的所有表

    Oracle查询库中记录数大于2千万的所有表 假如当前用户拥有select any table权限,则可以使用下列sql语句: select table_name, num_rows from dba ...

  3. MS SQL查询所有表行数,获取所有数据库名,表名,字段名

    1.获取所有数据库名 --SELECT Name FROM Master..SysDatabases ORDER BY Name -- 2.获取所有表名: --SELECT Name NAMEtemp ...

  4. 解析oracle的rownum,数据库查询结果返回行数设置

    对于rownum来说它是oracle系统顺序分配为从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀 ...

  5. CI中获取读操作的结果集行数+获取写操作的影响行数

    本质:读操作,用mysql_num_rows函数,写操作用mysql_affected_rows函数 mysql_num_rows() 返回结果集中行的数目.此命令仅对 SELECT 语句有效.要取得 ...

  6. iOS开发- 查询项目代码行数

    ...事实上, 这功能也没什么用. 就是查询一个项目总的代码行数. 玩玩倒是能够. 方法: 在终端以下依次输入: cd 项目文件 find . "(" -name "*. ...

  7. Hibernate 查询sql结果行数的几种方法

    一.前言 这个东西,难度几乎没有,就是繁琐. 一条简单的select count(*) from table_name 都能有多种书写方式. 总是忘,这里记录下. 一 .通过Criteria 查询 C ...

  8. oracle:ORACLE 实际返回的行数超出请求的行数

    写的存储过程,执行后一直报实际返回的行数超出请求的行数的错误. 原因:select prdt_id into prdt_id from.... 两个变量名称相同造成的..哎  第一个变量换成大写..问 ...

  9. ORACLE 查询不走索引的原因分析,解决办法通过强制索引或动态执行SQL语句提高查询速度

    (一)索引失效的原因分析: <>或者单独的>,<,(有时会用到,有时不会) 有时间范围查询:oracle 时间条件值范围越大就不走索引 like "%_" ...

随机推荐

  1. Extjs小总结

    1.绑定工作流:    INSERT INTO `base_codeclass` VALUES (null, 'PM_CGSQ', '采购申请', null, null, null, '2018-09 ...

  2. Git提交代码(要有GitHub账号)

    分享一下Git提交模式代码(只是提交到GitHub仓库而已,没有其他的操作) 这个的前提是你已经安装了Node.js.Git 下面来看: 1.  cd进入目录 2.  把当前目录变成git可以管理的仓 ...

  3. MicroSoft CryptoAPI data/file encrypt/decrypt

    linux 用第三方库 Crypto++, 还未实战. CryptoAPI使用两种密钥:会话密钥与公共/私人密钥对.会话密钥使用相同的加密和解密密钥,这种算法较快,但必须保证密钥的安全传递.公共/私人 ...

  4. vue 图片预览插件

    https://github.com/daidaitu1314/vue2-preview //cnpm cnpm install vue2-preview -save //引入 import VueP ...

  5. diy 滚动条 样式 ---- 核心代码

    参考自 : https://blog.csdn.net/qq_38881495/article/details/83689721 .chapter_data position relative wid ...

  6. composer 实现自动加载原理

    简介 一般在框架中都会用到composer工具,用它来管理依赖.其中composer有类的自动加载机制,可以加载composer下载的库中的所有的类文件.那么composer的自动加载机制是怎么实现的 ...

  7. mybatis的基本语句的应用

    大家好今晚整理有关mybatis的添加删除修改更新的操作 一.select <!-- 查询学生,根据id --> <select id="getStudent" ...

  8. nmon监控分析

    一.下载软件安装 wget http://sourceforge.net/projects/nmon/files/nmon_linux_14i.tar.gz tar xf nmon_linux_14i ...

  9. python语法_装饰器

    装饰器的知识点储备: 1 作用域 2 高阶函数 3 闭包 内部函数,对外部作用作用域的变量进行了引用,该内部函数就认为是闭包, def outer(): x=10 def inner(): print ...

  10. CSS文字的跑马灯特效

    上学时同学有个来电带跑马灯的手机,可把我羡慕坏了,可等我买的起手机时,跑马灯不流行了,甚伤萝卜心! 今天就用CSS做个文字的跑马灯特效,缅怀一下本萝卜逝去的青春! 道具:会敲代码的巧手.七窍玲珑心.会 ...