Oracle SQL篇（四）group by 分组与分组的加强 rollup

分组操作group by 和分组的强化（rollup）

分组操作和分组函数的使用，对于编写SQL语句的人来说，是最基本的概念。
我们来看下面的例子：
在这里我们使用员工表EMP
scott@DB01> select * from emp;

EMPNO
ENAME
JOB
MGR
HIREDATE
SAL
COMM
DEPTNO
---------- ---------- --------- ---------- -------------------
---------- ---------- ----------

7369
SMITH
CLERK
7902 1980-12-17
00:00:00
800
20

7499
ALLEN
SALESMAN
7698 1981-02-20
00:00:00
1600
300
30

7521
WARD
SALESMAN
7698 1981-02-22
00:00:00
1250
500
30

7566
JONES
MANAGER
7839 1981-04-02
00:00:00
2975
20

7654
MARTIN
SALESMAN
7698 1981-09-28
00:00:00
1250
1400
30

7698
BLAKE
MANAGER
7839 1981-05-01
00:00:00
2850
30

7782
CLARK
MANAGER
7839 1981-06-09
00:00:00
2450
10

7788
SCOTT
ANALYST
7566 1987-04-19
00:00:00
3000
20

7839
KING
PRESIDENT
1981-11-17
00:00:00
5000
10

7844
TURNER
SALESMAN
7698 1981-09-08
00:00:00
1500
0
30

7876
ADAMS
CLERK
7788 1987-05-23
00:00:00
1100
20

7900
JAMES
CLERK
7698 1981-12-03
00:00:00
950
30

7902
FORD
ANALYST
7566 1981-12-03
00:00:00
3000
20

7934
MILLER
CLERK
7782 1982-01-23
00:00:00
1300
10
14 rows selected.

在员工表中有14条记录，即14个员工，我们可以看到，这14个员工分别属于3个部门（10,20,30),我们可以提出求EMP表中，每个部门的员工薪水总和

scott@DB01> select deptno,sum(sal) tsal

2
from emp

3
group by deptno;

DEPTNO
TSAL
---------- ----------

30
9400

20
10875

10
8750

在这里稍微需要注意的是：select 列表里如果出现列的话，那在group
by语句中同样需要列名，并且只能是列名本身，不能是列的别名。group
by语句可以说是oracle语句里最严格的语句，后面只能跟列的真名，别名、位置号、函数、表达式、子查询
都不被允许。当然如果只考虑实现这里已经做到了，如果我们深入了解一点的话，分组对于数据库来说是要消耗资源的，比如cpu、内存
在oracle9i之前
，分组操作内部主要通过排序来实现，10刚开始，采用hash的算法实现，我们看一下10g下，让面语句的执行计划
scott@DB01> set autotrace trace exp
scott@DB01> /
Execution Plan
----------------------------------------------------------
Plan hash value: 4067220884
---------------------------------------------------------------------------

|   0 | SELECT
STATEMENT
|
|    14
|   364
|
4 (25)| 00:00:01 |
|   1 | HASH
GROUP
BY
|
|    14
|   364
|
4 (25)| 00:00:01 |
|   2
|   TABLE ACCESS FULL|
EMP
|    14
|   364
|
3   (0)| 00:00:01 |
---------------------------------------------------------------------------

Note
-----
- dynamic sampling used for
this statement

其实在有些情况下，我们可以避免hash或是sort的发生，也可以实现分组查询的效果，比如说通过索引，当然这需要你有适当的索引存在。

我们来看下面的演示：
scott@DB01> set autotrace off
scott@DB01> create table s_test(id
number,name varchar2(10),sal number);
Table created.

scott@DB01> begin

2
for i in 1..20000 loop

3
insert into s_test values(i,i||'name',i*10);

4
end loop;

5
commit;

6
end;

7
/
PL/SQL procedure successfully completed.
scott@DB01> /

PL/SQL procedure successfully completed.
scott@DB01> /

PL/SQL procedure successfully completed.

scott@DB01> select count(*) from s_test;

COUNT(*)
----------

60000
我在这里建了一张表s_test,分3次往表里插入数据1-20000，现在我的需求是，找到表里100-120的记录，以及他们出现的次数

scott@DB01> select id,name,count(*) from s_test
where id>=100 and id<=120 group by
id,name;

ID
NAME
COUNT(*)
---------- ---------- ----------

115
115name
3

101
101name
3

103
103name
3

106
106name
3

109
109name
3

118
118name
3

105
105name
3

114
114name
3

102
102name
3

104
104name
3

112
112name
3

116
116name
3

100
100name
3

110
110name
3

113
113name
3

117
117name
3

119
119name
3

107
107name
3

108
108name
3

111
111name
3

120
120name
3
21 rows selected.

我们来看一下语句的执行计划
scott@DB01> set autotrace trace exp
scott@DB01> /

Execution Plan
----------------------------------------------------------
Plan hash value: 752916570
-----------------------------------------------------------------------------

|   0 | SELECT
STATEMENT
|
|   163 | 3260
|
58   (6)| 00:00:01 |
|   1 | HASH
GROUP
BY
|
|   163 | 3260
|
58   (6)| 00:00:01 |
|* 2 |   TABLE
ACCESS FULL| S_TEST |   163
| 3260
|
57   (4)| 00:00:01 |
-----------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
2 -
filter("ID">=100 AND "ID"<=120)

Note
-----
- dynamic sampling used for
this statement

在执行计划中我们发现，成本Cost是58，还有cpu的消耗，在执行计划的第2步，我们发现为了实现分组，oracle做了hash。接下来我们建一个组合索引看看

scott@DB01> create index s_id_n_idx on
s_test(id,name);
Index created.

scott@DB01> select id,name,count(*) from s_test
where id>=100 and id<=120 group by
id,name;
Execution Plan
----------------------------------------------------------
Plan hash value: 826362002
-----------------------------------------------------------------------------------

|   0 | SELECT
STATEMENT
|
|    63
| 1260
|
2   (0)| 00:00:01 |
|   1 | SORT
GROUP BY
NOSORT|
|    63
| 1260
|
2   (0)| 00:00:01 |
|* 2 |   INDEX
RANGE SCAN   | S_ID_N_IDX
|    63
| 1260
|
2   (0)| 00:00:01 |
-----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

2 -
access("ID">=100 AND "ID"<=120)

filter("ID">=100 AND "ID"<=120)
Note
-----
- dynamic sampling used for
this statement

在第一步中，应该做的排序并没有做 SORT GROUP BY NOSORT，这样就节省了cpu。
当然在这个例子当中，我们发现了一个重要的问题，就是语句的成本急剧下降，当然，这是通过索引，改变了数据的访问方法造成的，以后有机会在讨论索引的时候，我们会展开来说。

我们接下来看这样一个需求，根据表里的deptno和job求分组，得到每个job下的薪水综合，然后在部门级别做汇总，求小计，在整张表汇总，求总计

scott@DB01> select deptno,job,empno,ename,sal from
emp order by deptno,job;

DEPTNO
JOB
EMPNO
ENAME
SAL
---------- --------- ---------- ---------- ----------

10
CLERK
7934
MILLER
1300

10
MANAGER
7782
CLARK
2450

10
PRESIDENT
7839
KING
5000

20
ANALYST
7788
SCOTT
3000

20
ANALYST
7902
FORD
3000

20
CLERK
7876
ADAMS
1100

20
CLERK
7369
SMITH
800

20
MANAGER
7566
JONES
2975

30
CLERK
7900
JAMES
950

30
MANAGER
7698
BLAKE
2850

30
SALESMAN
7654
MARTIN
1250

30
SALESMAN
7521
WARD
1250

30
SALESMAN
7499
ALLEN
1600

30
SALESMAN
7844
TURNER
1500

其实需求本身很简单，如果仅仅是为了实现的话，使用集合并运算符union就可以了，不过union的效率在这里是非常的低。
scott@DB01> select deptno,job,sum(sal) tsal from emp
group by deptno,job
2 union
3 select
deptno,to_char(null),sum(sal) from emp group by
deptno
4 union
5 select
to_number(null),to_char(null),sum(sal) from emp;

DEPTNO
JOB
TSAL
---------- --------- ----------

10
CLERK
1300

10
MANAGER
2450

10
PRESIDENT
5000

10
8750

20
ANALYST
6000

20
CLERK
1900

20
MANAGER
2975

20
10875

30
CLERK
950

30
MANAGER
2850

30
SALESMAN
5600

30
9400

29025
13 rows selected.

为了得到比较高效的sql，我们可以借助于oracle分组里面的rollup来实现，我们可以得到同样的效果
scott@DB01> select deptno,job,sum(sal) tsal from emp
group by rollup(deptno,job);

DEPTNO
JOB
TSAL
---------- --------- ----------

10
CLERK
1300

10
MANAGER
2450

10
PRESIDENT
5000

10
8750

20
CLERK
1900

20
ANALYST
6000

20
MANAGER
2975

20
10875

30
CLERK
950

30
MANAGER
2850

30
SALESMAN
5600

30
9400

29025
13 rows selected.

第一直观的表现，使用rollup要比使用分组再union的方法语句简单很多，更重要的是，我们只对emp访问了一次。
为了进一步比较，我们来看一下语句的执行计划
scott@DB01> set autotrace trace exp

scott@DB01> select deptno,job,sum(sal) tsal from emp
group by deptno,job
2 union
3 select
deptno,to_char(null),sum(sal) from emp group by
deptno
4 union
5 select
to_number(null),to_char(null),sum(sal) from emp;

Execution Plan
----------------------------------------------------------
Plan hash value: 3412076862
-----------------------------------------------------------------------------

|   0 | SELECT
STATEMENT
|
|    29
|   825
|
14 (79)| 00:00:01 |
|   1 | SORT
UNIQUE
|
|    29
|   825
|
14 (79)| 00:00:01 |
|   2
|
UNION-ALL
|
|
|
|
|
|
|   3
|    HASH GROUP
BY
|
|    14
|   448
|
5 (40)| 00:00:01 |
|   4
|
TABLE ACCESS FULL| EMP
|    14
|   448
|
3   (0)| 00:00:01 |
|   5
|    HASH GROUP
BY
|
|    14
|   364
|
5 (40)| 00:00:01 |
|   6
|
TABLE ACCESS FULL| EMP
|    14
|   364
|
3   (0)| 00:00:01 |
|   7
|    SORT
AGGREGATE
|
|
1 |    13
|
4 (25)| 00:00:01 |
|   8
|
TABLE ACCESS FULL| EMP
|    14
|   182
|
3   (0)| 00:00:01 |
-----------------------------------------------------------------------------

Note
-----
- dynamic sampling used for
this statement

scott@DB01> select deptno,job,sum(sal) tsal from emp
group by rollup(deptno,job);
Execution Plan
----------------------------------------------------------
Plan hash value: 52302870
-----------------------------------------------------------------------------

|   0 | SELECT
STATEMENT
|
|    14
|   448
|
4 (25)| 00:00:01 |
|   1 | SORT
GROUP BY
ROLLUP|
|    14
|   448
|
4 (25)| 00:00:01 |
|   2
|   TABLE ACCESS
FULL | EMP
|    14
|   448
|
3   (0)| 00:00:01 |
-----------------------------------------------------------------------------

Note
-----
- dynamic sampling used for
this statement

通过比较发现，两个语句的成本cost会差出很多14vs4。所以，如果我们以后有上面类似的需求的话，可以考虑使用rollup。

注：rollup语法
    select
a,b,组函数
    from 表
    group by
rollup(a,b);

这个语法相当于 group by a,b union group a union group by
null的sql语句的组合

Oracle SQL篇（四）group by 分组与分组的加强 rollup的更多相关文章

Oracle SQL篇（一）null值之初体验
从我第一次正式的写sql语句到现在,已经超过10年的时间了.我写报表,做统计分析和财务对账,我一点点的接触oracle数据库,并尝试深入了解.这条路,一走就是10年,从充满热情,到开始厌 ...
Oracle SQL篇（三）Oracle ROWNUM 与TOP N分析
首先我们来看一下ROWNUM: 含义解释: 1.rownum是oracle为从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推.这是一个伪列,可以用于限制查询返回的总行数. 2 ...
Oracle SQL篇（二）oracle自连接操作
oracle 的自连接(self join)操作对于oracle数据库来说,目前支持两套语法,一套是oracle自己的sql语法,一套是通行标准的SQL99语法,那么对于oracle的连接操 ...
oracle学习篇五：组函数，分组统计
常用组函数: 1.ccount() 求出全部记录数. 2.max() 求出一组最大值 3.min() 求出一组最小值 4.avg() 求出平均值 5.sum() 求和 --1.统计员工数量: sele ...
oracle学习篇四：多表查询
-----------------产生笛卡儿积------------------------------------ select * from emp,dept; --不带条件时,记录数为14*4 ...
oracle sql 高级编程历史笔记整理
20130909 周一 oracle sql 开发指南第7章高级查询 1.层次化查询select level,ttt.*,sys_connect_by_path(ttt.col1,',') fro ...
【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇四：关于OneNote入库处理以及审核
篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblog ...
转：sql篇 select from where group by having order by
原文地址: sql篇 select from where group by having order by select from where group by having order by 的基 ...
mongoDB 分组并对分组结果筛选类似于SQL中的(group by xxx having ) 附带Java代码
今天需要做一个筛选程序,因为数据放在mongodb中,没写过分组的查询语句,查了一些资料,终于写出来了,分享给各位小伙伴需求是查询学员在2019-07-29之后未同步的数据(同一个学员需要2条 ...

随机推荐

img 中的src的应用
在页面载入的时候,img标签的src 会跟填写的内容去载入,servlet 或者controller 或者你自己觉得希望载入的java代码. 我们这边举一个载入servlet的样例. <img ...
设计模式之---模板方法template method的使用
在面向对象系统的分析与设计过程中经常会遇到这样一种情况:对于某一个业务逻辑(算法实现)在不同的对象中有不同的细节实现,但是逻辑(算法)的框架(或通用的应用算法)是相同的.Template Method ...
Git基本应用
1.创建SSH Key $ cd ~/.ssh $ ssh-keygen -t rsa -C "your_email@example.com" 拷贝id_rsa.pub文件到Set ...
关于 WP上应用调试时报错“指定的通信资源（端口）”已由另一个应用程序使用问题
问题来源碰到这个问题是调试wp7项目的时候,之前因为安装的是wp8.0的sdk 包括wp7.5所以wp7的也能用,后来不知道怎么回事wp7项目就不能调试了总是显示启动而不是 device或者是虚拟机 ...
如何创建一个简单的struts2程序
如何创建一个简单的Struts2程序 “计应134(实验班) 凌豪” 1.创建一个新的Web项目test(File->new->Web Project) 2.Struts2框架的核心配置文 ...
Thml 小插件8 天气插件定制
网址:http://www.tianqi.com/plugin/
Oracle的TPCC测试，原来也是个作弊的东西...
http://www.oaktable.net/content/sorted-hash-clusters-rip 根据Jonathan Lewis老先生的测试实例,发觉cluster 的sort功能, ...
在两个Android设备间通过UDP传输目录内文件
这两天下了一个使用UDP传输目录内文件的程序,发出来给大家一起看看,共同进步.有问题请指教. 由于udp丢包比较厉害,因此使用了自定义的内部协议,进行双方的确认. 程序跑起来后,看网络状况,有时候会一 ...
一、ThinkPHP的介绍
一.ThinkPHP的介绍 //了解 MVC M - Model 模型工作:负责数据的操作 V - View 视图(模板) 工作:负责前台页面显示编写html代码 C - Controller 控 ...
Codeblock解决注释乱码问题及在ubuntu中程序运行时乱码问题。
(1)修改源文件保存编码在:settings->Editor->gernal settings>other settings 看到左边的Encoding group Box,改为WI ...

Oracle SQL篇（四）group by 分组与分组的加强 rollup

Oracle SQL篇（四）group by 分组与分组的加强 rollup的更多相关文章

随机推荐

热门专题