GROUP BY的扩展

GROUP BY的扩展主要包括ROLLUP，CUBE，GROUPING SETS三种形式。

ROLLUP

rollup相对于简单的分组合计增加了小计和合计，解释起来会比较抽象，下面我们来看看具体事例。

例1，统计不同部门工资的总和和所有部门工资的总和。

SQL> select deptno,sum(sal) from emp group by rollup(deptno);

    DEPTNO   SUM(SAL)

---------- ----------

        10       8750

        20      10875

        30       9400

                29025

例2，该例中先对deptno进行分组，再对job进行分组

SQL> select deptno,job,sum(sal) from emp group by rollup(deptno,job);

    DEPTNO JOB           SUM(SAL)

---------- --------- ----------

        10 CLERK           1300    --10号部门中JOB为CLERK的工资的总和

        10 MANAGER         2450

        10 PRESIDENT       5000

        10                 8750    --10号所有工种工资的总和

        20 CLERK           1900

        20 ANALYST         6000

        20 MANAGER         2975

        20                10875

        30 CLERK            950

        30 MANAGER         2850

        30 SALESMAN        5600

        30                 9400

                          29025   --所有部门，所有工种工资的总和

13 rows selected.

如果要用普通的分组函数实现，可用UNION ALL语句：

--实现单个部门，单个工种的工资的总和
select deptno,job,sum(sal) from emp group by deptno,job

union all
--实现单个部门工资的总和
select deptno,null,sum(sal) from emp group by deptno

union all
--实现所有部门工资的总和
select null,null,sum(sal) from emp

order by 1,2

下面我们分别来看看两者的执行计划及统计信息，

ROLLUP语句：

Execution Plan

-----------------------------------------------------------------------------

| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |

-----------------------------------------------------------------------------

|   0 | SELECT STATEMENT     |        |     11 |    132 |      3  (34)| 00:00:01 |

|   1 |  SORT GROUP BY ROLLUP|        |     11 |    132 |      3  (34)| 00:00:01 |

|   2 |   TABLE ACCESS FULL  |   EMP  |     14 |    168 |      2   (0)| 00:00:01 |

-----------------------------------------------------------------------------

Statistics

----------------------------------------------------------

      0  recursive calls

      0  db block gets

      2  consistent gets

      0  physical reads

      0  redo size

    895  bytes sent via SQL*Net to client

    519  bytes received via SQL*Net from client

      2  SQL*Net roundtrips to/from client

      1  sorts (memory)

      0  sorts (disk)

     13  rows processed

UNION ALL语句：

Execution Plan

-----------------------------------------------------------------------------

| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |

-----------------------------------------------------------------------------

|   0 | SELECT STATEMENT     |        |     15 |    150 |      9  (34)| 00:00:01 |

|   1 |  SORT ORDER BY       |        |     15 |    150 |      8  (75)| 00:00:01 |

|   2 |   UNION-ALL          |        |        |        |             |          |

|   3 |    HASH GROUP BY     |        |     11 |    132 |      3  (34)| 00:00:01 |

|   4 |     TABLE ACCESS FULL|   EMP  |     14 |    168 |      2   (0)| 00:00:01 |

|   5 |    HASH GROUP BY     |        |      3 |     15 |      3  (34)| 00:00:01 |

|   6 |     TABLE ACCESS FULL|   EMP  |     14 |     70 |      2   (0)| 00:00:01 |

|   7 |    SORT AGGREGATE    |        |      1 |      3 |             |          |

|   8 |     TABLE ACCESS FULL|   EMP  |     14 |     42 |      2   (0)| 00:00:01 |

-----------------------------------------------------------------------------


Statistics

----------------------------------------------------------

      0  recursive calls

      0  db block gets

      6  consistent gets

      0  physical reads

      0  redo size

    895  bytes sent via SQL*Net to client

    519  bytes received via SQL*Net from client

      2  SQL*Net roundtrips to/from client

      1  sorts (memory)

      0  sorts (disk)

     13  rows processed

不难看出，相同的功能实现，ROLLUP相对于UNION ALL效率有了极大的提升。

CUBE

cube相对于rollup，结果输出更加详细。

例1，在本例中还不是很明显。

SQL> select deptno,sum(sal) from emp group by cube(deptno);

    DEPTNO   SUM(SAL)

---------- ----------

                29025

        10       8750

        20      10875

        30       9400

例2，相对于rollup，cube还对工种这一列进行了专门的汇总。

SQL> select deptno,job,sum(sal) from emp group by cube(deptno,job);

    DEPTNO JOB           SUM(SAL)

---------- --------- ----------

                          29025

           CLERK           4150

           ANALYST         6000

           MANAGER         8275

           SALESMAN        5600

           PRESIDENT       5000

       10                  8750

       10  CLERK           1300

       10  MANAGER         2450

       10  PRESIDENT       5000

       20                 10875

       20  CLERK           1900

       20  ANALYST         6000

       20  MANAGER         2975

       30                  9400

       30  CLERK            950

       30  MANAGER         2850

       30  SALESMAN        5600

18 rows selected.

GROUPING SETS

GROUPING SETS相对于ROLLUP和CUBE，结果是分类统计的，可读性更好一些。

例1：

SQL> select deptno,job,to_char(hiredate,'yyyy')hireyear,sum(sal) from emp group by grouping sets(deptno,job,to_char(hiredate,'yyyy'));

    DEPTNO JOB         HIRE   SUM(SAL)

---------- ---------   ---- ----------

           CLERK                  4150

           SALESMAN               5600

           PRESIDENT              5000

           MANAGER                8275

           ANALYST                6000

       30                         9400

       20                        10875

       10                         8750

                        1987      4100

                        1980       800

                        1982      1300

                        1981     22825

例2：

SQL> select deptno,job,sum(sal) from emp group by grouping sets(deptno,job);

    DEPTNO JOB           SUM(SAL)

---------- ---------   ----------

           CLERK             4150

           SALESMAN          5600

           PRESIDENT         5000

           MANAGER           8275

           ANALYST           6000

        30                   9400

        20                  10875

        10                   8750

8 rows selected.

对于该例，如何用UNION ALL实现呢？

select null deptno,job,sum(sal) from emp group by job

union all

select deptno,null,sum(sal) from emp group by deptno;

两者的执行计划及统计信息分别如下：

GROUPING SETS：

Execution Plan

--------------------------------------------------------------------------------------------------------

| Id  | Operation                   | Name                      | Rows  | Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT            |                           |    11 |   352 |    10  (20)| 00:00:01 |

|   1 |  TEMP TABLE TRANSFORMATION  |                           |       |       |            |          |

|   2 |   LOAD AS SELECT            | SYS_TEMP_0FD9D6795_E71F79 |       |       |            |          |

|   3 |    TABLE ACCESS FULL        | EMP                       |    14 |   168 |     2   (0)| 00:00:01 |

|   4 |   LOAD AS SELECT            | SYS_TEMP_0FD9D6796_E71F79 |       |       |            |          |

|   5 |    HASH GROUP BY            |                           |     1 |    19 |     3  (34)| 00:00:01 |

|   6 |     TABLE ACCESS FULL       | SYS_TEMP_0FD9D6795_E71F79 |     1 |    19 |     2   (0)| 00:00:01 |

|   7 |   LOAD AS SELECT            | SYS_TEMP_0FD9D6796_E71F79 |       |       |            |          |

|   8 |    HASH GROUP BY            |                           |     1 |    26 |     3  (34)| 00:00:01 |

|   9 |     TABLE ACCESS FULL       | SYS_TEMP_0FD9D6795_E71F79 |     1 |    26 |     2   (0)| 00:00:01 |

|  10 |   VIEW                      |                           |     1 |    32 |     2   (0)| 00:00:01 |

|  11 |    TABLE ACCESS FULL        | SYS_TEMP_0FD9D6796_E71F79 |     1 |    32 |     2   (0)| 00:00:01 |

--------------------------------------------------------------------------------------------------------

Statistics

----------------------------------------------------------

      4  recursive calls

     24  db block gets

     17  consistent gets

      3  physical reads

   1596  redo size

    819  bytes sent via SQL*Net to client

    519  bytes received via SQL*Net from client

      2  SQL*Net roundtrips to/from client

      0  sorts (memory)

      0  sorts (disk)

      8  rows processed

UNION ALL：

----------------------------------------------------------------------------

| Id  | Operation           | Name  | Rows  | Bytes | Cost (%CPU)| Time     |

----------------------------------------------------------------------------

|   0 | SELECT STATEMENT    |       |     8 |    65 |     6  (67)| 00:00:01 |

|   1 |  UNION-ALL          |       |       |       |            |          |

|   2 |   HASH GROUP BY     |       |     5 |    50 |     3  (34)| 00:00:01 |

|   3 |    TABLE ACCESS FULL|  EMP  |    14 |   140 |     2   (0)| 00:00:01 |

|   4 |   HASH GROUP BY     |       |     3 |    15 |     3  (34)| 00:00:01 |

|   5 |    TABLE ACCESS FULL|  EMP  |    14 |    70 |     2   (0)| 00:00:01 |

----------------------------------------------------------------------------

Statistics

----------------------------------------------------------

      0  recursive calls

      0  db block gets

      4  consistent gets

      0  physical reads

      0  redo size

    819  bytes sent via SQL*Net to client

    519  bytes received via SQL*Net from client

      2  SQL*Net roundtrips to/from client

      0  sorts (memory)

      0  sorts (disk)

      8  rows processed

和rollup不同的是，grouping sets的效率竟然比同等功能的union all语句低，这实现有点出乎意料。看来，也不可盲目应用Oracle提供的方案，至少，在本例中是如此。

GROUP BY的扩展的更多相关文章

报表开发之扩展GROUP BY
在实际运用中.比方在数据仓库中,常常须要对数据进行多维分析.不仅须要标准分组的结果(相当于 GROUP BY),还须要不同维度的小计(简单 GROUP BY 中取部分列分组)和合计(不分组).从而提 ...
mysql5.5手册读书日记(3)
<?php /* MySQL_5.5中文参考手册 587开始与GROUP BY子句同时使用的函数和修改程序 12.10.1. GROUP BY(聚合)函数 12.10.2. GROUP BY修 ...
oracle 高级分组
oracle 高级分组博客分类: 数据库基础 oraclesql 10.高级分组本章目标: 对于增强的group by需要掌握: 1.使用rollup(也就是roll up累计的意思)操作产生s ...
spark2.2 DataFrame的一些算子操作
Spark Session中的DataFrame类似于一张关系型数据表.在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现.可以参考,Scala提供的Dat ...
Spark-SQL之DataFrame操作大全
Spark SQL中的DataFrame类似于一张关系型数据表.在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现.可以参考,Scala提供的DataFra ...
python新手菜鸟之基础篇
s=0 for i in range(1,101): s += i else: print(s) def main(n): '''打印菱形图形''' for i in range(n): print( ...
Spark-SQL之DataFrame操作
Spark SQL中的DataFrame类似于一张关系型数据表.在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现.可以参考,Scala提供的DataFra ...
Linux系统编程【转】
转自:https://blog.csdn.net/majiakun1/article/details/8558308 一.Linux系统编程概论 1.1 系统编程基石 syscall: libc:标准 ...
[转]详解Oracle高级分组函数(ROLLUP, CUBE, GROUPING SETS)
原文地址:http://blog.csdn.net/u014558001/article/details/42387929 本文主要讲解 ROLLUP, CUBE, GROUPING SETS的主要用 ...

随机推荐

Centos7强制卸载Mariadb
之前安装过Mariadb 10.2.1版本,现在安装10.1.19版本,提示安装成功了,其实是失败的.MariaDB-server 提示已经安装,通过 rpm qa|grep MariaDB 查看发 ...
Python 爬虫3——第一个爬虫脚本的创建
在进行真正的爬虫工程创建之前,我们先要明确我们所要操作的对象是什么?完成所有操作之后要获取到的数据或信息是什么? 首先是第一个问题:操作对象,爬虫全称是网络爬虫,顾名思义,它所操作的对象当然就是网页, ...
STM32_RTC君
五一假期已过,大家是否还像五一五二五三那样快乐呢??答案就交给你们自己寻找了哈..说到五一..就从五一开始的那一刻起..就开始计时着..到五一假期结束..呵呵..在这里,智商和情商比我高的人估计又猜到 ...
使用post方式提交表单如何获取图片数据及其他文本参数[NodeJS]
当POST方式提交包含图片的表单时,如上传图片时,需要在<form>字段需要添加参数enctype="multipart/form-data",表明以二进制方式传输数据 ...
Probe在性能测试中的使用方式简介
简介: Lambda Probe(以前称为Tomcat Probe)是一款实时监控和管理的Apache Tomcat实例的基本工具. Lambda Probe 是基于 Web + AJAX 的强大的免 ...
MUI框架---实现百度地图定位功能
1 2 <script type="text/javascript" src="http://api.map.baidu.com/api?v=2.0&ak= ...
Struts2使用demo
创建一个web project: 导入Struts2的jar包放到lib目录下: WEB-INF下面创建login.jsp和welcome.jsp;index.jsp删掉: 说一下<%@ tag ...
window.onload与$(document).ready()的区别
对于很多初学者来说,window.onload出现在代码中的频率非常高,这似乎变成了一种习惯,可是并不知道具体为什么要加这句代码,可以做几个试验对比: 实验一: <script> docu ...
ASP.NET Core Linux下为 dotnet 创建守护进程（必备知识）
前言在上篇文章中介绍了如何在 Docker 容器中部署我们的 asp.net core 应用程序,本篇主要是怎么样为我们在 Linux 或者 macOs 中部署的 dotnet 程序创建一个守护进程 ...
.net core中使用openssl的公钥私钥进行加解密
这篇博文分享的是 C#中使用OpenSSL的公钥加密/私钥解密一文中的解决方法在 .net core 中的改进.之前的博文针对的是 .NET Framework ,加解密用的是 RSACryptoS ...

GROUP BY的扩展

GROUP BY的扩展的更多相关文章

随机推荐

热门专题