PostgreSQL中的partition-wise aggregation

partition-wise aggregation允许对每个分区分别执行的分区表进行分组或聚合。如果GROUP BY子句不包括分区键，则只能在每个分区的基础上执行部分聚合，并且必须稍后执行最终处理。由于partitionwise分组或聚合可能在计划期间占用大量CPU时间和内存，因此默认设置为关闭。

通过变量enable_partitionwise_aggregate控制是否启用该特性。

创建一个分区表，用于测试：

create table pagg_t (a int, b int, c text, d int) partition by list(c);

create table pagg_t_p1 partition of pagg_t for values in ('000', '001', '002', '003');

create table pagg_t_p2 partition of pagg_t for values in ('004', '005', '006', '007');

create table pagg_t_p3 partition of pagg_t for values in ('008', '009', '010', '011');

insert into pagg_t select i % 20, i % 30, to_char(i % 12, 'fm0000'), i % 30 from generate_series(0, 2999) i;

analyze pagg_t;

postgres=# show enable_partitionwise_aggregate;

 off

postgres=# explain (costs off) select c, sum(a), avg(b), count(*), min(a), max(b) from pagg_t group by c having avg(d) < 15 order by 1, 2, 3;

 Sort

   Sort Key: pagg_t_p1.c, (sum(pagg_t_p1.a)), (avg(pagg_t_p1.b))

   ->  HashAggregate

         Group Key: pagg_t_p1.c

         Filter: (avg(pagg_t_p1.d) < '15'::numeric)

         ->  Append

               ->  Seq Scan on pagg_t_p1

               ->  Seq Scan on pagg_t_p2

               ->  Seq Scan on pagg_t_p3

postgres=#

默认情况下，需要先分别扫描表的所有分区，将分区结果整合在一起（Append），然后执行哈希聚合（HashAggregate），最后进行排序（Sort）。

启用智能分区聚合功能，查看相同的聚合操作：

postgres=# set enable_partitionwise_aggregate=on;

SET

postgres=# show enable_partitionwise_aggregate;

 on

postgres=# explain (costs off) select c, sum(a), avg(b), count(*), min(a), max(b) from pagg_t group by c having avg(d) < 15 order by 1, 2, 3;

 Sort

   Sort Key: pagg_t_p1.c, (sum(pagg_t_p1.a)), (avg(pagg_t_p1.b))

   ->  Append

         ->  HashAggregate

               Group Key: pagg_t_p1.c

               Filter: (avg(pagg_t_p1.d) < '15'::numeric)

               ->  Seq Scan on pagg_t_p1

         ->  HashAggregate

               Group Key: pagg_t_p2.c

               Filter: (avg(pagg_t_p2.d) < '15'::numeric)

               ->  Seq Scan on pagg_t_p2

         ->  HashAggregate

               Group Key: pagg_t_p3.c

               Filter: (avg(pagg_t_p3.d) < '15'::numeric)

               ->  Seq Scan on pagg_t_p3

postgres=#

可以看到，启用该功能之后，先针对表中的所有分区执行哈希聚合（HashAggregate），然后将结果整合在一起（Append），最后进行排序（Sort）。其中，分区级别的聚合可以并行执行，性能会更好。

如果GROUP BY子句中没有包含分区字段，只会基于分区执行部分聚合操作，然后再对结果进行一次最终的聚合。

以下查询使用字段 a 进行分组聚合：

postgres=# explain (costs off) select a, sum(b), avg(b), count(*), min(a), max(b) from pagg_t group by a having avg(d) < 15 order by 1, 2, 3;

 Sort

   Sort Key: pagg_t_p1.a, (sum(pagg_t_p1.b)), (avg(pagg_t_p1.b))

   ->  Finalize HashAggregate

         Group Key: pagg_t_p1.a

         Filter: (avg(pagg_t_p1.d) < '15'::numeric)

         ->  Append

               ->  Partial HashAggregate

                     Group Key: pagg_t_p1.a

                     ->  Seq Scan on pagg_t_p1

               ->  Partial HashAggregate

                     Group Key: pagg_t_p2.a

                     ->  Seq Scan on pagg_t_p2

               ->  Partial HashAggregate

                     Group Key: pagg_t_p3.a

                     ->  Seq Scan on pagg_t_p3

postgres=#

由于字段 a 不是分区键，所以先执行分区级别的部分哈希聚合（Partial HashAggregate），聚合的结果中可能存在相同的分组（不同分区中的字段 a 存在相同的值），需要执行最终的哈希聚合（Finalize HashAggregate）操作。

PostgreSQL中的partition-wise aggregation的更多相关文章

PostgreSQL中的partition-wise join
与基于继承的分区(inheritance-based partitioning)不同,PostgreSQL 10中引入的声明式分区对数据如何划分没有任何影响.PostgreSQL 11的查询优化器正准 ...
PostgreSQL中RECURSIVE递归查询使用总结
RECURSIVE 前言 CTE or WITH 在WITH中使用数据修改语句 WITH使用注意事项 RECURSIVE 递归查询的过程拆解下执行的过程 1.执行非递归部分 2.执行递归部分,如果是 ...
通过arcgis在PostgreSQL中创建企业级地理数据库
部署环境: Win7 64位旗舰版软件版本: PostgreSQL-9.1.3-2-windows-x64 Postgis-pg91x64-setup-2.0.6-1 Arcgis 10.1 SP1 ...
PostgreSQL 中日期类型转换与变量使用及相关问题
PostgreSQL中日期类型与字符串类型的转换方法示例如下: postgres=# select current_date; date ------------ 2015-08-31 (1 row ...
PostgreSQL 中定义自己需要的数据类型
PostgreSQL解决某系数据库中的tinyint数据类型问题,创建自己需要的数据类型如下: CREATE DOMAIN tinyint AS smallint CONSTRAINT tinyint ...
在PostgreSQL中使用oracle_fdw访问Oracle
本文讲述如何在PostgreSQL中使用oracle_fdw访问Oracle上的数据. 1. 安装oracle_fdw 可以参照:oracle_fdw in github 编译安装oracle_fdw ...
[原创]PostgreSQL中十进制、二进制、十六进制之间的相互转换
在PostgreSQL中,二进制.十进制.十六进制之间的转换是非常方便的,如下: 十进制转十六进制和二进制 mydb=# SELECT to_hex(10); to_hex -------- a (1 ...
用python随机生成数据，再插入到postgresql中
用python随机生成学生姓名,三科成绩和班级数据,再插入到postgresql中. 模块用psycopg2 random import random import psycopg2 fname=[' ...
PostgreSQL 中如何实现group_concat
之前在MySQL中使用group_concat,觉得超级好用. 今天在PostgreSQL需要用到这样的场景,就去学习了一下. 在PostgreSQL中提供了arr_agg的函数来实现聚合,不过返回的 ...
Postgresql中临时表（temporary table）的特性和用法
熟悉Oracle的人,相比对临时表(temporary table)并不陌生,很多场景对解决问题起到不错的作用,开源库Postgresql中,也有临时表的概念,虽然和Oracle中临时表名字相同,使用 ...

随机推荐

Abp vNext抽茧剥丝01 使用using临时更改当前租户
在Abp vNext中,如果开启了多租户功能,在业务代码中默认使用当前租户的数据,如果我们需要更改当前租户,可以使用下面的方法 /* 此时当前租户 */ using (CurrentTenant.Ch ...
CentOS 使用163yum源
下载163源 # wget http://mirrors.163.com/.help/CentOS7-Base-163.repo 如果报以下错误 -bash: wget: command not fo ...
H3C 802.11n的频宽模式
【Flask】 python学习第一章 - 4.0 钩子函数和装饰器路由实现 session-cookie 请求上下文
钩子函数和装饰器路由实现 before_request 每次请求都会触发 before_first_requrest 第一次请求前触发 after_request 请求后触发并返回参数 tear ...
Gerrit代码审计系统实战-Gerrit 2.15.14版本快速搭建
Gerrit代码审计系统实战-Gerrit 2.15.14版本快速搭建作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Gerrit版本选择 1>.查看Gerrit官网 ...
python+正则提取+ip代理爬取糗事百科文字信息
很多网站都有反爬措施,最常见的就是封ip,请求次数过多服务器会拒绝连接,如图: 在程序中设置一个代理ip,可有效的解决这种问题,代码如下: # 需要的库 import requests import ...
《exception》第九次团队作业：Beta冲刺与验收准备(第二天)
一.项目基本介绍项目内容这个作业属于哪个课程任课教师博客主页链接这个作业的要求在哪里作业链接地址团队名称 Exception 作业学习目标 1.掌握软件黑盒测试技术:2.学会编制软件项目 ...
Incorrect integer value: '' for column 'id' at row 1 错误解决办法
最近一个项目,在本地php环境里一切正常,ftp上传到虚拟空间后,当执行更新操作(我的目的是为了设置id为空)set id=‘’时提示: Incorrect integer value: '' for ...
Yii集成PHPWord
一.安装 1.下载composer curl -sS https://getcomposer.org/installer | php 将composer.phar文件移动到bin目录以便全局使用com ...
tensorflow2.0 学习（一）
虽说是按<TensorFlow深度学习>这本书来学习的,但是总会碰到新的问题!记录下这些问题,有利于巩固知新. 之前学过一些tensorflow1.0的知识,到RNN这章节,后面没有再继续 ...

PostgreSQL中的partition-wise aggregation

PostgreSQL中的partition-wise aggregation的更多相关文章

随机推荐

热门专题