跟我一起读postgresql源码(十二)——Executor(查询执行模块之——Materialization节点(下))
接前文,我们继续说剩下的4个Materialization节点。
7.SetOp节点
SetOp节点用于处理集合操作,对应于SQL语句中的EXCEPT、INTERSECT两种集合操作,至于另一种集合操作UNION,可直接由Append节点来实现。
一个SetOp节点只能处理一个集合操作(由两个集合参与),如果有多个集合操作则需要组合多个SetOp节点来实现。SetOp节点仅有一个左子节点作为输人,其左子节点是一个Append节点或者是一个Sort节点(Sort节点的子节点是一个Append节点),其低层的Append节点中只放置两个子计划用于表示参与集合操作的左集合和右集合。由于进行集合操作时需要区分元组来自哪一个子査询,因此在低层Append节点的投影操作时会为每个子计划输出元组增加一个子计划标记属性(见下面的例子)。
postgres=# explain (select id from test_dm) except (select id from test_dm2);
QUERY PLAN
-----------------------------------------------------------------------------------------
HashSetOp Except (cost=0.00..383303.38 rows=1000000 width=4)
-> Append (cost=0.00..355803.34 rows=11000017 width=4)
-> Subquery Scan on "*SELECT* 1" (cost=0.00..32346.00 rows=1000000 width=4)
-> Seq Scan on test_dm (cost=0.00..22346.00 rows=1000000 width=4)
-> Subquery Scan on "*SELECT* 2" (cost=0.00..323457.34 rows=10000017 width=4)
-> Seq Scan on test_dm2 (cost=0.00..223457.17 rows=10000017 width=4)
(6 行)
SetOp有两种执行策略:排序(SETOP_SORTED)和Hash (SETOP_HASHED)。
排序策略下首先利用Sort节点对Append节点返回的元组集合进行排序,然后进行交、差的集合操作;
Hash策略下则通过SetOp节点提供Hash表对子査询元组进行Hash分组,然后进行集合操作。
在Hash策略下,SetOp节点的左子节点就是Append节点。在SetOp执行过程中需要附加子计划标记属性,这个属性在输人元组中的偏移位置被记录在SetOp节点的flagColIdx字段中。SetOp节点的定义如下:
typedef struct SetOp
{
Plan plan;
SetOpCmd cmd; /* what to do */
SetOpStrategy strategy; /* how to do it */
int numCols; /* number of columns to check for
* duplicate-ness */
AttrNumber *dupColIdx; /* their indexes in the target list */
Oid *dupOperators; /* equality operators to compare with */
AttrNumber flagColIdx; /* where is the flag column, if any */
int firstFlag; /* flag value for first input relation */
long numGroups; /* estimated number of groups in input */
} SetOp;
其中除了标志属性的位置外,还有用于去重的属性号数组(dupColIdx)和相应的操作符OID数组(dupOperators)等信息,这两个数组用于判断元组是否相同。
typedef struct SetOpStatePerGroupData
{
long numLeft; /* number of left-input dups in group */
long numRight; /* number of right-input dups in group */
} SetOpStatePerGroupData;
SetOp节点在执行时会对从左子节点中取到的每一个元组,会使用一个SetOpStatePerGroupData结构(该结构会在每次获取元组时复用)来存储每个元组的状态。具体地就是利用numLeft和numRight变量来记录该元组在左集合和右集合中出现的次数,然后根据集合操作命令的类型来确定该元组是否应该作为结果元组返回:
typedef enum SetOpCmd
{
SETOPCMD_INTERSECT,
SETOPCMD_INTERSECT_ALL,
SETOPCMD_EXCEPT,
SETOPCMD_EXCEPT_ALL
} SetOpCmd;
1)SETOPCMD_INTERSECT:对应INTERSECT操作,最后的结果集合中不会有重复元组。其实现方式是,如果一个元组的numLeft和mimRight都大于0,则只输出一次该元组。
2)SETOPCMD_INTERSECT_ALL:对应于INTERSECT ALL操作,最后的结果集中允许有重复元组。其实现方式是,输出该元组的次数以rmmLeft和mimRight的较小者为准。
3)SETOPCMD_EXCEPT:对应于EXCEPT操作,表示要求返回只出现在左集合中的元组,且结果集合中不存在重复元组。如果一个元组的mimLeft大于0而mimRight等于0,则输出一次该元组。
4)SETOPCMD_EXCEPT_ALL:对应于EXCEPT ALL操作,结果集合中允许存在重复元组。如果一个元组的numLeft不小于numRight,则输出numLeft - numRight次该元组。
SETOP_SORTED策略的下层节点已经将需要执行的集合的操作合并在一起并进行了排序,SetOp 节点需要做的事情类似于 Group 节点:首先从下层节点获取一个分组的元组,仅缓存第一条元组,然后统计它在左右集合中的出现次数,然后通过集合操作的命令类型来决定如何返回元组。
SETOP_HASHED策略的下层节点会依次返回两个子计划(对应于左右两个集合)中的元组。首先计算左集合中每个元组的Hash值,如果Hash表中没有,则插人Hash表中,否则,将其中Hash项内mimLeft计数加1。然后扫描右集合,计算Hash值后在Hash表中査找,找到则对numRight计数加1,否则,不进行任何操作。扫描完成后,会依次从Hash表中获取元组和其对应的numLeft和numRight,根据集合操作的命令类型来决定如何返回元组。
8.Limit节点
Limit节点主要用来处理LIMIT/OFFSET子句,它从下层节点的输出中挑选处于一定范围内的元组(见下面的例子)。该节点只有一个左子节点。
postgres=# explain select id from test_new limit 5 ;
QUERY PLAN
------------------------------------------------------------------
Limit (cost=0.00..0.07 rows=5 width=4)
-> Seq Scan on test_new (cost=0.00..35.50 rows=2550 width=4)
(2 行)
Limit节点定义如下所示,它在Plan的基础上扩展定义了limitOffset和limitCount两个表达式,用于计算偏移量和需要返回元组的数量。
typedef struct Limit
{
Plan plan;
Node *limitOffset; /* OFFSET parameter, or NULL if none */
Node *limitCount; /* COUNT parameter, or NULL if none */
} Limit;
在初始化过程中,会对Limit节点的limitOffset和limitCount两个表达式进行初始化,结果保存于LimitState节点的limitOffset和limitCount 字段中。
typedef struct LimitState
{
PlanState ps; /* its first field is NodeTag */
ExprState *limitOffset; /* OFFSET parameter, or NULL if none */
ExprState *limitCount; /* COUNT parameter, or NULL if none */
int64 offset; /* current OFFSET value */
int64 count; /* current COUNT, if any */
bool noCount; /* if true, ignore count */
LimitStateCond lstate; /* state machine status, as above */
int64 position; /* 1-based index of last tuple returned */
TupleTableSlot *subSlot; /* tuple last obtained from subplan */
} LimitState;
在执行过程中,需要首先计算LimitState中的limitOffset和limitCount表达式,将结果保存于offset和count中,然后开始从下层节点获取元组,通过portion记录已获取的元组数目,跳过前offset个元组,从offset + 1个元组开始返回,并在offset + count处直接返回空元组。
Limit节点的执行函数ExecLimit主要地就是根据子查询过滤获取元组,根据LIMIT节点当前的状态(LimitStateCond)做出不同的处理。
typedef enum
{
LIMIT_INITIAL, /* initial state for LIMIT node */
LIMIT_RESCAN, /* rescan after recomputing parameters */
LIMIT_EMPTY, /* there are no returnable rows */
LIMIT_INWINDOW, /* have returned a row in the window */
LIMIT_SUBPLANEOF, /* at EOF of subplan (within window) */
LIMIT_WINDOWEND, /* stepped off end of window */
LIMIT_WINDOWSTART /* stepped off beginning of window */
} LimitStateCond;
我们需要注意的是,当下层节点是Sort时,要做一个小小的“优化”(pass_down_bound函数):即如果指定了limit数和offset数,那么我们就知道我们到底需要多少个排序好的元组,那么Sor节点就可以采取相应的策略,选取合适的排序方法(bounded sort),详情见Sort节点中的puttuple_common函数,同样在这篇里面有。
9.WindowAgg节点
先上例子:
postgres=# explain select avg(id) OVER ( PARTITION BY xxx) from test_dm;
QUERY PLAN
------------------------------------------------------------------------------
WindowAgg (cost=122003.84..139503.84 rows=1000000 width=23)
-> Sort (cost=122003.84..124503.84 rows=1000000 width=23)
Sort Key: xxx
-> Seq Scan on test_dm (cost=0.00..22346.00 rows=1000000 width=23)
(4 行)
WindowAgg节点用于处理窗口函数,窗口函数用于在与当前元组相关的一组元组上执行相关函数计算(包括在GROUP BY中使用的聚集函数)。窗口函数的使用类似于“SELECT ..., avg (x) OVER (PARTITION BY y) FROM x;” 的方式。
通常,GROUP BY子句存在时,查询无法投影非分组属性,非分组属性只能出现在聚集函数中。在实际应用中可能需要投影非分组属性,例如,表class记录了班级(cno)、民族(nation)、人数(mim),若需要统计班级中的各民族所占比例,使用GROUP BY就无法实现,如果使用窗口函数,可以使用如下语句:
SELECT cnof nation, mim/sum(nuin) OVER (PARTITION BY cno)AS present FROM class;
上面的SQL语句中,将sum函数运用在与当前元组具有相同cno的一组元组上,并利用此聚合得到的总人数,计算出当前人数在总人数中的比例。这样能够实现更加灵活的函数操作,提供了更加丰富的査询方法。
窗口函数与在GROUP分组中进行聚集计算的不同主要体现在SQL语义上,在聚集函数的计算上两者是相似的。窗口函数需要处理与当前元组相关联的一组元组,在实现中要保留同一划分内的所有元组,计算得到聚集函数值后,再进行相关的投影操作。因此,在实现方法上,不论是PARTITION还是GROUP都需要先将元组在分组属性上进行划分,在分组过程和聚集函数计算的实现上是相似的。
WindowAgg节点实现的功能类似于Agg节点,但不同点在于窗口函数不会造成同一分组中的元组被合并为一个,因此每个元组都可以生成一个结果元组,并可包含相关的聚集运算结果。WindowAgg节点只有一个左子节点,用于提供已经在分组属性(PARTITION BY所指定的属性)上排序的元组。
如下图所示,WindowAgg节点定义中包含用于存储分区函数和所对应属性号的数组 partOperalors 和 partColIdx、数组长度partNumCds以及在排序属性上判断是否相等的函数和相应的属性号数组ordlOperators 和 ordColIdx,数组长度用 ordNumCols记录。

窗口函数也使用了 Agg节点的聚集函数迭代计算方法,其实现方式是在Agg节点的AGG_SORTED策略的执行中增加了缓存分组内所有元组的tuplestore结构,保存于状态节点中的buffer字段中。由于窗口函数不仅包含Agg中支持的聚集函数,还有新的窗口函数模式(能够支持随机的在分组内获取元组等),因此,在从Plan的targellist中获取WindowFimc,并将其信息初始化为perfunc指向的WindowStatePerFunc数组后,需要将传统的聚集函数构造成新的WindowSlatePerAgg链表,以便在调用聚集函数处理过程中使用与Agg节点相同的方式。
初始化过程中,通过WindowAgg节点的targetlist构造funcs链表,其中包含窗口函数的表达式树。然后对funcs指向的表达式树进行初始化,构造函数相关调用信息存放于perfunc指向的数组中。对于传统的聚集函数,将在peragg中另外多初始化一个与Agg节点处理聚集函数时相同的数据结构,用于执行聚集计算。然后要对于分区判断函数和排序属性是否相等的操作函数进行初始化,分别保存于 perEqfuctions 和 ordEqfuntions 中。
在执行过程中,首先初始化一个tuplestore结构用于缓存元组,使用perEqfunctions判断是否在分区内:
1)如果有传统的聚集类函数,获取分区内的所有元组缓存于tuplestore中。然后计算其聚集函数值,并将该值保存在对应函数信息WindowStatePerAgg结构的resultValue中。依次获取分区每条元组,计算窗口函数,使用缓存的聚集函数结果进行投影。
2)否则,直接扫描分区每条元组,计算该窗口函数,并对结果元组进行投影后返回。
10.LockRows节点
关于这个节点,我查了下用户手册,发现它是用来支持Postgres中的行级锁,详情见http://www.postgres.cn/docs/9.5/explicit-locking.html
上例子:
postgres=# explain select id from test_new where id < 5 for share;
QUERY PLAN
------------------------------------------------------------------
LockRows (cost=0.00..50.38 rows=850 width=10)
-> Seq Scan on test_new (cost=0.00..41.88 rows=850 width=10)
Filter: (id < 5)
(3 行)
LockRows节点在Plan节点的基础上扩展了两个字段,rowMarks记录的是该rowMarks节点所锁定的关系(relation)的列表;epqParam参数我们不会陌生了,它是和EvalPlanQual函数相关的,以后我们看到参数名里面有EPQ的我们就知道他就是做recheck相关的工作的参数。
(关于EvalPlanQual函数,我们可以看src/backend/executor/README文件的EvalPlanQual (READ COMMITTED Update Checking)部分,或者直接EvalPlanQual的源码。)
typedef struct LockRows
{
Plan plan;
List *rowMarks; /* a list of PlanRowMark's */
int epqParam; /* ID of Param for EvalPlanQual re-eval */
} LockRows;
这样我们就知道,这个节点的事情很简单,就是以指定的方式(FOR SHARE/FOR UPDATE)锁住Postgres表中的一些行的操作。
在初始化时,初始化LockRowsState结构。为其创建outer plan,创建为锁表而使用的工作空间(初始化lr_curtuples和lr_ntables)。根据全局状态Estate中es_rowMarks的字段,定位到每个ExecRowMark结构并为其构造ExecAuxRowMark结构,最后调用EvalPlanQualInit为其初始化EPQ(又是EPQ).
typedef struct LockRowsState
{
PlanState ps; /* its first field is NodeTag */
List *lr_arowMarks; /* List of ExecAuxRowMarks */
EPQState lr_epqstate; /* for evaluating EvalPlanQual rechecks */
HeapTuple *lr_curtuples; /* locked tuples (one entry per RT entry) */
int lr_ntables; /* length of lr_curtuples[] array */
} LockRowsState;
在执行时,简而言之就是根据所要求的锁定的方式,锁定子节点输出的元组并将该元组返回到上层。
在结束时,由于初始化了EPQ,所以结束时要额外调用EvalPlanQualEnd结束EPQ结构。
Materialization节点就是这么多~
跟我一起读postgresql源码(十二)——Executor(查询执行模块之——Materialization节点(下))的更多相关文章
- 跟我一起读postgresql源码(十四)——Executor(查询执行模块之——Join节点(下))
3.HashJoin 节点 postgres=# explain select a.*,b.* from test_dm a join test_dm2 b on a.xxx = b.xxx; QUE ...
- 跟我一起读postgresql源码(十六)——Executor(查询执行模块之——control节点(下))
5.ModifyTable节点 先看一个ModifyTable节点的例子: postgres=# explain update test_01 set id = 5 where name = 'xxx ...
- 跟我一起读postgresql源码(十五)——Executor(查询执行模块之——control节点(上))
控制节点 控制节点用于完成一些特殊的流程执行方式.由于PostgreSQL为査询语句生成二叉树状的査询计划,其中大部分节点的执行过程需要两个以内的输入和一个输出.但有一些特殊的功能为了优化的需要,会含 ...
- 跟我一起读postgresql源码(十)——Executor(查询执行模块之——Scan节点(下))
接前文跟我一起读postgresql源码(九)--Executor(查询执行模块之--Scan节点(上)) ,本篇把剩下的七个Scan节点结束掉. T_SubqueryScanState, T_Fun ...
- 跟我一起读postgresql源码(十一)——Executor(查询执行模块之——Materialization节点(上))
物化节点 顾名思义,物化节点是一类可缓存元组的节点.在执行过程中,很多扩展的物理操作符需要首先获取所有的元组后才能进行操作(例如聚集函数操作.没有索引辅助的排序等),这时要用物化节点将元组缓存起来.下 ...
- 跟我一起读postgresql源码(九)——Executor(查询执行模块之——Scan节点(上))
从前面介绍的可优化语句处理相关的背景知识.实现思想和执行流程,不难发现可优化语句执行的核心内容是对于各种计划节点的处理,由于使用了节点表示.递归调用.统一接口等设计,计划节点的功能相对独立.代码总体流 ...
- 跟我一起读postgresql源码(十三)——Executor(查询执行模块之——Join节点(上))
Join节点 JOIN节点有以下三种: T_NestLoopState, T_MergeJoinState, T_HashJoinState, 连接类型节点对应于关系代数中的连接操作,PostgreS ...
- 跟我一起读postgresql源码(八)——Executor(查询执行模块之——可优化语句的执行)
2.可优化语句的执行 可优化语句的共同特点是它们被查询编译器处理后都会生成査询计划树,这一类语句由执行器(Executor)处理.该模块对外提供了三个接口: ExecutorStart.Executo ...
- 跟我一起读postgresql源码(五)——Planer(查询规划模块)(下)
上一篇我们介绍了查询规划模块的总体流程和预处理部分的源码.查询规划模块再执行完预处理之后,可以进入正式的查询规划处理流程了. 查询规划的主要工作由grouping_planner函数完成.在具体实现的 ...
随机推荐
- ABP .Net Core 部署到IIS 问题汇总
在ABP官网创建一个.Net Core项目编译完成 1. 发布网站 2. IIS新建站点 目录指向发布的目录 3.安装WindowsHosting IIS安装服务器上安装DotNetCore.X.X. ...
- 一张图讲清楚TCP流量控制
- lua 实现tableToString
function tableToString(studentNum) local str = "{ " str = str.."\n" for k, v in ...
- C# DataGridView 列的显示顺序
this.dataGridView1.Columns["列名"].DisplayIndex=Convert.ToInt32("你要放置的位置")
- NoFragment重大bug
在activity中切换fragment,有以下几点问题需要注意: 例如做一个类似于这样的tab切换fragment的,有以下几点问题 1.切换fragment后,前几个fragment能透视,解决方 ...
- python中顺序查找分析和实现
顺序查找算法是一种很基本的查找算法,该算法的复杂度一般是最大是O(n),假如加上顺序查找,算法的复杂度 还要降一倍,为O(n/2). Python的代码实现如下所示: def sequential_s ...
- MicroPython教程之TPYBoard v102 CAN总线通信
0x00前言 CAN是控制器局域网络(ControllerAreaNetwork,CAN)的简称,是ISO国际标准化的串行通信协议.CAN总线结构简单,只需2根线与外部相连,并且内部集成了错误探测和管 ...
- 嵌入式linux下wifi网卡的使用(二)——应用程序iw编译
首先编译iw,Iw支持两种加密/认证方式.第一种是OPEN/OPEN 第二种是WEP/WEP在网上下载iw源码,发现iw的编译需要依赖libnl库(这个库是为了方便应用程序使用netlink借口而开发 ...
- 【读书笔记与思考】《python数据分析与挖掘实战》-张良均
[读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...
- Yarn篇--搭建yran集群
一.前述 有了上次hadoop集群的搭建,搭建yarn就简单多了.废话不多说,直接来 二.规划 三.配置如下 yarn-site.xml配置 <property> <n ...