全局索引与分区索引对于SQL性能影响的比较

KingbaseES 提供了对于分区表 global index 的支持。global index 不仅提供了对于唯一索引功能的改进（无需包含分区键），而且在性能上相比非global index （local index）有很大的提升（无法提供分区条件情况下）。以下举例说明二者在性能方面的差异。

1、准备数据

create table t1(id1 integer,id2 integer,name text) partition by hash(id1) partitions 200;

insert into t1 select generate_series(1,10000000),generate_series(1,10000000),repeat('a',500);

2、本地索引的性能

没有提供分区条件时

create index ind_t1_id2 on t1(id2);

test=# \di+ ind_t1_id2

                                List of relations

 Schema |    Name    |       Type        | Owner  | Table |  Size   | Description

--------+------------+-------------------+--------+-------+---------+-------------

 public | ind_t1_id2 | partitioned index | system | t1    | 0 bytes |

(1 row)

test=# explain analyze select * from t1 where id2=10004;

                                                           QUERY PLAN

---------------------------------------------------------------------------------------------------------------------------------

 Append  (cost=0.29..1662.50 rows=200 width=512) (actual time=1.324..3.249 rows=1 loops=1)

   ->  Index Scan using t1_p0_id2_idx on t1_p0  (cost=0.29..8.31 rows=1 width=512) (actual time=0.054..0.055 rows=0 loops=1)

         Index Cond: (id2 = 10004)

   ->  Index Scan using t1_p1_id2_idx on t1_p1  (cost=0.29..8.31 rows=1 width=512) (actual time=0.065..0.065 rows=0 loops=1)

         Index Cond: (id2 = 10004)

   ......

   ->  Index Scan using t1_p198_id2_idx on t1_p198  (cost=0.29..8.31 rows=1 width=512) (actual time=0.031..0.031 rows=0 loops=1)

         Index Cond: (id2 = 10004)

   ->  Index Scan using t1_p199_id2_idx on t1_p199  (cost=0.29..8.31 rows=1 width=512) (actual time=0.025..0.025 rows=0 loops=1)

         Index Cond: (id2 = 10004)

 Planning Time: 39.262 ms

 Execution Time: 5.673 ms

(403 rows)

使用非全局索引，并且没有提供分区条件情况下，优化器需要读取所有索引分区及表分区的统计数据，才能确定最优的执行计划。对于数据访问，同样需要访问所有分区的索引（即使该分区没有所需要的数据）。

提供分区条件时

test=# explain analyze select * from t1 where id2=10004 and id1=10004;

                                                       QUERY PLAN

-------------------------------------------------------------------------------------------------------------------------

 Index Scan using t1_p71_id2_idx on t1_p71  (cost=0.29..8.31 rows=1 width=512) (actual time=0.045..0.046 rows=1 loops=1)

   Index Cond: (id2 = 10004)

   Filter: (id1 = 10004)

 Planning Time: 0.346 ms

 Execution Time: 0.064 ms

(5 rows)

在提供分区条件情况下，只需要访问单个索引分区及表分区的统计数据，因此，所需的语句的解析时间更少。

3、全局索引的性能

create unique index ind_t1_id2 on t1(id2) global;

test=# \di+ ind_t1_id2

                             List of relations

 Schema |    Name    |     Type     | Owner  | Table |  Size  | Description

--------+------------+--------------+--------+-------+--------+-------------

 public | ind_t1_id2 | global index | system | t1    | 215 MB |

(1 row)

test=# explain analyze select * from t1 where id2=10004;

                                                        QUERY PLAN

--------------------------------------------------------------------------------------------------------------------------

 Global Index Scan using ind_t1_id2 on t1  (cost=0.38..8.39 rows=200 width=512) (actual time=0.136..0.137 rows=1 loops=1)

   Index Cond: (id2 = 10004)

 Planning Time: 9.896 ms

 Execution Time: 0.264 ms

(4 rows)

可以SQL 解析与执行时间都比本地索引的情景快很多。

全局索引与分区索引对于SQL性能影响的比较的更多相关文章

oralce索引和分区索引的使用
oracle分区表和分区索引的本质就是将数据分段存储,包括表和索引(索引从本质上来讲也是表),表分区会将表分成多个段分别存储.由此数据查询过程改变为先根据查询条件定位分区表,然后从该表中查询数据,从而 ...
Oracle Spatial分区应用研究之七：同等分区粒度下全局索引优于分区索引的原因分析
1.实验结论同等分区粒度下,使用分区空间索引进行空间查询,比使用全局空间索引进行查询,对数据字典表的访问次数更多.假设分区数为X,则大概多3X次访问.具体说明见6实验结论. 2.实验目的在之前的测 ...
SQL Server创建复合索引时，复合索引列顺序对查询的性能影响
说说复合索引写索引的博客太多了,一直不想动手写,有一下两个原因:一是觉得有炒剩饭的嫌疑,有兄弟曾说:索引吗,只要在查询条件上建索引就行了,真的可以这么暴力吗?二来觉得,索引是个非常大的话题,很难概括 ...
Oracle 分区表的索引、分区索引
对于分区表,可以建立不分区索引.也就是说表分区,但是索引不分区.以下着重介绍分区表的分区索引. 索引与表一样,也可以分区.索引分为两类:locally partition index(局部分区索引). ...
Atitit.分区对索引的影响分区索引和全局索引 attilax总结
Atitit.分区对索引的影响分区索引和全局索引 attilax总结 1. 分区的好处1 2. 分区键:2 3. 分区的建议:2 4. 分区索引和全局索引:2 5. 全局索引就是在全表上创建索引, ...
Oracle非分区索引，全局分区索引和本地分区索引。
1.如果按照索引是否分区作为划分依据,Oracle 的索引类型可以分为非分区索引,全局分区索引和本地分区索引. 2.创建演示实例 --创建非分区表create table test_partition ...
PLSQL_Oracle分区表和相应的分区索引管理和使用（案例）
2014-08-22 Created By BaoXinjian
深入学习Oracle分区表及分区索引
关于分区表和分区索引(About Partitioned Tables and Indexes)对于10gR2而言,基本上可以分成几类: • Range(范围)分区 • Has ...
oracle 分区表和分区索引
很复杂的样子,自己都没有看完,以备后用 http://hi.baidu.com/jsshm/item/cbfed8491d3863ee1e19bc3e ORACLE分区表.分区索引ORACLE对于分区 ...

随机推荐

Spring Data JPA系列2：SpringBoot集成JPA详细教程，快速在项目中熟练使用JPA
大家好,又见面了. 这是Spring Data JPA系列的第2篇,在上一篇<Spring Data JPA系列1:JDBC.ORM.JPA.Spring Data JPA,傻傻分不清楚?给你个 ...
Leetcode 1051. 高度检查器
这题的目的是找出排序后和排序前位置不同的元素的个数正常通过复制出一个新的数组,然后对比排序后的数组就能做出,但是时间是1ms 然后发现一种基于桶排序来计数的做法 public int heightC ...
深入理解springboot的自动注入
一.开篇在平时的开发过程中用的最多的莫属springboot了,都知道springboot中有自动注入的功能,在面试过程中也会问到自动注入,你知道自动注入是怎么回事吗,springboot是如何 ...
IP寻址与规划
一.IP寻址和子网划分 IP地址的主机部分可被分为三种地址:网络地址.主机地址和定向广播地址. 网络地址是网络号中的第一个地址.它用来将网络内的其他所有网段唯一标识为一个网段或广播域.定向广播地址是网 ...
关于我用python表白成功这件事【表白成功】
520,并非情人所属, 我们可以表白万物, 不管什么时候, 这都是一个特别的日子, 今天,我要表白所有, 心里有我的人! 在这个充满幸福的日子里, 我要把最美好的祝福, 送给心里有我的每一个人: 祝愿 ...
从零开始实现lmax-Disruptor队列（四）多线程生产者MultiProducerSequencer原理解析
MyDisruptor V4版本介绍在v3版本的MyDisruptor实现多线程消费者后.按照计划,v4版本的MyDisruptor需要支持线程安全的多线程生产者功能. 由于该文属于系列博客的一部分 ...
使用Thread类和Runnable接口实现多线程的区别
使用Thread类和Runnable接口实现多线程的区别先看两种实现方式的步骤: public class ThreadDemo{ public static void main(String[] ...
DTCC 干货分享：Real Time DaaS - 面向TP+AP业务的数据平台架构
2021年10月20日,Tapdata 创始人唐建法(TJ)受邀出席 DTCC 2021(中国数据库技术大会),并在企业数据中台设计与实践专场上,发表主旨演讲"Real Time Daa ...
Modeling Conversation Structure and Temporal Dynamics for Jointly Predicting Rumor Stance and Veracity（ACL-19）
记录一下,论文建模对话结构和时序动态来联合预测谣言立场和真实性及其代码复现. 1 引言之前的研究发现,公众对谣言消息的立场是识别流行的谣言的关键信号,这也能表明它们的真实性.因此,对谣言的立场分类被 ...
Math类和函数定义
Math这个类是java系统内部当中的一个类,他用来提供一些基本的数学操作,他也有些工具可以给我们用比如 :abs--算绝对值 pow--算幂次 random--随机数 round--四舍 ...