为什么Index Only Scan却还需要访问表

在实际SQL优化工作中，我们经常会发现SQL 执行计划明明是 “Index Only Scan”，但执行计划后面却有 “Heap Fetches: x” ，也就是说实际执行计划还是访问了表记录。这是为什么了？

一、举个例子

1、创建数据

create table t1(id1 integer,id2 integer,name text);

insert into t1 select generate_series(1,100),generate_series(1,100),repeat('a',1000);

create index ind_t1 on t1(id1,id2);

2、查看执行计划

test=# explain analyze select id2 from t1 where id1=1;

                                                   QUERY PLAN

----------------------------------------------------------------------------------------------------------------

 Index Only Scan using ind_t1 on t1  (cost=0.14..8.16 rows=1 width=4) (actual time=0.024..0.025 rows=1 loops=1)

   Index Cond: (id1 = 1)

   Heap Fetches: 1

 Planning Time: 0.286 ms

 Execution Time: 0.044 ms

(5 rows)

可以看到，虽然SQL 只访问一条记录，但 heap fetches 值是 1 ，也就是实际需要访问表。

3、原因分析

test=# select pg_relation_filepath('t1');

 pg_relation_filepath

----------------------

 base/16089/16428

(1 row)

查看该路径下是否有 vm 文件。没有visibility map，postgresql就不知道是否所有的行对当前事务都是可见的，因此需要去访问表获取数据。只有fsm ，没有vm

[kb21@dbhost03 data]$ ls -l base/16089/16428*

-rw------- 1 kb21 kb21 122880 Sep 20 09:54 base/16089/16428

-rw------- 1 kb21 kb21  24576 Sep 20 09:54 base/16089/16428_fsm

4、vacuum 后执行计划

test=# vacuum analyze t1;

VACUUM

test=# explain analyze select id2 from t1 where id1=1;

                                                   QUERY PLAN

----------------------------------------------------------------------------------------------------------------

 Index Only Scan using ind_t1 on t1  (cost=0.14..4.16 rows=1 width=4) (actual time=0.011..0.012 rows=1 loops=1)

   Index Cond: (id1 = 1)

   Heap Fetches: 0

 Planning Time: 0.249 ms

 Execution Time: 0.031 ms

(5 rows)

vacuum 后，heap fetches 变为 0

二、进一步分析

1、通过 sys_visibility 扩展进行分析

test=# create extension  sys_visibility;

CREATE EXTENSION

test=# \dx+ sys_visibility

     Objects in extension "sys_visibility"

              Object description

-----------------------------------------------

 function pg_check_frozen(regclass)

 function pg_check_visible(regclass)

 function pg_truncate_visibility_map(regclass)

 function pg_visibility_map(regclass)

 function pg_visibility_map(regclass,bigint)

 function pg_visibility_map_summary(regclass)

 function pg_visibility(regclass)

 function pg_visibility(regclass,bigint)

pg_visibility_map 函数的参数：regclass, blkno bigint, all_visible OUT boolean, all_frozen OUT boolean

2、删除记录

test=# begin;

BEGIN

test=# delete from t1 where id1=1;

DELETE 1

test=# rollback;

ROLLBACK

test=# select pg_visibility_map('t1'::regclass, 0);

 pg_visibility_map

-------------------

 (f,f)

(1 row)


test=# select pg_visibility_map('t1'::regclass, 1);

pg_visibility_map

-------------------

(t,f)

(1 row)

因为id1=1 是在数据块0，因此，数据块并不是all visible

3、验证执行计划

test=# explain analyze select id2 from t1 where id1=1;

                                                   QUERY PLAN

----------------------------------------------------------------------------------------------------------------

 Index Only Scan using ind_t1 on t1  (cost=0.14..4.16 rows=1 width=4) (actual time=0.016..0.017 rows=1 loops=1)

   Index Cond: (id1 = 1)

   Heap Fetches: 1

 Planning Time: 0.054 ms

 Execution Time: 0.033 ms

(5 rows)

test=# explain analyze select distinct id1,id2 from t1;

                                                        QUERY PLAN

--------------------------------------------------------------------------------------------------------------------------

 Unique  (cost=0.14..10.14 rows=100 width=8) (actual time=0.014..0.042 rows=100 loops=1)

   ->  Index Only Scan using ind_t1 on t1  (cost=0.14..9.64 rows=100 width=8) (actual time=0.013..0.024 rows=100 loops=1)

         Heap Fetches: 7

 Planning Time: 0.057 ms

 Execution Time: 0.060 ms

(5 rows)

test=# vacuum analyze t1;

VACUUM

test=# explain analyze select distinct id1,id2 from t1;

                                                        QUERY PLAN

--------------------------------------------------------------------------------------------------------------------------

 Unique  (cost=0.14..10.14 rows=100 width=8) (actual time=0.009..0.034 rows=100 loops=1)

   ->  Index Only Scan using ind_t1 on t1  (cost=0.14..9.64 rows=100 width=8) (actual time=0.008..0.017 rows=100 loops=1)

         Heap Fetches: 0

 Planning Time: 0.213 ms

 Execution Time: 0.051 ms

(5 rows)

至于在Vacuum之前 heap fetches 为什么是 7 , 没搞明白。但明确的是vacuum 之后，heap fectches 变为0.

为什么Index Only Scan却还需要访问表的更多相关文章

Index Full Scan vs Index Fast Full Scan-1103
[Oracle] Index Full Scan vs Index Fast Full Scan作者:汪海 (Wanghai) 日期:14-Aug-2005 出处:http://spaces.msn. ...
index full scan/index fast full scan/index range scan
**************************1************************************* 索引状态: valid. N/A . ...
索引跳跃式扫描（INDEX SKIP SCAN）
索引跳跃式扫描(INDEX SKIP SCAN) 索引跳跃式扫描(INDEX SKIP SCAN)适用于所有类型的复合B树索引(包括唯一性索引和非唯一性索引),它使那些在where条件中没有对目标索引 ...
index unique scan 与index range scan等的区别
存取Oracle当中扫描数据的方法(一) Oracle 是一个面向Internet计算环境的数据库.它是在数据库领域一直处于领先地位的甲骨文公司的产品.可以说Oracle关系数据库系统是目前世界上流行 ...
PostgreSQL执行计划：Bitmap scan VS index only scan
之前了解过postgresql的Bitmap scan,只是粗略地了解到是通过标记数据页面来实现数据检索的,执行计划中的的Bitmap scan一些细节并不十分清楚.这里借助一个执行计划来分析bitm ...
Oracle 11G INDEX FULL SCAN 和 INDEX FAST FULL SCAN 对比分析
SQL> drop table test; 表已删除. SQL> create table test as select * from dba_objects where 1!=1; 表已 ...
【每日一摩斯】-Index Skip Scan Feature (212391.1)
INDEX Skip Scan,也就是索引快速扫描,一般是指谓词中不带复合索引第一列,但扫描索引块要快于扫描表的数据块,此时CBO会选择INDEX SS的方式. 官方讲的,这个概念也好理解,如果将复合 ...
INDEX FAST FULL SCAN和INDEX FULL SCAN
INDEX FULL SCAN 索引全扫描.单块读 .它扫描的结果是有序的,因为索引是有序的.它通常发生在下面几种情况(注意:即使SQL满足以下情况不一定会走索引全扫描) 1. SQL语句有ord ...
index unique scan
INDEX UNIQUE SCAN 索引唯一扫描.单块读只可能发生在unique index/primary key 等值查找等待事件:db file s ...

随机推荐

重学ES系列之过滤数组
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
C语言求100以内的和的4种方式
C语言的一个很经典的例子,帮助熟练运行几个循环的写法 * 方法一(do---while语句) #include main () { int i,sum=0; do { sum=sum+i; i++; ...
一切皆为字节和字节输出流_OutputStream类&FileOutputStream类介绍
一切皆为字节一切文件数据(文本.图片.视频等)在存储时,都是以二进制数字的形式保存,都一个一个的字节,那么传输时一样如此.所以,字节流可以传输任意文件数据.在操作流的时候,我们要时刻明确,无论使用什 ...
java通过注解指定顺序导入excel
自定义的属性,用来判断顺序的 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; impor ...
分析 java.util.Hashtable 源码
概述基于J11,该类已经淘汰,如果使用线程安全的则用 ConcurrentHashMap ,用线程不安全的则使用 HashMap .仅与HashMap进行比较结构以及依赖关系 HashTable ...
Identity Server 4使用OpenID Connect添加用户身份验证(三)
一.说明基于上一篇文章中的代码进行继续延伸,只需要小小的改动即可,不明白的地方可以先看看本人上一篇文章及源码: Identity Server 4资源拥有者密码认证控制访问API(二) GitHub ...
年中盘点 | 2022年，PaaS 再升级
作者丨刘世民(Sammy Liu)全文共7741个字,预计阅读需要15分钟过去十五年,是云计算从无到有突飞猛进的十五年.PaaS作为云计算的重要组成部分,在伴随着云计算高速发展的同时,在云计算产业链 ...
金玉良缘易配而木石前盟难得|M1 Mac os(Apple Silicon)天生一对Python3开发环境搭建(集成深度学习框架Tensorflow/Pytorch)
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_189 笔者投入M1的怀抱已经有一段时间了,俗话说得好,但闻新人笑,不见旧人哭,Intel mac早已被束之高阁,而M1 mac已经 ...
协程 && 异步例子
# 异步redis # 在使用python代码操作redis的时候,连接.操作.断开都是网络IO. # 安装aioredis模块: pip install aioredis==1.3.1 # 例: 该 ...
Win10使用fvm管理多个Flutter版本
Win10使用fvm管理多个Flutter版本参考:https://blog.csdn.net/PyMuma/article/details/115298645 1.升级Flutter 由于现在的f ...