PostgreSQL 数据库NULL值的默认排序行为与查询、索引定义规范

背景

在数据库中NULL值是指UNKNOWN的值，不存储任何值，在排序时，它排在有值的行前面还是后面通过语法来指定。

例如

-- 表示null排在有值行的前面

select * from tbl order by id nulls first;  

-- 表示null排在有值行的后面

select * from tbl order by id nulls last;

同时对于有值行，可以指定顺序排还是倒序排。

-- 表示按ID列顺序排

select * from tbl order by id [asc];  

-- 表示按ID列倒序排

select * from tbl order by id desc;

默认的排序规则如下：

desc nulls first : null large small    

asc nulls last : small large null

当nulls [first|last]与asc|desc组合起来用时，是这样的。

值的顺序如下：

1、DEFAULT:（认为NULL比任意值都大）

desc nulls first : 顺序：null large small    

asc nulls last   : 顺序：small large null

2、NON DEFAULT: （认为NULL比任意值都小）

desc nulls last : 顺序：large small null       

asc nulls first : 顺序：null small large

由于索引是固定的，当输入排序条件时，如果排序条件与索引的排序规则不匹配时，会导致无法使用索引的实惠（顺序扫描）。导致一些不必要的麻烦。

索引定义与扫描定义不一致引发的问题

1、建表，输入测试数据

create table cc(id int not null);  

insert into cc select generate_series(1,1000000);

2、建立索引（使用非默认配置，null比任意值小）

create index idx_cc on cc (id asc nulls first);  

或  

create index idx_cc on cc (id desc nulls last);

3、查询，与索引定义的顺序（指NULL的相对位置）不一致时，即使使用索引，也需要重新SORT。

select * from table order by id desc nulls first limit 1;

select * from table order by id [asc] nulls last limit 1;

用到了额外的SORT

postgres=# explain (analyze,verbose,timing,costs,buffers) select * from cc order by id limit 1;

                                                                 QUERY PLAN

---------------------------------------------------------------------------------------------------------------------------------------------

 Limit  (cost=27969.43..27969.43 rows=1 width=4) (actual time=263.972..263.972 rows=1 loops=1)

   Output: id

   Buffers: shared hit=7160

   ->  Sort  (cost=27969.43..30469.43 rows=1000000 width=4) (actual time=263.970..263.970 rows=1 loops=1)

         Output: id

         Sort Key: cc.id

         Sort Method: top-N heapsort  Memory: 25kB

         Buffers: shared hit=7160

         ->  Bitmap Heap Scan on public.cc  (cost=8544.42..22969.42 rows=1000000 width=4) (actual time=29.927..148.733 rows=1000000 loops=1)

               Output: id

               Heap Blocks: exact=4425

               Buffers: shared hit=7160

               ->  Bitmap Index Scan on idx_cc  (cost=0.00..8294.42 rows=1000000 width=0) (actual time=29.380..29.380 rows=1000000 loops=1)

                     Buffers: shared hit=2735

 Planning time: 0.098 ms

 Execution time: 264.009 ms

(16 rows)

3、查询，与索引定义一致（指NULL的相对位置）时，索引有效，不需要额外SORT。

select * from table order by id desc nulls last limit 1;

select * from table order by id [asc] nulls first limit 1;

不需要额外SORT

postgres=# explain (analyze,verbose,timing,costs,buffers) select * from cc order by id nulls first limit 1;

                                                              QUERY PLAN

---------------------------------------------------------------------------------------------------------------------------------------

 Limit  (cost=0.42..0.45 rows=1 width=4) (actual time=0.014..0.014 rows=1 loops=1)

   Output: id

   Buffers: shared hit=4

   ->  Index Only Scan using idx_cc on public.cc  (cost=0.42..22719.62 rows=1000000 width=4) (actual time=0.013..0.013 rows=1 loops=1)

         Output: id

         Heap Fetches: 1

         Buffers: shared hit=4

 Planning time: 0.026 ms

 Execution time: 0.022 ms

(9 rows)

小结

在PostgreSQL中顺序、倒序索引是通用的。不同的是null的相对位置。

因此在创建索引时，务必与业务的需求对齐，使用一致的NULL相对顺序(nulls first 或 nulls last 与asc,desc的搭配)（即NULL挨着large value还是small value），而至于值的asc, desc实际上是无所谓的。

如果业务需求的顺序与索引的顺序不一致（指null的相对顺序），那么会导致索引需要全扫，重新SORT的问题。

内核改进

1、当约束设置了not null时，应该可以不care null的相对位置，因为都没有NULL值了，优化器应该可以不管NULL的相对位置是否与业务请求的SQL的一致性，都选择非Sort模式扫描。

2、改进索引扫描方法，支持环形扫描。

参考：
https://github.com/digoal/blog/blob/master/201711/20171111_02.md

注：

如果创建索引时，没有指定null的内容，但where条件部分又使用到了null的排序，那么要将asc|desc 与 last|first对应好，默认对应的操作是：

desc nulls first : null large small    

asc nulls last : small large null

在没有指定null的索引中，按照上面方法对应好即可。
下面是几个测试：

swrd=# \d cc

       Table "swrd.cc"

 Column |  Type   | Modifiers

--------+---------+-----------

 id     | integer | not null

Indexes:

    "cc_id_idx" btree (id)

swrd=# explain (analyze,verbose,timing,costs,buffers)  select * from cc order by id  desc nulls first;

                                                                    QUERY PLAN

---------------------------------------------------------------------------------------------------------------------------------------------------

 Index Only Scan Backward using cc_id_idx on swrd.cc  (cost=0.42..30408.42 rows=1000000 width=4) (actual time=0.044..297.796 rows=1000000 loops=1)

   Output: id

   Heap Fetches: 1000000

   Buffers: shared hit=7159 read=1

 Planning time: 0.113 ms

 Execution time: 387.645 ms

(6 rows)

Time: 388.438 ms

swrd=# explain (analyze,verbose,timing,costs,buffers)  select * from cc order by id  desc nulls last;

                                                       QUERY PLAN

-------------------------------------------------------------------------------------------------------------------------

 Sort  (cost=127757.34..130257.34 rows=1000000 width=4) (actual time=666.996..926.348 rows=1000000 loops=1)

   Output: id

   Sort Key: cc.id DESC NULLS LAST

   Sort Method: external merge  Disk: 13640kB

   Buffers: shared hit=4425, temp read=2334 written=2334

   ->  Seq Scan on swrd.cc  (cost=0.00..14425.00 rows=1000000 width=4) (actual time=0.020..147.384 rows=1000000 loops=1)

         Output: id

         Buffers: shared hit=4425

 Planning time: 0.110 ms

 Execution time: 1027.649 ms

(10 rows)

会发现默认使用没有配置null的索引，但是在where条件中使用到了null，如果不是按照默认的对应顺序使用，则数据库会额外排序，无法使用到索引本身的排序功能。

而对于在创建索引时，指定了null选项，则在where条件中和索引指定的null一致即可。

PostgreSQL 数据库NULL值的默认排序行为与查询、索引定义规范 - nulls first\last, asc\desc的更多相关文章

关于数据库NULL值的几个问题思考
最近在写项目,拼接SQL时,发现好多关于NULL值的问题,现在把这些问题整理出来,以供日后参考. 对于Oracle数据库: 一.排序 Oracle对于null值的排序,有一个函数可以进行操作: 在默认 ...
mysq对存在null值的字段排序
1.建立学生表,建表sql如下: ),age int); 2.插入几条数据,包括id字段值为null的 ,),(,),(,),(),(); 3.我们查询下,可以看到存在id字段为空的值: 4.对学生表 ...
MYSQL数据库性能调优之四：解决慢查询--索引
为什么索引能够提高查询速度?没有索引检索数据的方式是从头到尾一条一条挨着匹配,这是慢的根本原因:索引类型BTREE:二叉树类型,原理图如下:对表创建一个二叉树,记录中间数据的物理磁盘地址,二叉树检索 ...
SQL Server 排序的时候使 null 值排在最后
https://www.cnblogs.com/Brambling/p/7046148.html 最近遇到一个 SQL Server 排序的问题,以前也没了解过,然后这次碰到了. 才发现 SQL Se ...
postgreSQL数据库的初探
kali是黑客的强大武器,还有一个也是哦——Metasploit postgreSQL数据库是Metasploit的默认数据库哦! 启动postgresql: service postgresql s ...
MYSQL NULL值特性
NULL是一种“没有类型”的值,通常表示“无值”,“未知值”,“缺失值”,“超界”,“不在其中”等,我们在日常运用中很容易和NULL字符串混淆,这里大致整理了下NULL值的一些特性,以便能够正确使用N ...
扩展我们的分析处理服务(Smartly.io)：使用 Citus 对 PostgreSQL 数据库进行分片
原文:Scaling Our Analytical Processing Service: Sharding a PostgreSQL Database with Citus 在线广告商正在根据绩效数 ...
Oracle中NULL值与索引
NULL值是关系数据库系统布尔型(true,false,unknown)中比较特殊类型的一种值,通常称为UNKNOWN或空值,即是未知的,不确定的.由于NULL存在着无数的可能,因此NULL值也不等于 ...
Oracle NULL值
NULL值,用来描述记录中没有定义内容的字段值.在Oracle中,判断某个条件的值时,返回值可能是TRUE.FALSE或UNKNOWN. 如果查询一个列的值是否等于20,而该列的值为NULL,那么就是 ...

随机推荐

Java 学习笔记正则表达式
2019.3.27 正则表达式 \w 单词字符,匹配[]a-zA-Z_0-9] \w{3} 表示匹配3个字符()ab8,abc,a_c,a5_...) \w+ 至少一个,1到多个 \w* 0个到n个 ...
Spring，SpringMvc配置常见的坑，注解的使用注意事项，applicationContext.xml和spring.mvc.xml配置注意事项，spring中的事务失效，事务不回滚原因
1.Spring中的applicationContext.xml配置错误导致的异常异常信息: org.apache.ibatis.binding.BindingException: Invalid ...
css重写checkbox样式
一.前言默认的checkbox长这样: <p> <span><input type="checkbox" /></span> &l ...
RPC调用与GC垃圾回收
RPC调用多个服务协同完成一次业务时,由于业务约束(如红包不符合使用条件.账户余额不足等).系统故障(如网络或系统超时或中断.数据库约束不满足等),都可能造成服务处理过程在任何一步无法继续,使数据处 ...
提高 JavaScript 开发效率的高级 VSCode 扩展！
原文:提高 JavaScript 开发效率的高级 VSCode 扩展! 作者:前端小智 Fundebug经授权转载,版权归原作者所有. Quokka.js Quokka.js 是一个用于 JavaSc ...
掌握PHP垃圾回收机制
php的垃圾回收机制可以简单总结为引用计数写时复制 COW机制, 本文主要和大家分享掌握php垃圾回收机制的知识,希望能帮助到大家. 引用计数基本知识官网的解答如下每个php变量存在一个叫”z ...
JS使用cookie实现只出现一次的广告代码效果
我们上网经常会遇到第一次需要登录而之后不用再登录的网站的情况,其实是运用了Cookie 存储 web 页面的用户信息,Cookie 以名/值对形式存储,当浏览器从服务器上请求 web 页面时, 属于该 ...
iphone手机怎么录屏两种方法任你挑选
iphone手机怎么录屏呢?苹果手机拥有独特的Airlay镜像投屏,AirPlay的工作原理是当iPhone或IPAD与支持AirPlay技术的硬件,比如Apple TV等设备处在同一个wife的情况 ...
【vue】使用vue构建多页面应用
先了解一些单页面和多页面的区别 mm 多页应用模式MPA 单页应用模式SPA 应用构成由多个完整页面构成一个外壳页面和多个页面片段构成跳转方式页面之间的跳转是从一个页面跳转到另一个页面页面片 ...
基于Python实现的死链接自动化检测工具
基于Python实现的死链接自动化检测工具 by:授客 QQ:1033553122 测试环境: win7 python 3.3.2 chardet 2.3.0 脚本作用: 检测系统中访问异常(请求 ...

PostgreSQL 数据库NULL值的默认排序行为与查询、索引定义规范 - nulls first\last, asc\desc

背景

索引定义与扫描定义不一致引发的问题

小结

内核改进

注：

PostgreSQL 数据库NULL值的默认排序行为与查询、索引定义规范 - nulls first\last, asc\desc的更多相关文章

随机推荐

热门专题