gin索引优化实例1

GIN(Generalized Inverted Index, 通用倒排索引) 是一个存储对(key, posting list)集合的索引结构，其中key是一个键值，而posting list 是一组出现过key的位置。如(‘hello', '14:2 23:4')中，表示hello在14:2和23:4这两个位置出现过，在PG中这些位置实际上就是元组的tid(行号，包括数据块ID（32bit）,以及item point(16 bit) )。

在表中的每一个属性，在建立索引时，都可能会被解析为多个键值，所以同一个元组的tid可能会出现在多个key的posting list中。

通过这种索引结构可以快速的查找到包含指定关键字的元组，因此GIN索引特别适用于多值类型的元素搜索，比如支持全文搜索，数组中元素的搜索，而PG的GIN索引模块最初也是为了支持全文搜索而开发的。

说到这里，你可能会觉得GIN的结构有点像b+tree，包括KEY和对应的值(posting list)。别急，请继续往下看。

receivers跟reads字段都是数组,使用any函数来查找是个性能差的事情并且加了gin索引CBO也不会用上,使用了2295.317 ms

explain(analyze,verbose,buffers,costs,timing)

SELECT

    "msgId",

    "sender",

    "contentType",

    "content",

    "expiresIn",

    "timestamp",

    "sessionType",

    "sessionId",

    "isRescission",

    "isOncePush",

    CAST ( "extensions" AS VARCHAR ),

    NULL AS "receivers",

    NULL AS "reads"

FROM

    "表"

WHERE

    NOT "isRescission"

    AND 7189526 = ANY ( "receivers" )

    AND NOT 7189526 = ANY ("reads");

                                                                                              QUERY PLAN

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Seq Scan on public."表"  (cost=0.00..140829.79 rows=79282 width=206) (actual time=191.069..2295.282 rows=1 loops=1)

  Output: "msgId", sender, "contentType", content, "expiresIn", "timestamp", "sessionType", "sessionId", "isRescission", "isOncePush", (extensions)::character varying, NULL::unknown, NULL::unknown

  Filter: ((NOT "表"."isRescission") AND (7189526 = ANY ("表".receivers)) AND (7189526 <> ALL ("表".reads)))

  Rows Removed by Filter: 1776067

  Buffers: shared hit=79270

Planning time: 0.092 ms

Execution time: 2295.317 ms

对表添加gin索引并改写语句达到性能优化目的

CREATE INDEX idxrgin1 on "OnceMessages_test" USING GIN ("receivers");

CREATE INDEX idxrgin2 on "OnceMessages_test" USING GIN ("reads");

改写成array函数 , @>包含, 并强制类型转换::bigint 

explain(analyze,verbose,buffers,costs,timing)

SELECT "msgId",

    "sender",

    "contentType",

    "content",

    "expiresIn",

    "timestamp",

    "sessionType",

    "sessionId",

    "isRescission",

    "isOncePush",

    CAST ( "extensions" AS VARCHAR ),

    NULL AS "receivers",

    NULL AS "reads"   FROM "public"."表_test"  where "receivers" @> ARRAY[7189526::bigint] and  NOT "isRescission"

    and "reads" @>ARRAY[7189526::bigint] = 'f'

Bitmap Heap Scan on public."表_test"  (cost=18.98..1484.00 rows=375 width=207) (actual time=0.110..0.110 rows=1 loops=1)

  Output: "msgId", sender, "contentType", content, "expiresIn", "timestamp", "sessionType", "sessionId", "isRescission", "isOncePush", (extensions)::character varying, NULL::unknown, NULL::unknown

  Recheck Cond: ("表_test".receivers @> '{7189526}'::bigint[])

  Filter: ((NOT "表_test"."isRescission") AND (NOT ("表_test".reads @> '{7189526}'::bigint[])))

  Rows Removed by Filter: 2

  Heap Blocks: exact=3

  Buffers: shared hit=1 read=6

  I/O Timings: read=0.032

  ->  Bitmap Index Scan on idxrgin1  (cost=0.00..18.89 rows=385 width=0) (actual time=0.057..0.057 rows=3 loops=1)

        Index Cond: ("表_test".receivers @> '{7189526}'::bigint[])

        Buffers: shared hit=1 read=3

        I/O Timings: read=0.016

Planning time: 0.299 ms

Execution time: 0.149 ms

改写之后性能达到 0.149ms , , 函数不能乱用,随便用上性能会不会更慢也不知道,要多看手册, 中国普遍程序员都是这种想用就用的模式,跟国外完全不一样的先理解再使用

　　　否则研发思维只会越来越落后!

CREATE INDEX idxrgin1 on "OnceMessages_test" USING GIN ("receivers");

CREATE INDEX idxrgin2 on "OnceMessages_test" USING GIN ("reads");

gin索引优化实例1的更多相关文章

MySQL索引优化实例说明
下面分别创建三张表,并分别插入1W条简单的数据用来测试,详情如下: [1] test_a 有主键但无索引 CREATE TABLE `test_a` ( `id` int(10) unsign ...
MySql 索引优化实例
查询语句 SELECT customer_id,title,content FROM `product_comment` WHERE audit_status=1 AND product_id=199 ...
mysql 优化实例之索引创建
mysql 优化实例之索引创建优化前: pt-query-degist分析结果: # Query 23: 0.00 QPS, 0.00x concurrency, ID 0x78761E301CC7 ...
浅谈postgresql的GIN索引(通用倒排索引)
1.倒排索引原理倒排索引来源于搜索引擎的技术,可以说是搜索引擎的基石.正是有了倒排索引技术,搜索引擎才能有效率的进行数据库查找.删除等操作.在详细说明倒排索引之前,我们说一下与之相关的正排索引并与之 ...
MySQL优化实例
这周就要从泰笛离职了,在公司内部的wiki上,根据公司实际的项目,写了一些mysql的优化方法,供小组里的小伙伴参考下,没想到大家的热情很高,还专门搞了个ppt讲解了一下. 举了三个大家很容易犯错的地 ...
mysql sql优化实例
mysql sql优化实例优化前: pt-query-degist分析结果: # Query 3: 0.00 QPS, 0.00x concurrency, ID 0xDC6E62FA021C85B ...
SQL 查询优化索引优化
sql语句优化性能不理想的系统中除了一部分是因为应用程序的负载确实超过了服务器的实际处理能力外,更多的是因为系统存在大量的SQL语句需要优化. 为了获得稳定的执行性能,SQL语句越简单越好.对复杂的 ...
MySQL高级第二章——索引优化分析
一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...
MySQL高级学习笔记（四）：索引优化分析
文章目录性能下降 SQL慢执行时间长等待时间长查询语句写的烂查询数据过多关联了太多的表,太多join 没有利用到索引单值复合服务器调优及各个参数设置(缓冲.线程数等)(不重要DBA的 ...

随机推荐

python类方法@classmethod与@staticmethod
目录 python类方法@classmethod与@staticmethod 一.@classmethod 介绍语法举例二.@staticmethod 介绍语法举例 python类方法@cl ...
Juc1024小半年总结-面试篇
大家好,我叫Juc 这大概是我时隔2年度多第一次以分享的形式发的第一篇公众号今天是2019年10月26 本想在10月24就分享一下可惜前面两天时间太忙... 很凑巧,今天我出来工作刚好满4个月, ...
Qt 表格的使用
参考 http://doc.qt.io/qt-5/qtablewidget.html http://doc.qt.io/qt-5/qtablewidgetitem.html https://blog. ...
百万年薪python之路 -- 并发编程之多进程一
并发编程之多进程一. multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大 ...
[线段树系列] LCT打延迟标记的正确姿势
这一篇博客将教你什么? 如何用LCT打延迟标记,LCT和线段树延迟标记间的关系,为什么延迟标记要这样打. ——正片开始—— 学习这一篇博客前,确保你会以下知识: Link-Cut-Tree,普通线段树 ...
3D切割轮播图
预览图: 实现原理:将图片切割构建一个和ul(电脑屏幕)同一个轴的立方体,利用延时旋转实现切割效果知识点:transform-style属性(必须搭配transform属性使用) 值描述 flat ...
让你的sql开启氮气加速
事情的过程是:公司有一个上百行的sql 运行在MySQL数据库,速度奇慢无比,逻辑乱七八糟,我就不贴出来了,经过这次修改想总结一下如何写一个不被人骂的sql. 说一些被人诟病的问题: 一.子查询把你 ...
Nginx、WSGI、 uWSGI、 uwsgi的区别
当我们部署完一个应用程序,浏览网页时具体的过程是怎样的呢?首先我们得有一个 Web 服务器来处理 HTTP 协议的内容,Web 服务器获得客户端的请求,交给应用程序,应用程序处理完,返回给 Web 服 ...
2018.8.13 python中生成器和生成器表达式
主要内容: 1.生成器和生成器函数 2.列表推导式一.生成器生成器是指就是迭代器,在python中有三种方式来获取生成器: 1.通过生成器函数 2.通过各种推导式来实现生成器 3.通过数据的转换也 ...
git出现Your branch and 'origin/master' have diverged解决方法
如果不需要保留本地的修改,只要执行下面两步:git fetch origingit reset --hard origin/master 当我们在本地提交到远程仓库的时候,如果遇到上述问题,我们可以首 ...

gin索引优化实例1

gin索引优化实例1的更多相关文章

随机推荐

热门专题