经历了前两轮优化之后,saiku由不可使用,优化到可以使用,不过在分析大量日志数据的时候,还有顿卡的感觉!继续观察背后执行的Sql,决定将注意力关注到索引上面!

日志的主要使用场景是:固定日期维度的数据分析,也就是说where条件一定跟着日期等于某一天,那么纠结的是:每个字段都建立索引,还是和日期建立联合索引。归结到底就是单个字段的索引效率与联合索引的效率优劣对比!

Postgresql数据表:saiku_search_detail

表结构:

CREATE TABLE test.saiku_search_detail
(
rpt_date date,
from_area_id bigint,
from_value_id bigint,
in_track_id bigint,
gid character varying,
current_city_id bigint,
dist_city_id bigint,
category_name_id bigint,
page_id bigint,
utmr_page_id bigint,
num bigint,
id bigint,
partner smallint
)

条数:8,510,490。大概851万

测试步骤:

一、裸表

对一个日期进行查询:

1.1 单个条件

select
count(1)
from test.saiku_search_detail
where rpt_date = '2016-05-13'

结果:1110ms

"Aggregate  (cost=160934.85..160934.86 rows=1 width=0)"
" -> Seq Scan on saiku_search_detail (cost=0.00..160816.78 rows=47230 width=0)"
" Filter: (rpt_date = '2016-05-13'::date)"

1.2 两个条件

select
count(1)
from test.saiku_search_detail
where rpt_date = '2016-05-13'
and from_area_id = 135

结果:1782ms

"Aggregate  (cost=184432.32..184432.33 rows=1 width=0)"
" -> Seq Scan on saiku_search_detail (cost=0.00..184431.73 rows=236 width=0)"
" Filter: ((rpt_date = '2016-05-13'::date) AND (from_area_id = 135))"

没有任何异议,0个索引!

二、对两个字段分别添加索引:

--btree索引
CREATE INDEX saiku_search_detail_from_area_id_idx
ON saiku_search_detail
USING btree
(from_area_id);
--hash索引
CREATE INDEX saiku_search_detail_rpt_date_idx
ON saiku_search_detail
USING hash
(rpt_date);

2.1 单个条件

select
count(1)
from saiku_search_detail
where rpt_date = '2016-05-13'

结果:83ms

"Aggregate  (cost=8.02..8.03 rows=1 width=0)"
" -> Index Scan using saiku_search_detail_rpt_date_idx on saiku_search_detail (cost=0.00..8.02 rows=1 width=0)"
" Index Cond: (rpt_date = '2016-05-13'::date)"

使用了索引

2.2 两个条件

select
count(1)
from saiku_search_detail
where rpt_date = '2016-05-13'
and from_area_id = 135

结果:149ms

"Aggregate  (cost=8.02..8.03 rows=1 width=0)"
" -> Index Scan using saiku_search_detail_rpt_date_idx on saiku_search_detail (cost=0.00..8.02 rows=1 width=0)"
" Index Cond: (rpt_date = '2016-05-13'::date)"
" Filter: (from_area_id = 135)"

使用了一个索引,第二个索引没有生效。尝试修改sql的条件顺序:

select
count(1)
from saiku_search_detail
where from_area_id = 135
and rpt_date = '2016-05-13'

结果一样!这说明在Postgresql里面,建立两个索引字段,只会一个起作用!

三、建立联合索引

--复合索引,两个字段都添加索引
CREATE INDEX saiku_search_detail_rpt_date_from_area_idx
ON test.saiku_search_detail
USING btree
(rpt_date, from_area_id);

3.1 单个条件查询&建立索引的第一个字段

select
count(1)
from test.saiku_search_detail
where rpt_date = '2016-05-13'

结果:66ms

"Aggregate  (cost=47843.00..47843.01 rows=1 width=0)"
" -> Bitmap Heap Scan on saiku_search_detail (cost=2220.63..47362.94 rows=192025 width=0)"
" Recheck Cond: (rpt_date = '2016-05-13'::date)"
" -> Bitmap Index Scan on saiku_search_detail_rpt_date_from_area_idx (cost=0.00..2172.62 rows=192025 width=0)"

可见使用了部分索引

3.2 两个条件查询

select
count(1)
from test.saiku_search_detail
where rpt_date = '2016-05-13'
and from_area_id = 135

结果:65ms

"Aggregate  (cost=46124.99..46125.00 rows=1 width=0)"
" -> Bitmap Heap Scan on saiku_search_detail (cost=1509.67..45857.37 rows=107047 width=0)"
" Recheck Cond: ((rpt_date = '2016-05-13'::date) AND (from_area_id = 135))"
" -> Bitmap Index Scan on saiku_search_detail_rpt_date_from_area_idx (cost=0.00..1482.90 rows=107047 width=0)"

使用了索引

总结

  • 废话:如果两个字段做为筛选条件,那么联合索引最优。
  • 收益:在日志分析过程中,除了日期的单个字段做为索引,其他的单个字段索引都不起作用,应该删除
  • 纠结:仅仅在日期建立单个索引,还是建立多个包含日期的复合索引?根据使用场景自己决定吧

saiku之行速度优化(三)的更多相关文章

  1. 【SQL server初级】数据库性能优化三:程序操作优化

    数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第三部分 数据库性能优化三:程序操作优化 概述:程序访问优化也可以认为是访问SQL语句的优化,一个好的SQL语句是可以减少 ...

  2. dWebpack编译速度优化实战

    当你的应用的规模还很小时,你可能不会在乎Webpack的编译速度,无论使用3.X还是4.X版本,它都足够快,或者说至少没让你等得不耐烦.但随着业务的增多,嗖嗖嗖一下项目就有上百个组件了,也是件很简单的 ...

  3. MySQL优化三(InnoDB优化)

    body { font-family: Helvetica, arial, sans-serif; font-size: 14px; line-height: 1.6; padding-top: 10 ...

  4. Tone Mapping算法系列二:一种自适应对数映射的高对比度图像显示技术及其速度优化。

    办公室今天停电,幸好本本还有电,同事们好多都去打麻将去了,话说麻将这东西玩起来也还是有味的,不过我感觉我是输了不舒服,赢了替输的人不舒服,所以干脆拜别麻坛四五年了,在办公室一个人整理下好久前的一片论文 ...

  5. App架构师实践指南六之性能优化三

    App架构师实践指南六之性能优化三 2018年08月02日 13:57:57 nicolelili1 阅读数:190   内存性能优化1.内存机制和原理 1.1 内存管理内存时一个基础又高深的话题,从 ...

  6. MySQL性能优化(三):索引

    原文:MySQL性能优化(三):索引 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/vbi ...

  7. [转]Asp.net mvc 网站之速度优化 -- 页面缓存

    网站速度优化的一般方法 由于网站最重要的用户体验就是速度,特别是对于电子商务网站而言. 一般网站速度优化会涉及到几个方面: 1. 数据库优化 — 查询字段简历索引,使用数据库连接池和持久化,现在还有种 ...

  8. web访问速度优化分析

    请求从发出到接收完成一共经历了DNS Lookup.Connecting.Blocking.Sending.Waiting和Receiving六个阶段,时间共计38ms.请求完成之后是DOM加载和页面 ...

  9. 记一次cocos项目的加载速度优化

    半个月前,我们用cosos creator做了一个简单的小游戏,也许算不上小游戏吧..一边学cocos,一边做,几经波折后终于上线了.然鹅,功能是实现了,但是加载速度十分感人(毕竟没经验嘛,无辜脸). ...

随机推荐

  1. Dynamic CRM 2013学习笔记(七)追踪、监控及性能优化

    本文将介绍CRM的三个内容追踪.监控及性能优化.追踪是CRM里一个很有用的功能,它能为我们的CRM调试或解决错误.警告提供有价值的信息:我们可以用window的性能监控工具来了解CRM的性能状况:最后 ...

  2. 【Android UI设计与开发】9:滑动菜单栏(一)开源项目SlidingMenu的使用和示例

    一.SlidingMenu简介 相信大家对SlidingMenu都不陌生了,它是一种比较新的设置界面或配置界面的效果,在主界面左滑或者右滑出现设置界面效果,能方便的进行各种操作.很多优秀的应用都采用了 ...

  3. [MFC] MFC编译程序,缺少MFC动态链接库的解决

    问题:VS2010 c++编写的程序在别人的机子运行不了,缺少mfc100u.dll xxx100d.dll等的解决方法   解决方法: 1.将这些dll打包,和应用程序一起发布; 2.采用MFC静态 ...

  4. Windows 10四大版本区别详解:家庭版, 专业版, 企业版和教育版

    Windows 10有四个基本版本:Windows 10 家庭版, Windows 10 专业版, Windows 10 企业版, 和Windows 10 教育版(这是Windows家族的新成员).以 ...

  5. C#与数据库访问技术总结(十三)之DataReader对象

    DataReader对象与数据获取 DataReader对象以“基于连接”的方式来访问数据库. 也就是说,在访问数据库.执行SQL操作时,DataReader要求一直连在数据库上. 这将会给数据库的连 ...

  6. Atitit.java eval功能的实现  Compiler API

    Atitit.java eval功能的实现  Compiler API 输出echo2 输出目录配置2 针对编译器,JDK 设计了两个接口,分别是 JavaCompiler 和JavaCompiler ...

  7. Jsp技术总结

    这节我们总结一下Jsp的相关技术. 1. 什么是JSP JSP即Java Server Pages,它和servlet技术一样,都是sun公司定义的一种用于开发动态web资源的技术.该技术的最大特点在 ...

  8. javascript设计模式与开发实践阅读笔记(6)——代理模式

    代理模式:是为一个对象提供一个代用品或占位符,以便控制对它的访问. 代理模式的关键是,当客户不方便直接访问一个对象或者不满足需要的时候,提供一个替身对象来控制对这个对象的访问,客户实际上访问的是替身对 ...

  9. 如何提交docker镜像到DockerHub

    Write a Dockerfile In detail: FROM(指定基础image) 构建指令,必须指定且需要在Dockerfile其他指令的前面.后续的指令都依赖于该指令指定的image.FR ...

  10. asp.net mvc通过预处理实现数据过滤和数据篡改。

    需求特别简单.在 Controller加过滤器.实现在所有的方法上增加id=12312321312.另外将price篡改为price+5. 这样做可以最大的减少代码的改动量,人员变动厉害,业务也模糊了 ...