转://Oracle 复合压缩索引场景及性能对比
摘要:今天为什么提到这个话题,出于一个偶然,一个同事在优化新开发的系统时向我请教如何添加复合压缩索引的问题。我总结了一下,问题有三。
第一:需不需要压缩
第二:对第几列压缩
第三:性能对比,选出最优
好,问题提出我们一一来解答一下
1.场景
在我的文章中经常会看到这个词,当然也可以不谈场景说技术,但我觉的那只是隔空建楼,毫无目的,没有根据性。我们在深入研究的时候要避免这样的盲目讨论,效果也不会好太多。注重技术的应用场景,才是研究技术、应用技术之根本,不管多么高科技的东东,或者说多牛的技术,最终还是要落到实处。那么本节讲的“复合压缩索引”的使用场景常用在,where子句中同时查询多列的情况下可以创建。如果要是有的列上数据重复度较高可以考虑进行压缩,重复度越高压缩效果越好,索引压缩以后一个索引块可以存放更多的键值。今天我们遇到的情况就和上述差不多。简介如下:
BB_BORROWER 表名,这是我们需要检索的表名
BB_BORROWER.VALIDITYFLAG VARCHAR2(5)列名,数据有效状态,此列只有三个值“1”“2”“3”
特点:列的基数不多且重复值极高
BB_BORROWER.FINANCECODE VARCHAR2(14)列名,金融机构代码,此列相对来讲基数略大,大到多少呢->1000家,这是征信管理局今年审批过的机构数,可能有的朋友会问,此列要不要压缩啊,实践是检验真理的唯一标准,经过测试后才能得到答案。
2.复合压缩索引语法
create index 索引名 on 表名(列名) compress 1;
compress后面跟的数字表示前缀的深度,也就是需要用来压缩的columns数
例
create index idx_leo on t(a,b,c) compress1; 只压缩第一列
create index idx_leo on t(a,b,c) compress2; 对前两列进行压缩
create index idx_leo on t(a,b,c) compress3; 对前三列进行压缩
3.查看动态性能视图指标
官方文档 books:Reference->INDEX_STATS
selectbtree_space,used_space,height,br_blks,lf_blks,opt_cmpr_count from index_stats;
btree_space:B-tree索引当前分配的空间
used_space:分配空间中已经被使用的部分
height:B-tree索引的高度(层数)
br_blks:B-tree索引的分支块数,分支块不能够被压缩
lf_blks:B-tree索引的叶子块数,叶子块能够被压缩
opt_cmpr_count:列中关键字最小的压缩长度
4.实验
(1)非压缩复合索引
drop index idx_bb_borrower1;
create index idx_bb_borrower1on bb_borrower(validityflag,financecode);
SQL> analyze index idx_bb_borrower1validate structure; 分析索引结构
Index analyzed
SQL> selectbtree_space,used_space,height,br_blks,lf_blks,opt_cmpr_count from index_stats;
BTREE_SPACE USED_SPACE HEIGHT BR_BLKS LF_BLKS OPT_CMPR_COUNT
----------- -------------------- ---------- ---------- ------------------ -------------------- ---------- ---------- --------
7996 868 1 0 1 2
(2)只压缩第一列的复合压缩索引
SQL> drop index idx_bb_borrower1;
Index dropped
SQL> create index idx_bb_borrower1 onbb_borrower(validityflag,financecode) compress 1;
Index created
SQL> analyze index idx_bb_borrower1validate structure; 分析索引结构
Index analyzed
SQL> select btree_space,used_space,height,br_blks,lf_blks,opt_cmpr_countfrom index_stats;
BTREE_SPACE USED_SPACE HEIGHT BR_BLKS LF_BLKS OPT_CMPR_COUNT
----------- ---------- -------------------- ---------- ---------------------- ---------- ---------- ------------------------
7992 830 1 0 1 2
(3)压缩前两列复合压缩索引
drop index idx_bb_borrower1;
create index idx_bb_borrower1 onbb_borrower(validityflag,financecode) compress 2;
SQL> drop index idx_bb_borrower1;
Index dropped
SQL> create index idx_bb_borrower1 onbb_borrower(validityflag,financecode) compress 2;
Index created
SQL> analyze indexidx_bb_borrower1 validate structure; 分析索引结构
Index analyzed
SQL> selectbtree_space,used_space,height,br_blks,lf_blks,opt_cmpr_count from index_stats;
BTREE_SPACE USED_SPACE HEIGHT BR_BLKS LF_BLKS OPT_CMPR_COUNT
----------- ---------- -------------------- ---------- ---------------------- ---------- ---------- ------------------------
7992 571 1 0 1 2
最后分析表并级联索引
SQL> executedbms_stats.gather_table_stats('sfcp','bb_borrower',cascade=>true);
PL/SQL procedure successfully completed
附:如果索引之前已经创建完毕,rebuildindex可重建压缩索引&恢复为普通索引之方法
alterindex idx_bb_borrower1 rebuild compress;
alterindex idx_bb_borrower1 rebuild nocompress;
5.结论
我们现在对上述三个实验结果进行对比可发现“对前两列进行压缩”效果最好,如果表中记录越多,那么测试的效果越显著。
复合压缩索引优势
(1)对键值重复度越高的列压缩效果越好,可以节省更多的存储空间
(2)索引压缩后一个索引块可以存放更多的索引键值
(3)扫描同样的记录数物理IO更少
(4)提高缓冲区命中率
复合压缩索引不足
(1)索引更新时需要重新解压->更新->加压,使用更多的CPU资源,维护成本高
(2)索引查询时需要更多的CPU计算时长,解压后才能比较查询
(3)热块竞争,当查询的结果集都集中在一个块中时会引起热块
(4)争用更多的CPU资源
小结:索引压缩技术是否可以帮助提升总体性能,这就需要根据实际硬件资源来具体分析了。在IO资源与CPU资源之间做好取舍,经过实际测试后得出结论。由此看出,一种技术的使用必然离不开它所应用的场景,使用的效果也要根据当时的场景具体问题具体分析。
注:bitmap索引不能压缩
转://Oracle 复合压缩索引场景及性能对比的更多相关文章
- Oracle 分区表管理之组合分区(分区索引失效与性能比较)
整体结构如下: Oracle 分区表管理之组合分区(分区索引失效与性能比较) 虽然老早就使用了分区表,终于有时间写有关分区表的内容:不是所有的场景数据量变大需要用到分区表,一般单表数据超过2g可以考 ...
- oracle提高之索引学习
一. 索引介绍 1.1 索引的创建 语法 : CREATE UNIUQE | BITMAP INDEX <schema>.<index_name> ON <schema ...
- ORACLE表、索引和分区详解
ORACLE表.索引和分区 一.数据库表 每种类型的表都有不同的特性,分别应用与不同的领域 堆组织表 聚簇表(共三种) 索引组织表 嵌套表 临时表 外部表和对象表 1.行迁移 建表过程中可以指定以下两 ...
- Oracle中的索引详解
Oracle中的索引概述 索引与表一样,也属于段(segment)的一种.里面存放了用户的数据,跟表一样需要占用磁盘空间.索引是一种允许直接访问数据表中某一数据行的树型结构,为了提高查询效率而引入,是 ...
- [转]Oracle中的索引详解
原文地址:http://www.oschina.net/question/30362_4057 一. ROWID的概念 存储了row在数据文件中的具体位置:64位 编码的数据,A-Z, a-z, 0- ...
- 【性能诊断】二、单功能场景的性能分析(fiddler、SQL Profiler)
Fiddler fiddler是最强大最好用的Web调试工具之一,它能记录所有客户端和服务器的http和https请求,允许你监视,设置断点,甚至修改输入输出数据. 使用Fiddler无论对开发还是测 ...
- ORACLE Index Lookup索引访问路径总结
在ORACLE中,索引访问/查找(Index Lookup)路径有五种方式,分别为INDEX UNIQUE SCAN.INDEX RANGE SCAN.INDEX FULL SCAN.INDEX FA ...
- Oracle中的索引详解(转载)
一. ROWID的概念 存储了row在数据文件中的具体位置:64位 编码的数据,A-Z, a-z, 0-9, +, 和 /, row在数据块中的存储方式 SELECT ROWID, last_name ...
- 索引笔记《一》Oracle中的索引详解
一. ROWID的概念 存储了row在数据文件中的具体位置:64位 编码的数据,A-Z, a-z, 0-9, +, 和 /, row在数据块中的存储方式 SELECT ROWID, last_name ...
随机推荐
- 【Linux】linux查看日志文件内容命令tail、cat、tac、head、echo
linux查看日志文件内容命令tail.cat.tac.head.echo tail -f test.log你会看到屏幕不断有内容被打印出来. 这时候中断第一个进程Ctrl-C, ---------- ...
- Socket编程(网络编程)
网络通信的第一要素:IP地址 通过IP地址唯一的定位到互联网的主机 通过 IP+port(端口号) 来确定互联网的主机上的某个软件 InetAddress:位于java.net包下 getHostNa ...
- Building QGIS from source - step by step (开发文档翻译1)
1. 简介 原文网址:http://htmlpreview.github.io/?https://raw.github.com/qgis/QGIS/master/doc/INSTALL.html 本文 ...
- RabbitMQ 消息流程、AMOP 概念
AMOP Server:Broker.RabbitMQ Server,实现 AMOP 实体服务,接受客户端的连接 Conneciton:链接,应用程序与 Server 的网络连接 Channel:网络 ...
- loadrunner 脚本优化-事务时间简介
脚本优化-事务时间简介 by:授客 QQ:1033553122 事务概念 事务是指用户在客户端做一种或多种业务所需要的操作集(actions),通过事务开始和结束函数可以标记完成该业务所需要的操作内容 ...
- Android为TV端助力 自定义activity
今天公司有个需要需要自动弹出界面,而dialog又不符合要求,所以自定义的一个activity的样式 首先在androidmainfest.xml上注册你的activity <activity ...
- 六. Redis发布订阅机制
发布订阅(pub/sub)是一种消息通信模式,主要是解除消息发布者和消息订阅者之间通信的耦合. Redis作为一个pub/sub的服务器,在订阅者和发布者之间起到了一个消息路由的功能.订阅者可以通过s ...
- Git:二、本地文件操作
文件必须放在本地Git仓库的文件夹下,子文件夹也可以. 1.添加/修改 git add <文件名> 2.提交 git commit -m "本次提交说明" 可以add很 ...
- mysql之连接查询、联合查询、子查询
本文内容: 连接查询 联合查询 子查询 from子查询 where子查询 exists子查询 首发日期:2018-04-11 连接查询: 连接查询就是将多个表联合起来查询,连接查询方式有内连接.外连接 ...
- Docker & pure-ftpd 快速加建 FTP 服务器
项目需要进行升级服务,现在需要基于centos 7使用docker来快速打架一个FTP环境来方便本地文件上传. 本次使用的是 pure-ftpd docker镜像,有关镜像使用的详细信息,本人是从 h ...