oracle 优化——索引与组合索引

1、索引结构。第一张图是索引的官方图解，右侧是存储方式的图解。

图中很清晰的展示了索引存储的状况。

在leaf 节点中存储了一列，索引所对应项的：值，rowId，长度，头信息（控制信息）

这样我们就能很清楚、如果通过索引查找数据，而只需要这个索引的值的时候，写上列名，就可以不需要回表。

2、索引在一般的数据量情况下，只有三层。leaf 是目录，branch 是目录的目录。可以做一个测试

 drop table t1 purge;

 drop table t2 purge;

 drop table t3 purge;

 drop table t4 purge;

 drop table t5 purge;

 drop table t6 purge;

 drop table t7 purge;

 create table t1 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=1;

 create table t2 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=10;

 create table t3 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=100;

 create table t4 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=1000;

 create table t5 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=10000;

 create table t6 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=100000;

 create table t7 as select rownum as id ,rownum+1 as id2,rpad('*',1000,'*') as contents from dual connect by level<=1000000;

 create index idx_id_t1 on t1(id);

 create index idx_id_t2 on t2(id);

 create index idx_id_t3 on t3(id);

 create index idx_id_t4 on t4(id);

 create index idx_id_t5 on t5(id);

 create index idx_id_t6 on t6(id);

 create index idx_id_t7 on t7(id);

 set linesize 1000

 set autotrace off

 select index_name,

           blevel,

           leaf_blocks,

           num_rows,

           distinct_keys,

           clustering_factor

      from user_ind_statistics

     where table_name in( 'T1','T2','T3','T4','T5','T6','T7');

 索引的名字          层级     leaf 块

 INDEX_NAME  BLEVEL LEAF_BLOCKS   NUM_ROWS DISTINCT_KEYS CLUSTERING_FACTOR

 ------------------ ----------- ---------- ------------- -----------------

 IDX_ID_T1        0           1          1             1                 1

 IDX_ID_T2        0           1         10            10                 2

 IDX_ID_T3        0           1        100           100                15

 IDX_ID_T4        1           3       1000          1000               143

 IDX_ID_T5        1          21      10000         10000              1429

 IDX_ID_T6        1         222     100000        100000             14286

 IDX_ID_T7        2        2226    1000000       1000000            142858

数据在一千万条的时候也只有三层（查到数据只需要四个逻辑读），所以即便上亿数据，也无非十个左右的逻辑读，充分了体现了索引的优点。如果不建索引，那么全表扫描是很恐怖的。

3、索引在函数运算上能起到优化作用，比如sum,avg，count

　　在没有主键，只有索引的表中count*的时候，由于索引不记录空值，所以它不会走索引，如果对索引列加上 not null“select count(*) from user where userId not null”，就能走索引、当然如果有主键自然就不必了。

各种函数，运算列如果是索引列的话效率就会大幅度提高，可以看下面例子

 SUM/AVG的优化

 drop table t purge;

 create table t as select * from dba_objects;

 create index idx1_object_id on t(object_id);

 set autotrace on

 set linesize 1000

 set timing on 

 select sum(object_id) from t;

 执行计划

 ----------------------------------------------------------------------------------------

 | Id  | Operation             | Name           | Rows  | Bytes | Cost (%CPU)| Time     |

 ----------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT      |                |     1 |    13 |    49   (0)| 00:00:01 |

 |   1 |  SORT AGGREGATE       |                |     1 |    13 |            |          |

 |   2 |   INDEX FAST FULL SCAN| IDX1_OBJECT_ID | 92407 |  1173K|    49   (0)| 00:00:01 |

 ----------------------------------------------------------------------------------------

 统计信息

 ----------------------------------------------------------

           0  recursive calls

           0  db block gets

         170  consistent gets

           0  physical reads

           0  redo size

         432  bytes sent via SQL*Net to client

         415  bytes received via SQL*Net from client

           2  SQL*Net roundtrips to/from client

           0  sorts (memory)

           0  sorts (disk)

           1  rows processed

 --比较一下假如不走索引的代价，体会一下这个索引的重要性

 select /*+full(t)*/ sum(object_id) from t;

 SUM(OBJECT_ID)

 --------------

   2732093100

 执行计划

 ---------------------------------------------------------------------------

 | Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

 ---------------------------------------------------------------------------

 |   0 | SELECT STATEMENT   |      |     1 |    13 |   292   (1)| 00:00:04 |

 |   1 |  SORT AGGREGATE    |      |     1 |    13 |            |          |

 |   2 |   TABLE ACCESS FULL| T    | 92407 |  1173K|   292   (1)| 00:00:04 |

 ---------------------------------------------------------------------------

 统计信息

 ----------------------------------------------------------

           0  recursive calls

           0  db block gets

        1047  consistent gets

           0  physical reads

           0  redo size

         432  bytes sent via SQL*Net to client

         415  bytes received via SQL*Net from client

           2  SQL*Net roundtrips to/from client

           0  sorts (memory)

           0  sorts (disk)

           1  rows processed     

 --起来类似的比如AVG，和SUM是一样的，如下：

 select avg(object_id) from t;

 AVG(OBJECT_ID)

 --------------

   37365.5338

 执行计划

 ----------------------------------------------------------------------------------------

 | Id  | Operation             | Name           | Rows  | Bytes | Cost (%CPU)| Time     |

 ----------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT      |                |     1 |    13 |    49   (0)| 00:00:01 |

 |   1 |  SORT AGGREGATE       |                |     1 |    13 |            |          |

 |   2 |   INDEX FAST FULL SCAN| IDX1_OBJECT_ID | 92407 |  1173K|    49   (0)| 00:00:01 |

 ----------------------------------------------------------------------------------------

 统计信息

 ----------------------------------------------------------

           0  recursive calls

           0  db block gets

         170  consistent gets

           0  physical reads

           0  redo size

         448  bytes sent via SQL*Net to client

         415  bytes received via SQL*Net from client

           2  SQL*Net roundtrips to/from client

           0  sorts (memory)

           0  sorts (disk)

           1  rows processed

 --不知大家注意到没，这里的试验已经告诉我们了，OBJECT_ID列是否为空，也不影响SUM/AVG等聚合的结果。

Oracle 索引列函数运算的高效测试

可以从执行计划中看到 consistent gets 走索引是一百多，而不走索引就上千，效率成倍增加。

4、索引本身有序

通过索引列排序，不会产生排序 ,但是io多，代价小。排序代价是很大的。由于本身有序，获取最大值，最小值，也是高效的。

二、组合索引。（索引只适合返回少量记录）

　　1、适用在单独查询返回记录很多，组合查询后忽然返回记录很少的情况

　　比如：1某地区的贷款条数很多，2涉农贷款条数很多，3某地区贷款金额在某区间的贷款数很多

　　　　　　但是，某地区，涉农贷款，金额某区间的贷款条数就很少。

　　　　当涉及某些组合条件检索数据时，就可以采用组合索引的形式，

　　　　create index area_loanType_ on t(area_id,loan_type);

　　而时间是做了分区表的，所以在这种情况下、检索速度会大大提高。

2.组合索引第一个索引的重要性。

　　由于组合索引是仅仅相对于前一个索引有意义,所以，当查询时，只通过第二个索引列查询，是不会走索引的，它的存在的意义只能是在使用第一个索引的情况下。

但是，只通过第一个索引列查询、是会走索引的。所以第一个索引也是常用，并且有单独查寻需要的列。

当然如果前一个索引的值很少，比如loanType(涉农，个体，工业，慈善..) 共六七个而已，那么Oracle 收集了统计信息后，可以索引跳跃扫描，类似与 SELECT * from loans where areaId="" and loanType in (慈善，个体，工业...)and（第三个组合索引的条件）

3.仅等值无范围查询时，组合索引顺序不影响性能

比如：

 --3.仅等值无范围查询时，组合索引顺序不影响性能（比如where col1=xxx and col2=xxx，无论COL1+COL2组合还是COL2+COL1组合）

 drop table t purge;

 create table t as select * from dba_objects;

 insert into t select * from t;

 insert into t select * from t;

 insert into t select * from t;

 update t set object_id=rownum ;

 commit;

 create index idx_id_type on t(object_id,object_type);

 create index idx_type_id on t(object_type,object_id);

 set autotrace off

 alter session set statistics_level=all ;

 set linesize 366

 select /*+index(t,idx_id_type)*/ * from  t  where object_id=20  and object_type='TABLE';

 select * from table(dbms_xplan.display_cursor(null,null,'allstats last'));

 -----------------------------------------------------------------------------------------------------

 | Id  | Operation                   | Name        | Starts | E-Rows | A-Rows |   A-Time   | Buffers |

 -----------------------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT            |             |      1 |        |      1 |00:00:00.01 |       5 |

 |   1 |  TABLE ACCESS BY INDEX ROWID| T           |      1 |     57 |      1 |00:00:00.01 |       5 |

 |*  2 |   INDEX RANGE SCAN          | IDX_ID_TYPE |      1 |      9 |      1 |00:00:00.01 |       4 |

 -----------------------------------------------------------------------------------------------------

 select /*+index(t,idx_type_id)*/ * from  t  where object_id=20  and object_type='TABLE';

 select * from table(dbms_xplan.display_cursor(null,null,'allstats last'));

 Plan hash value: 3420768628

 -----------------------------------------------------------------------------------------------------

 | Id  | Operation                   | Name        | Starts | E-Rows | A-Rows |   A-Time   | Buffers |

 -----------------------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT            |             |      1 |        |      1 |00:00:00.01 |       5 |

 |   1 |  TABLE ACCESS BY INDEX ROWID| T           |      1 |     57 |      1 |00:00:00.01 |       5 |

 |*  2 |   INDEX RANGE SCAN          | IDX_TYPE_ID |      1 |      9 |      1 |00:00:00.01 |       4 |

 -----------------------------------------------------------------------------------------------------

 --4.组合索引最佳顺序一般是将列等值查询的列置前。（测试组合索引在条件是不等的情况下的情况，条件经常是不等的，要放在后面，让等值的在前面）

 select /*+index(t,idx_id_type)*/ *  from   t where object_id>=20 and object_id<2000 and object_type='TABLE';

 select * from table(dbms_xplan.display_cursor(null,null,'allstats last'));

 -----------------------------------------------------------------------------------------------------

 | Id  | Operation                   | Name        | Starts | E-Rows | A-Rows |   A-Time   | Buffers |

 -----------------------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT            |             |      1 |        |    469 |00:00:00.01 |      86 |

 |   1 |  TABLE ACCESS BY INDEX ROWID| T           |      1 |     14 |    469 |00:00:00.01 |      86 |

 |*  2 |   INDEX RANGE SCAN          | IDX_ID_TYPE |      1 |      1 |    469 |00:00:00.01 |      40 |

 -----------------------------------------------------------------------------------------------------

 select /*+index(t,idx_type_id)*/ *  from  t  where object_id>=20 and object_id<2000   and object_type='TABLE';

 -----------------------------------------------------------------------------------------------------

 | Id  | Operation                   | Name        | Starts | E-Rows | A-Rows |   A-Time   | Buffers |

 -----------------------------------------------------------------------------------------------------

 |   0 | SELECT STATEMENT            |             |      1 |        |    469 |00:00:00.01 |      81 |

 |   1 |  TABLE ACCESS BY INDEX ROWID| T           |      1 |    469 |    469 |00:00:00.01 |      81 |

 |*  2 |   INDEX RANGE SCAN          | IDX_TYPE_ID |      1 |    469 |    469 |00:00:00.01 |      35 |

 -----------------------------------------------------------------------------------------------------

自己感悟吧

4、组合索引排序 如果对组合索引中列进行排序，可以走索引。

三、创建索引的一些规则

1、权衡索引个数与DML之间关系，DML也就是插入、删除数据操作。

这里需要权衡一个问题，建立索引的目的是为了提高查询效率的，但建立的索引过多，会影响插入、删除数据的速度，因为我们修改的表数据，索引也要跟着修改。这里需要权衡我们的操作是查询多还是修改多。

2、把索引与对应的表放在不同的表空间。

当读取一个表时表与索引是同时进行的。如果表与索引和在一个表空间里就会产生资源竞争，放在两个表这空就可并行执行。

3、最好使用一样大小是块。

Oracle默认五块，读一次I/O，如果你定义6个块或10个块都需要读取两次I/O。最好是5的整数倍更能提高效率。

4、如果一个表很大，建立索引的时间很长，因为建立索引也会产生大量的redo信息，所以在创建索引时可以设置不产生或少产生redo信息。只要表数据存在，索引失败了大不了再建，所以可以不需要产生redo信息。

oracle 优化——索引与组合索引的更多相关文章

MongoDB性能篇之创建索引，组合索引，唯一索引，删除索引和explain执行计划
这篇文章主要介绍了MongoDB性能篇之创建索引,组合索引,唯一索引,删除索引和explain执行计划的相关资料,需要的朋友可以参考下一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存 ...
MySQL单列索引和组合索引(联合索引)的区别详解
发现index merge局限性,优化器会自动判断是否使用 index merge 优化技术,查询还是需要组合索引[推荐阅读:对mysql使用索引的误解] MySQL单列索引和组合索引(联合索引)的区 ...
MySQL单列索引和组合索引的选择效率与explain分析
一.先阐述下单列索引和组合索引的概念: 单列索引:即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引. 组合索引:即一个索包含多个列. 如果我们的查询where条件只有一个,我们完全可 ...
MySQL单列索引和组合索引的创建及区别介绍
MySQL单列索引是我们使用MySQL数据库中经常会见到的,MySQL单列索引和组合索引的区别可能有很多人还不是十分的了解,下面就为您分析两者的主要区别,供您参考学习. 为了形象地对比两者,再建一个表 ...
MySQL单列索引和组合索引的区别介绍
MySQL单列索引和组合索引的区别介绍作者:佚名出处:IT专家网2010-11-22 13:05 MySQL单列索引是我们使用MySQL数据库中经常会见到的,MySQL单列索引和组合索引的区别可能有 ...
mysql索引之组合索引
多列索引又称组合索引,在mysql的查询操作中,我们经常会遇到多个搜索条件,如:$sql = "select * from article where content='ma4' and t ...
[转]MySQL单列索引和组合索引的区别介绍
FROM : http://database.ctocio.com.cn/353/11664853.shtml MySQL单列索引是我们使用MySQL数据库中经常会见到的,MySQL单列索引和组合索引 ...
MySQL单列索引和组合索引的区别介绍（转）
原文:http://database.51cto.com/art/201011/233234.htm MySQL单列索引是我们使用MySQL数据库中经常会见到的,MySQL单列索引和组合索引的区别可能 ...
MongoDB 创建基础索引、组合索引、唯一索引以及优化
一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样.其实可以这样说说,索引 ...

随机推荐

crtmpserver的架构简介
crtmpserver的架构简介一.层 Layers . 机器层 Machine layer . 操作系统层 Operating System Layer This layer is compo ...
HTML5 web开发时遇到的一个奇葩问题。
昨天做了一个手机端的H5 页面. 首先就是各种兼容测试,调整修复..一系列操作之后,拿过来N多手机神马华为.小米.三星.水果5.6.plus,一番测试之后.嗯,还不错,稍作等待之后就上线了. 这是分割 ...
Html中input标签的使用
1.取消按钮按下时的虚线框在input里添加属性值 hideFocus 或者 HideFocus=true 2.只读文本框内容在input里添加属性值 readonly 3.防止退后清空的TEXT ...
Git之detached HEAD
今天遇到了和CSDN上博主相同的问题,就是使用git -branch -a 发现自己处于一个零时的分支上.这篇博文写的不错,转载记录一下. 转载:http://blog.csdn.net/lili62 ...
DOM 之通俗易懂讲解
DOM是所有前端开发每天打交道的东西,但是随着jQuery等库的出现,大大简化了DOM操作,导致大家慢慢的“遗忘”了它的本来面貌.不过,要想深入学习前端知识,对DOM的了解是不可或缺的,所以本文力图系 ...
CSS浮动属性Float详解
什么是CSS Float? float 是 css 的定位属性.在传统的印刷布局中,文本可以按照需要围绕图片.一般把这种方式称为“文本环绕”.在网页设计中,应用了CSS的float属性的页面元素就像在 ...
COJ WZJ的数据结构（负十八）splay_tree的天堂
WZJ的数据结构(负十八) 难度级别:E: 运行时间限制:100000ms: 运行空间限制:700KB: 代码长度限制:2000000B 试题描述对于前一段样例: 输入输入文件的第1行包含两个数N ...
delphi客户端调服务器端的java webservice如何在参数中传对象？转
我试过java返回一个对象到delphi端没问题,可反过来,delphi通过参数传一个对象到java,java端得到的对象值变为空,不知道是不是delphi这边设置或者对象注册方面有问题,究竟该怎么解 ...
JDK、JRE和JVM的区别与联系
首先来说一下JDK JDK(Java Development Kit) 是 Java 语言的软件开发工具包(SDK). JDK是整个JAVA的核心,包括了Java运行环境(Java Runtime E ...
js点击按钮，放大对应图片代码
<!doctype html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

oracle 优化——索引与组合索引

oracle 优化——索引与组合索引的更多相关文章

随机推荐

热门专题