原文:
http://www.oracle.com/technetwork/issue-archive/2009/09-may/o39asktom-096149.html






oracle中约束(constraints)是如何影响查询计划的





通常人们认为约束只是和数据完整性有关,没问题。但是约束也被优化器使用来优化执行计划。

优化器会拿以下资源最为输入inputs:





1)待优化的查询

2)所有数据库对象统计

3)系统统计,如果可以获取的话(CPU速度、单块I/O速度等等作为物理硬件的衡量尺度)

4)初始化参数

5)约束





我经常听到人们在数据仓库/报表系统中忽略约束的使用,理由是:数据本身OK,并且我们做了数据清洗(如果让约束enable,他们反而不高兴),但事实证明为了获得更好的执行计划他们的确需要数据完整性约束。数据仓库中一个差的执行计划可能耗时几小时甚至几天才能执行完。下面我们通过实例来说明约束对于执行计划的重要性:





1. 来看NOT NULL约束如何影响执行计划:

code1: 创建数据隔离的表和视图

drop table t1;

drop table t2;

drop view v;





create table t1

as

select * from all_objects

where object_type in ('TABLE','VIEW');









alter table t1 modify object_type not null;





alter table t1 add constraint t1_check_otype check (object_type in('TABLE','VIEW'));









create table t2

 as

 select * from all_objects

 where object_type in ( 'SYNONYM', 'PROCEDURE' );









alter table t2 modify object_type not null;





alter table t2 add constraint t2_check_otype 

  check (object_type in ('SYNONYM', 'PROCEDURE'));









create or replace view v

as

select * from t1

union all

select * from t2;





code2: 优化掉一个表

set autotrace traceonly explain

select * from v where object_type = 'TABLE';

Execution Plan

----------------------------------------------------------------------------

Plan hash value: 3982894595





-----------------------------------------------------------------------------

| Id  | Operation            | Name | Rows  | Bytes | Cost (%CPU)| Time     |

-----------------------------------------------------------------------------

|   0 | SELECT STATEMENT     |      |    40 |  6320 |   151   (1)| 00:00:02 |

|   1 |  VIEW                | V    |    40 |  6320 |         (1)| 00:00:02 |

|   2 |   UNION-ALL          |      |       |       |            |          |

|*  3 |    TABLE ACCESS FULL | T1   |  3083 |   475K|    31   (0)| 00:00:01 |

|*  4 |    FILTER            |      |       |       |            |          |

|*  5 |     TABLE ACCESS FULL| T2   |     5 |   790 |   12    (1)| 00:00:02 |

-----------------------------------------------------------------------------





Predicate Information (identified by operation id):

-------------------------------





   3 - filter("OBJECT_TYPE"='TABLE')

   4 - filter(NULL IS NOT NULL)

   5 - filter("OBJECT_TYPE"='TABLE')





奇怪的是:我们查的数据只在T1中存在根本不关T2的事!而且看filter4:NULL IS NOT NULL这个条件我们没有指定,是执行计划加的!

这个条件始终未FALSE。





继续,为了说明NOT NULL约束是如何作用的再来看一个例子:

code3:

drop table t;

create table t

  as

  select * from all_objects;





create index t_idx on t(object_type);





exec dbms_stats.gather_table_stats( user, 'T' );





select count(*) from t;

Execution Plan

----------------------------------------

Plan hash value: 2966233522





-------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Cost (%CPU)| Time     |

-------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      |     1 |   283   (1)| 00:00:04 |

|   1 |  SORT AGGREGATE    |      |     1 |            |          |

|   2 |   TABLE ACCESS FULL| T    | 68437 |   283   (1)| 00:00:04 |

-------------------------------------------------------------------





这个计划没有使用我们创建的索引。原因是object_type列是nullable,索引并不包含所有NULL值,所以无法根据索引键值进行

COUNT操作。如果我们告诉数据库:OBJECT_TYPE IS NOT NULL,执行计划将立马转变!

code4:

alter table t modify object_type NOT NULL;

select count(*) from t;

Execution Plan

------------------------------------------

Plan hash value: 1058879072





------------------------------------------------------------------------

| Id  | Operation             | Name  | Rows   | Cost (%CPU)| Time     |

------------------------------------------------------------------------

|   0 | SELECT STATEMENT      |       |     1  |    54   (2)| 00:00:01 |

|   1 |  SORT AGGREGATE       |       |     1  |            |          |

|   2 |   INDEX FAST FULL SCAN| T_IDX | 68437  |    54   (2)| 00:00:01 |

------------------------------------------------------------------------





some kind of 神奇吧!

问题是加入该object_type列可以为NULL,又该如何解决?答案是我们可以创建多列索引(组合索引)当然object_type比在其中。

例如:

code5:

drop index t_idx;

create index t_idx on t (object_type, 0);

code6:

select * from t where object_type is null;

Execution Plan

-----------------------------

Plan hash value: 470836197





--------------------------------------------------------------------------------------

| Id  | Operation                    | Name  | Rows  | Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT             |       |     1 |   101 |  1      (0)| 00:00:01 |

|   1 |  TABLE ACCESS BY INDEX ROWID | T     |     1 |   101 |  1      (0)| 00:00:01 |

|*  2 |   INDEX RANGE SCAN           | T_IDX |     1 |       |  1      (0)| 00:00:01 |

--------------------------------------------------------------------------------------





Predicate Information (identified by operation id):

---------------------------------------------------

   2 - access("OBJECT_TYPE" IS NULL)

   





2、来看主外键约束如何影响执行计划:

code7:

drop table emp;

drop table dept;

drop view emp_dept;





create table emp

  as

  select *

  from scott.emp;





create table dept

  as

  select *

  from scott.dept;





create or replace view emp_dept

  as

  select emp.ename, dept.dname

    from emp, dept

   where emp.deptno = dept.deptno; 





--我们假装EMP和DEPT两个表示大表!

begin

     dbms_stats.set_table_stats

         ( user, 'EMP', numrows=>1000000, numblks=>100000 );

     dbms_stats.set_table_stats

         ( user, 'DEPT', numrows=>100000, numblks=>10000 );

  end; 

  /

  

code8:

SQL> select ename from emp_dept;





Execution Plan

-----------------------------

Plan hash value: 615168685





----------------------------------------------------------------------------------------

| Id   | Operation          | Name  | Rows  |  Bytes |TempSpc | Cost (%CPU) | Time     |

----------------------------------------------------------------------------------------

|    0 | SELECT STATEMENT   |       |  1000K|     31M|        | 31515    (1)| 00:06:19 |

|*   1 |  HASH JOIN         |       |  1000K|     31M|   2448K| 31515    (1)| 00:06:19 |

|    2 |   TABLE ACCESS FULL| DEPT  |   100K|   1269K|        |  2716    (1)| 00:00:33 |

|    3 |   TABLE ACCESS FULL| EMP   |  1000K|     19M|        | 27151    (1)| 00:05:26 |

----------------------------------------------------------------------------------------





Predicate Information (identified by operation id):

---------------------------------------------------

   1 - access("EMP"."DEPTNO"="DEPT"."DEPTNO")





此处我们只查询EMP表的ename列,DEPT表现得没啥必要。但是DEPTNO是DEPT表的主键,EMP表的外键!这样就导致EMP表中DEPTNO列是非空的。但是我们没有指明这层关系,

ORACLE自然不知道,所以我们这么做:

alter table dept add constraint dept_pk primary key(deptno);





alter table emp add constraint emp_fk_dept foreign key(deptno) references dept(deptno);





select ename from emp_dept;





Execution Plan

------------------------------

Plan hash value: 3956160932





--------------------------------------------------------------------------

| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------

|   0 | SELECT STATEMENT  |      | 50000 |   976K| 27152   (1)| 00:05:26 |

|*  1 |  TABLE ACCESS FULL| EMP  | 50000 |   976K| 27152   (1)| 00:05:26 |

--------------------------------------------------------------------------





Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("EMP"."DEPTNO" IS NOT NULL)





起作用了!加了个filter。

  

3、来看一个NOT NULL和主外键约束搭配物化视图查询是如何影响执行计划的

我经常把物化视图作为”数据仓库索引“使用,其最重要的用途是作为“preanswer”,将针对特定表的复杂和长时间运行的结果保存在一个永久表中。

说白了就是加速查询速度。

alter table emp drop constraint emp_fk_dept;





alter table dept drop constraint dept_pk;





code10:

create materialized view mv enable query rewrite

  as

  select dept.deptno, dept.dname, count (*) from emp, dept

   where emp.deptno = dept.deptno

   group by dept.deptno, dept.dname;





begin

    dbms_stats.set_table_stats

    ( user, 'MV', numrows=>100000, numblks=>10000 );

end; 

/





code11: 一个查询使用物化视图

select dept.dname, count (*) from emp, dept

   where emp.deptno = dept.deptno and dept.dname = 'SALES'

   group by dept.dname; 





Execution Plan

------------------------------

Plan hash value: 1703036361





--------------------------------------------------------------------------------------------

| Id  | Operation                         | Name | Rows  |  Bytes| Cost (%CPU)  | Time     |

--------------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT                  |      |  1000 | 22000 |  2716     (1)| 00:00:33 |

|   1 |  SORT GROUP BY NOSORT             |      |  1000 | 22000 |  2716     (1)| 00:00:33 |

|*  2 |   MAT_VIEW REWRITE ACCESS FULL    | MV   |  1000 | 22000 |  2716     (1)| 00:00:33 |

--------------------------------------------------------------------------------------------





Predicate Information (identified by operation id):

---------------------------------------------------

   2 - filter("MV"."DNAME"='SALES')





code12: 一个查询没有使用物化视图

SQL> select count(*) from emp;





COUNT(*)

--------

      14





SQL> select * from table(dbms_xplan.display_cursor);





PLAN_TABLE_OUTPUT

-----------------------

SQL_ID  g59vz2u4cu404, child number 1

-----------------------

select count(*) from emp





Plan hash value: 2083865914





-------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Cost (%CPU)| Time     |

-------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      |       | 27142 (100)|          |

|   1 |  SORT AGGREGATE    |      |     1 |            |          |

|   2 |   TABLE ACCESS FULL| EMP  |  1000K| 27142   (1)| 00:05:26 |

-------------------------------------------------------------------

14 rows selected.









很明显,更有的执行计划应该是查询物化视图中实现计算好的数据。

为此,我们需要告诉数据库以下内容:

DEPTNO in DEPT is a primary key

DEPTNO in EMP is a foreign key

DEPTNO in EMP is a NOT NULL column





alter table dept add constraint dept_pk primary key(deptno);





alter table emp add constraint emp_fk_dept foreign key(deptno) references dept(deptno);





alter table emp modify deptno NOT NULL;





code13:

SQL> select count(*) from emp;





COUNT(*)

-------

     14





SQL> select * from table(dbms_xplan.display_cursor);





PLAN_TABLE_OUTPUT

-----------------------

SQL_ID  g59vz2u4cu404, child number 2

-----------------------

select count (*) from emp





Plan hash value: 1747602359





--------------------------------------------------------------------------------------

| Id  | Operation                     | Name | Rows |  Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT              |      |      |        |  2716 (100)|          |

|   1 |  SORT AGGREGATE               |      |    1 |     13 |            |          |

|   2 |   MAT_VIEW REWRITE ACCESS FULL| MV   |  100K|   1269K| 2716    (1)| 00:00:33 |

--------------------------------------------------------------------------------------









关于物化视图的查询重写特性参考:
http://blog.itpub.net/28719055/viewspace-1258720/

-------------------------------

Dylan    Presents.

oracle中约束(constraints)是如何影响查询计划的的更多相关文章

  1. 彻底理解Oracle中的集合操作与复合查询

    --Oracle中的复合查询 复合查询:包含集合运算(操作)的查询 常见的集合操作有: union: 两个查询的并集(无重复行.按第一个查询的第一列升序排序) union all:两个查询的并集(有重 ...

  2. 在oracle中操作表及字段注释,查询一个表的所有字段名以及属性和约束

    1.查询表注释 SELECT * FROM USER_TAB_COMMENTS; 三列:TABLE_NAME,TABLE_TYPE,COMMENTS 2.查询字段注释 SELECT * FROM US ...

  3. ORACLE中关于表的一些特殊查询语句

    1: 如何判断字段的值里面:那些数据包含小写字母或大小字母 判断字段NAME的值里面有小写字母的记录 方式1: SELECT NAME FROM TEST WHERE regexp_like(NAME ...

  4. oracle中关于clob类型字段的查询效率问题

    今天,公司项目某个模块的导出报如下错误: HTTP Status 500 – Internal Server Error Type Exception Report Message Handler d ...

  5. oracle中创建用户,指定要查询的视图 --九五小庞

    --01: 创建PACS用户,并且初始密码为PACScreate user PACS identified by "PACS"; --02: 赋予该用户登录数据库的权限.grant ...

  6. Mysql中类似于Oracle中connect by ... start with的查询语句(木大看懂)

    表结构 create table sys_branch ( id ) not null, parent_id ), branch_name ), delete_flag ), primary key ...

  7. 查询oracle中所有用户信息 禁用用户

    ----查询oracle中所有用户信息 ----1.查询数据库中的表空间名称 ----1)查询所有表空间 select tablespace_name from dba_tablespaces; se ...

  8. 对于Oracle中分页排序查询语句执行效率的比较分析

    转自:http://bbs.csdn.net/topics/370033478 对于Oracle中分页排序查询语句执行效率的比较分析 作者:lzgame 在工作中我们经常遇到需要在Oracle中进行分 ...

  9. Oracle基础 11 约束 constraints

    --主.外键约束 create table t(  id int primary key); create table t1(  id int references t(id)); 或者create ...

  10. oracle中imp导入数据中文乱码问题(转)

    (转自  http://blog.chinaunix.net/uid-186064-id-2823338.html) oracle中imp导入数据中文乱码问题 用imp命令向oracle中导入数据后, ...

随机推荐

  1. Go-函数-func

  2. Qt5.9 UI设计(一)——在win10系统上安装Qt5.9

    安装环境 win10 系统 Qt5.9.0 版本 官方下载地址 可以从官方网站获取:https://www.qt.io/zh-cn/ 现在的安装包跟以前的有些区别,加上网络比较慢,我这里演示的是Qt5 ...

  3. 使用 golang 开发 PHP 扩展

    使用 golang 开发 PHP 扩展 环境 golang go1.19.9 darwin/arm64 Macos/Linux PHP8.1.11 编译安装 实战 PHP脚手架生成 进入PHP源码,使 ...

  4. [转帖]ntp导致的时钟回拨

    https://zhuanlan.zhihu.com/p/587313130 我们的服务器时间校准一般是通过ntp进程去校准的.但由于校准这个动作,会导致时钟跳跃变化的现象.而这种情况里面,往往回拨最 ...

  5. [转帖]TiKV 多副本丢失以及修复实践

    https://tidb.net/blog/ad45bad9#6%E6%80%BB%E7%BB%93 1实验目的 随着tidb使用场景的越来越多,接入的业务越来越重要,不由得想试验下tidb组件的高可 ...

  6. [转帖]Debian开启SSH

    一.Debian开启SSH 参考链接: https://blog.csdn.net/zzpzheng/article/details/71170572 https://help.aliyun.com/ ...

  7. [转帖]5. Tikv安装部署

    5. Tikv安装部署 5.1. 概述 TiDB 是 PingCAP 公司自主设计.研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactiona ...

  8. [转帖]Linux AWK工作原理

    https://www.cnblogs.com/yeyuzhuanjia/p/13967513.html 本篇文章我们主要为大家介绍 AWK 是如何工作的. AWK 工作流程可分为三个部分:1.读输入 ...

  9. ipset的学习与使用

    ipset的学习与使用 场景说明 虽然可以通过: firewall-cmd --zone=trusted --add-source=$1 --permanent && firewall ...

  10. [转帖]SPEC2006

    安装步骤 # Ubuntu16.04 # 注意安装gFortran . ./install.sh . ./shrc 一般情况下经过以上步骤即可安装完毕,进行使用,注意需要执行shrc设置完环境变量以后 ...