抱歉用了这么渣的标题,其实是一个很简单而且很常见的需求:假设我们有一个学生表,它有一个状态字段:

create table T_STU
(
STU_ID VARCHAR2(36) not null,
NAME VARCHAR2(255),
CODE VARCHAR2(255),
STATE NUMBER(10),
START_YEAR NUMBER(10)
);
alter table T_STU2 add constraint PK_STU2 primary key (STU_ID);
create index IX_STU21 on T_STU2 (STATE);

由一个数字代表学生的各种状态,例如 1 表示“在校”,2 表示“休学”,3 表示“肄业”,5表示“毕业”。
现在想要创建一个查询学生表的存储过程,我们希望它能灵活点儿,可以查询出某几个状态下的学生。例如,假设存储过程叫做 SP_QUERY_STU_BY_STATES,
SP_QUERY_STU_BY_STATES('2,3')
将获得所有休学和肄业的学生。我们从最简单的方法开始,寻求一种相对较好的解决方案。

【方法1】将参数直接放在 in 表达式里面(不可用)

create or replace procedure SP_QUERY_STU_BY_STATES1(
cur_OUT out SYS_REFCURSOR,
p_states varchar2
) is
begin
open cur_OUT for
select t.* from t_stu t
where t.state in (p_states);
end SP_QUERY_STU_BY_STATES1;

调用 SP_QUERY_STU_BY_STATES1('2') 没有问题,但是调用 SP_QUERY_STU_BY_STATES1('2,3')  会报“ORA-01722:无效数字”的错误。因为 Oracle 不能把字符串直接转换为列表。

【方法2】使用动态SQL语句(可用,但是有许多缺点)

将 p_states 作为SQL语句的一部分拼接起来之后再执行,就不会报 ORA-01722 错误了。

create or replace procedure SP_QUERY_STU_BY_STATES2(
cur_OUT out SYS_REFCURSOR,
p_states varchar2
)
is
query_string VARCHAR2(4000);
begin query_string := 'select /*+RULE*/ t.* from t_stu t
where t.state in (' || p_states || ')'; dbms_output.put_line(query_string); -- for debug open cur_OUT for query_string; end SP_QUERY_STU_BY_STATES2;

注意这里使用增加 /*+RULE*/ 标记的方式强制使用RBO优化器,可以让Oracle利用STATE字段上的索引而提高效率。实测查询状态为2,3的学生(从3,000,000条里取出154条数据),不加 /*+RULE*/ 标记时CBO会使用全表扫描,耗时2.3秒(即使刚刚做完表分析也要耗时0.6秒);加上 /*+RULE*/ 标记利用STATE字段上的索引,耗时0.172秒。所以后面的所有查询都会加上/*+RULE*/ 标记。

虽然方法2可以得到正确的结果,但是它有好几个让人抓狂的缺点。
1. 动态SQL的效率要比静态SQL稍低。
2. 可读性差。SQL语句本身可读性就不好。想象一下,读一个上百行的复杂查询本身就很让人头大了,如果里面还有大量判断语句和字符串拼接,整个代码会丑得让人想吐。
3. 语法错误要到运行时才会暴露出来。
4. 想看执行计划挺不方便的,要使用 dbms_output.put_line() 把生成的SQL输出才能查看执行计划。

总之,动态SQL是非常灵活同时又是非常恶心的方法。记得有一天吃完午饭,突然感觉实在受不了动态SQL了,就憋了半小时,想到了下面这个方法。

【方法3】使用反着的LIKE语句(可用,但效率低下)

create or replace procedure SP_QUERY_STU_BY_STATES3(
cur_OUT out SYS_REFCURSOR,
p_states varchar2
) is
begin
open cur_OUT for
select /*+RULE*/ * from t_stu t
where ',' || p_states || ',' like '%,' || t.state || ',%'; end SP_QUERY_STU_BY_STATES3;

上面这段代码可以这么理解:假设 p_states 参数为 '2,3',对于 STATE 字段为 2 或 3 的数据, '2,3' like '%2%' 和 '2,3' like '%3%' 都会被判定为真;对于STATE字段为5的数据,'2,3' like '%5%' 会被判定为假,这样自然就筛选出了状态为2和3的数据。之所以拼接了许多 “,” ,是因为如果有一个状态是12的话,'12,3' like '%2%'也会被判定为真,这样就错误地把不需要的数据也包含进来了。

这个方法除了写法有些奇怪之外,最大的缺点是性能很差——这种写法会造成全表扫描,类型转换和字符串匹配也要耗费不少的时间。实测获取状态为2,3的数据耗时2.3秒。

【方法4】将字符串转换为数组(可用,而且性能好)

先来看一下最终结果

create or replace procedure SP_QUERY_STU_BY_STATES4(
cur_OUT out SYS_REFCURSOR,
p_states varchar2
) is
begin
open cur_OUT for
select /*+RULE*/ * from t_stu t
where t.state in (select column_value from TABLE(f_cstr_to_list(p_states)));
end SP_QUERY_STU_BY_STATES4;

这种方法可以利用STATE上的索引,性能很好。实测获取2,3状态的数据耗时0.171秒。

这个方法的重点在于如何把逗号分隔的字符串状态列表转换为数组。首先,需要定义一个内容为字符串的数组类型 t_strlist

CREATE OR REPLACE Type t_strlist as Table of Varchar2(4000);

由于Oracle没有分割字符串的 split 函数,下面这个将逗号分隔的字符串转换为数组的函数稍稍有些杂乱,我尽量写得可读性好一点,相信并不难看懂。

CREATE OR REPLACE Function f_cstr_to_list
-- 将逗号分隔的字符串分解为列表
(
cstr In Varchar2
)
Return t_strlist
is
v_start number := 1; -- 迭代搜索开始位置
v_i number := 1; -- 迭代次数
v_position number := 0; -- 每次迭代找到的逗号字符的位置
v_str varchar2(4000); -- 源字符串
Result t_strlist;
Begin
Result := t_strlist();
v_str := cstr || ','; loop
v_position := instr(v_str, ',', 1, v_i);
if(v_position > 0) then
Result.EXTEND;
Result(v_i) := substr(v_str, v_start, v_position-v_start); v_start := v_position + 1;
v_i := v_i + 1;
else
exit;
end if;
end loop; return Result;
End;

这种方法除了需要自己写一个自定义函数有些麻烦(当然只需麻烦一次),而且需要冒函数写得不对而引发BUG的风险之外,可以说是非常完美。当然,实战中往往还需要按姓名等字段进行模糊查询,这时的效率如何呢?我们来试试下面这个更为实用一点的存储过程。

create or replace procedure SP_QUERY_STU_BY_NAME_STATES(
cur_OUT out SYS_REFCURSOR,
p_name varchar2,
p_states varchar2
) is
begin
open cur_OUT for
select /*+RULE*/ * from t_stu t
where t.name like '%' || p_name || '%'
and t.state in (select column_value from TABLE(f_cstr_to_list(p_states)));
end SP_QUERY_STU_BY_NAME_STATES;

看一下执行计划:


Oracle会先使用STATE上的索引将检索范围缩小然后再模糊匹配,效率自然会比较高。实测从3,000,000条数据里获取77条耗时0.11秒。

[Oracle](不会的是三炮)把状态列表作为存储过程参数这件小事的更多相关文章

  1. oracle 之 内存—鞭辟近里(三)

    oracle 之 内存—鞭辟近里(三) 今天是2013-07-08,今天晚上突然接到一个电话,我的外甥问我的qq是多少,我感觉很吃惊,他长大了.在他现在这个年龄就开始接触网络,我难免有少许担心,希望他 ...

  2. Oracle 数据库分页查询的三种方法

    一.Oracle 数据库分页查询的三种方法 1.简介 不能对 rownum 使用 >(大于或等于 1 的数值).>=(大于 1 的数值).=(不等于 1 的数值),否则无结果.所以直接用 ...

  3. 【书评:Oracle查询优化改写】第三章

    [书评:Oracle查询优化改写]第三章 BLOG文档结构图       导读 各位技术爱好者,看完本文后,你可以掌握如下的技能,也可以学到一些其它你所不知道的知识,~O(∩_∩)O~: ① 隐含参数 ...

  4. python函数,lambda表达式,三目运算,列表解析,递归

    一.自定义函数 定义函数时,函数体不执行:只有在调用函数时,函数体才执行.函数的结构: 1. def 2. 函数名 3. 函数体 def func_name(): 函数体 4. 返回值 如果没有声明返 ...

  5. [转]session缓存机制和三种对象状态

    摘自 http://blog.csdn.net/csh624366188/article/details/7612142 Hibernate 的Session就是其中的一个,它提供了基本的增,删,改, ...

  6. 第三章——使用系统函数、存储过程和DBCC SQLPERF命令来监控SQLServer(3)

    原文:第三章--使用系统函数.存储过程和DBCC SQLPERF命令来监控SQLServer(3) 本文为这个系列最后一篇.将是如何使用DBCC命令来监控SQLServer日志空间的使用情况. 前言: ...

  7. Hibernate中的三种数据状态

    Hibernate中的三种数据状态(临时.持久.游离) 1.临时态(瞬时态) 不存在于session中,也不存在于数据库中的数据,被称为临时态. 比如:刚刚使用new关键字创建出的对象. 2.持久态 ...

  8. 浅谈Hibernate中的三种数据状态

    Hibernate中的三种数据状态:临时.持久.游离 1.临时态(瞬时态) 不存在于session中,也不存在于数据库中的数据,被称为临时态. 数据库中没有数据与之对应,超过作用域会被JVM垃圾回收器 ...

  9. 命令stat anaconda-ks.cfg会显示出文件的三种时间状态(已加粗):Access、Modify、Change。这三种时间的区别将在下面的touch命令中详细详解:

    7.stat命令 stat命令用于查看文件的具体存储信息和时间等信息,格式为"stat 文件名称". stat命令可以用于查看文件的存储信息和时间等信息,命令stat anacon ...

随机推荐

  1. Javascript实现的数组降维——维度不同,怎么谈恋爱

    数组的元素可能是数组,这样一层层嵌套,可能得到一个嵌套很深的数组,数组降维要做的事就是把嵌套很深的数组展开,一般最后得到一个一维数组,其中的元素都是非数组元素,比如数组[1, [2, 3, [4, 5 ...

  2. LWIP总结

    介绍 Lwip,light weight IP:是由Adam Dunkels 开发的一个小型开源的TCP/IP协议栈:目前已经为全球共同开发的开源协议:支持TCPIP协议族的核心协议:包括:ARP/I ...

  3. mybatis Caused by: org.apache.ibatis.reflection.ReflectionException: Error instantiating class .. with invalid types () or values (). Cause: java.lang.NoSuchMethodException: ...<init>()

    如果有带参数的构造器,编译器不会自动生成无参构造器.当查询需要返回对象时,ORM框架用反射来调用对象的无参构造函数,所以会导致此类异常 public Test(){ }

  4. 一台电脑安装多个版本的jdk

    我们平时在做Java开发的时候,有时需要使用多个版本的jdk, 那么一台电脑上需要安装多个JDK了. 那一台电脑上可不可以同时安装多个版本的jdk呢? 答案是可以的! 但使用的时候,只能使用一个,不能 ...

  5. TF-IDF算法确定阅读主题词解答英语阅读Title题目

    #include <math.h> #include <time.h> #include <stdlib.h> #include <iostream> ...

  6. 一、PID控制原理

    在模拟控制系统中,控制器最常用的控制规律是PID控制.模拟PID控制系统原理框图如下图.系统由模拟PID控制器和被控对象组成. PID控制器是一种线性控制器,它根据给定值Yd(t)与实际输出值Y(t) ...

  7. PHP CI框架 result()详解

    该方法执行成功返回一个对象数组,失败则返回一个空数组. 一般情况下,我们使用下面的方法遍历结果,代码就像这样: $query = $this->db->query("要执行的 S ...

  8. 【BZOJ3036】绿豆蛙的归宿 概率与期望

    最水的概率期望,推荐算法合集之<浅析竞赛中一类数学期望问题的解决方法> #include <iostream> #include <cstdio> using na ...

  9. js闭包-在你身边却不知

    今天组里小伙很纳闷的问了我js绑事件带出的一个小问题,随便聊聊闭包那点事,背景如下: 当点击Button的时候给li绑定事件,事件的大概内容是获取li位置的index再做点事,据他描述代码看上去也没错 ...

  10. 在iPhone上同时关闭语音控制和siri的方法

    分享 步骤及要点:1.在设置里打开siri.语音控制就自动关闭了.2.在siri里的"仅语言拨号"语言项里选择"土耳其文"或者"阿拉伯文". ...