Oracle 模糊查询优化

模糊查询是数据库查询中经常用到的，一般常用的格式如下：

（1）字段 like '%关键字%' 字段包含"关键字“的记录即使在目标字段建立索引也不会走索引，速度最慢

（2）字段 like '关键字%' 字段以"关键字"开始的记录可以使用到在目标字段建立的升序索引

（3）字段 like '%关键字' 字段以"关键字“结束的记录可以使用到目标字段建立的降序索引

对于无法使用索引的 '%关键字%' 模式，有没有办法优化呢，答案是肯定的，

在ORacle中提供了instr(strSource,strTarget)函数，比使用'%关键字%'的模式效率高很多。

instr函数说明：

INSTR

　　(源字符串, 目标字符串, 起始位置, 匹配序号)

　　在Oracle/PLSQL中，instr函数返回要截取的字符串在源字符串中的位置。只检索一次，就是说从字符的开始

　　到字符的结尾就结束。

　　语法如下：

　　instr( string1, string2 [, start_position [, nth_appearance ] ] )

　　参数分析：

　　string1

　　源字符串，要在此字符串中查找。

　　string2

　　要在string1中查找的字符串.

　　start_position

　　代表string1 的哪个位置开始查找。此参数可选，如果省略默认为1. 字符串索引从1开始。如果此参数为正，从左到右开始检索，如果此参数为负，从右到左检索，返回要查找的字符串在源字符串中的开始索引。

　　nth_appearance

　　代表要查找第几次出现的string2. 此参数可选，如果省略，默认为 1.如果为负数系统会报错。

　　注意：

　　如果String2在String1中没有找到，instr函数返回0.

　　示例：

　　SELECT instr('syranmo','s') FROM dual; -- 返回 1

　　SELECT instr('syranmo','ra') FROM dual; -- 返回 3

　　SELECT instr('syran mo','a',1,2) FROM dual; -- 返回 0

　　对比：

　　 instr(title,'手册')>0 相当于 title like '%手册%'

　　instr(title,'手册')=1 相当于 title like '手册%'

　　instr(title,'手册')=0 相当于 title not like '%手册%'

模糊查询优化：

　　了解了instr函数的用法，优化就变得简单了,例如 %关键字% 等同于 instr(字段,'关键字')>0

实际应用：

t表中将近有1100万数据，很多时候，我们要进行字符串匹配，在SQL语句中，我们通常使用like来达到我们搜索的目标。但经过实际测试发现，like的效率与instr函数差别相当大。下面是一些测试结果：

SQL> set timing on
SQL> select count(*) from t where instr(title,'手册')>0;

COUNT(*)
----------
65881

Elapsed: 00:00:11.04
SQL> select count(*) from t where title like '%手册%';

COUNT(*)
----------
65881

Elapsed: 00:00:31.47
SQL> select count(*) from t where instr(title,'手册')=0;

COUNT(*)
----------
11554580

Elapsed: 00:00:11.31
SQL> select count(*) from t where title not like '%手册%';

COUNT(*)
----------
11554580

另外，我在结另外一个2亿多的表，使用8个并行，使用like查询很久都不出来结果，但使用instr,4分钟即完成查找，性能是相当的好。这些小技巧用好，工作效率提高不少。通过上面的测试说明，ORACLE内建的一些函数，是经过相当程度的优化的。

instr(title,’aaa’)>0 相当于like

instr(title,’aaa’)=0 相当于not like

特殊用法：

select   id, name from users where instr('101914, 104703', id) > 0;
  它等价于
select   id, name from users where id = 101914 or id = 104703;

使用Oracle的instr函数与索引配合提高模糊查询的效率

一般来说，在Oracle数据库中，我们对tb表的name字段进行模糊查询会采用下面两种方式：
1.select * from tb where name like '%XX%';
2.select * from tb where instr(name,'XX')>0;

若是在name字段上没有加索引，两者效率差不多，基本没有区别。

为提高效率，我们在name字段上可以加上非唯一性索引：
create index idx_tb_name on tb(name);

这样，再使用

select * from tb where instr(name,'XX')>0;

这样的语句查询，效率可以提高不少，表数据量越大时两者差别越大。但也要顾及到name字段加上索引后DML语句会使索引数据重新排序的影响。

另一种未知的方案：

有人说了用全文索引，我看了，步骤挺麻烦，但是是个不错的方法，留着备用：

http://sandish.itpub.net/post/4899/464369

对cmng_custominfo 表中的address字段做全文检索：
1，在oracle9201中需要创建一个分词的东西：

BEGIN
ctx_ddl.create_preference ('SMS_ADDRESS_LEXER', 'CHINESE_LEXER');
--ctx_ddl.create_preference ('my_lexer', 'chinese_vgram_lexer'); 不用
end;

2，创建全文检索：

CREATE INDEX INX_CUSTOMINFO_ADDR_DOCS ON cmng_custominfo(address) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_ADDRESS_LEXER');

3，查询时候，使用：

select * from cmng_custominfo where contains (address, '金色新城')>1;

4，需要定期进行同步和优化：
同步：根据新增记录的文本内容更新全文搜索的索引。

begin
ctx_ddl.sync_index('INX_CUSTOMINFO_ADDR_DOCS');
end;

优化：根据被删除记录清除全文搜索索引中的垃圾

begin
ctx_ddl.optimize_index('INX_CUSTOMINFO_ADDR_DOCS', 'FAST');
end;

5，采用job做步骤4中的工作：

1)该功能需要利用oracle的JOB功能来完成
因为oracle9I默认不启用JOB功能，所以首先需要增加ORACLE数据库实例的JOB配置参数：
job_queue_processes=5
重新启动oracle数据库服务和listener服务。

2)同步和优化
--同步 sync:
variable jobno number;
BEGIN
DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.sync_index(''INX_CUSTOMINFO_ADDR_DOCS'');', SYSDATE, 'SYSDATE + (1/24/4)');
　commit;
END;

--优化
variable jobno number;
begin
　DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.optimize_index(''INX_CUSTOMINFO_ADDR_DOCS'',''FULL'');', SYSDATE, 'SYSDATE + 1');
　commit;
END;

其中，第一个job的SYSDATE + (1/24/4)是指每隔15分钟同步一次，第二个job的SYSDATE + 1是每隔1天做一次全优化。具体的时间间隔，可以根据应用的需要而定

6，索引重建
重建索引会删除原来的索引，重新生成索引，需要较长的时间。
重建索引语法如下：
ALTER INDEX INX_CUSTOMINFO_ADDR_DOCS REBUILD;

据网上一些用家的体会，oracle重建索引的速度也是比较快的，有一用家这样描述：

Oracle 的全文检索建立和维护索引要比ms sql server都要快得多，笔者的65万记录的一个表建立索引只需要20分钟，同步一次只需要1分钟。
因此，也可以考虑用job的办法定期重建索引。

Oracle 模糊查询优化的更多相关文章

Oracle 模糊查询方法
在这个信息量剧增的时代,怎样帮助用户从海量数据中检索到想要的数据.模糊查询是不可缺少的. 那么在Oracle中模糊查询是怎样实现的呢? 一.我们能够在where子句中使用likeke ...
Oracle模糊查询CONCAT参数个数无效
在使用MyBatis操作Oracle数据库的时候,写模糊查询突然发现原本在MySql中正确的代码,在Oracle中报错,参数个数无效 <if test="empId!=null and ...
oracle模糊查询mysql的区别
https://blog.csdn.net/weixin_38673554/article/details/86503982#_1 oracle与使用mysql的区别 https://www.cnbl ...
oracle模糊查询效率提高
1.使用两边加‘%’号的查询,oracle是不通过索引的,所以查询效率很低. 例如:select count(*) from lui_user_base t where t.user_name lik ...
oracle模糊查询效率可这样提高
1.使用两边加'%'号的查询,oracle是不通过索引的,所以查询效率很低. 例如:select count(*) from lui_user_base t where t.user_name lik ...
oracle 模糊查询中的转义字符用法
drop view aaa; create view aaa as select '_BCDE' A FROM DUAL UNION ALL SELECT 'ABCDE' FROM DUAL UNIO ...
Oracle模糊查询
通配符 % 匹配零个或更多的任意字符 _ 匹配一个任意字符 [ ] 匹配指定范围中的一个字符([a-z],[0-9]) [^ ] 不属于指定范围,不包含其中的字符 escape转义 --查询 ...
oracle模糊查询提高效率的方法
转载:https://blog.csdn.net/weixiaohuai/article/details/83513957 https://blog.csdn.net/chihen/article/d ...
LinqToEntity模糊查询的方法选择
LinqToEntity针对oracle模糊查询方法:Contains() 转换出来的sql是 like 关键字方法:IndexOf() 转换出来的sql是 instr() 函数 lik ...

随机推荐

Hello TLM
前言目标了解TLM程序的基本过程.TLM的英文全称是Transaction Level Modeling,中文翻译为事务级建模.它是在SystemC基础上的一个扩展库. 功能描述模块A向模块B发 ...
jQuery笔记（一）
day01 - jQuery 学习目标: 能够说出什么是 jQuery 能够说出 jQuery 的优点能够简单使用 jQuery 能够说出 DOM 对象和 jQuery 对象的区别能够写出常用的 ...
buuctf-[网鼎杯 2018]Fakebook 1
这道题,也是费了很大的劲,慢慢理解慢慢消化,今天,才开始把wp写出来首先我们先扫描一波目录,用dirsearch扫一手,发现有robots.txt文件 dirseach自带的字典在db目录下,使用格 ...
jquery和zepto有何区别？
1.针对移动端程序,Zepto有一些基本的触摸事件可以用来做触摸屏交互(tap事件.swipe事件),Zepto是不支持IE浏览器的. 2.DOM操作的区别:添加id时jQuery不会生效而Zepto ...
SPFA算法优化
前言 \(SPFA\) 通常在稀疏图中运行效率高于 \(Dijkstra\) ,但是也容易被卡. 普通的 \(SPFA\) 时间复杂度为 \(O(km)\) ,其中 \(k\) 是一条边松弛其端点点的 ...
POI2009 KON-Ticket Inspector
题目链接 Description 一辆火车依次经过 \(n\) 个车站,顺序是 \(1, 2, 3, ..., n - 1, n\).给定 \(A_{i, j}\) 表示从 \(i\) 站上车,\(j ...
Vue高仿网易云网页端源码
音乐播放器虽然烂大街了,但是作为前端没自己撸一个一直是个遗憾, 而且偶然间发现 pc 端 web 版的网易云音乐做的实在是太简陋了, 社区仿 pc 客户端的网易云也不多见,为了弥补这个遗憾, 就用 ...
怎么确定一个Flink job的资源
怎么确定一个Flink job的资源 Slots && parallelism 一个算子的parallelism 是5 ,那么这个算子就需要5个slot, 公式 :一个算子的paral ...
angular8 大地老师学习笔记---第十课
import { Component,Input} from '@angular/core';@Component({ selector: 'app-lifecycle', templateUrl: ...
Networking from the container's point of view 笔记
Networking from the container's point of view Published portsThe type of network a container uses, w ...

Oracle 模糊查询 优化

模糊查询是数据库查询中经常用到的，一般常用的格式如下：

Oracle 模糊查询 优化的更多相关文章

随机推荐

热门专题

Oracle 模糊查询优化

Oracle 模糊查询优化的更多相关文章