【转】SQL多条件模糊查询解决方案-存储过程

前言：

算法的基本特性在前几篇博客中已经做了详细的说明，经过不断的改进优化，到归仓的时候了，也就是说，该算法告一段落，不再更新。

作为最终的解决方案，简要的总结一下算法特性，以方便读者参阅。

l 目的：主要用于多条件模糊匹配。

l 贪婪特性：返回满足条件尽可能多的记录。

l 权重特性：为关键词分配权重，代表关键词的重要性，在不破坏贪婪特性的前提下，返回权重高的记录。

l 必要关键词指定特性：在不破坏贪婪特性和权重特性的前提下，返回的结果中必须包含指定的关键词。

l 典型应用：问-答系统，例如百度提问、京东商品咨询。

经过分析，在最终的解决方案中，提供两个版本的算法，已经封装成存储过程和函数，直接导入数据库即可。

普通版本：

l 描述：基于SQL的LIKE语句实现，使用简单，但受限于LIKE语句，不适合超大数据量处理。指定必要词会加快处理速度。

l 使用范围：万级别的数据量，数据量超过1万条，将导致运行缓慢。

l 使用方法：直接在查询分析器中运行脚本导入数据库即可。

l 调用示例：execute proc_Common_SuperLike'id','t_test','content','20','|','[i]|o|c'

l 参数说明：id表的主键字段名称。t_test表名。content匹配内容字段名称。20选出20个记录（从顶至下匹配度越来越低）。|关键字的分隔符号。[i]|o|c一共有i，o，c三个关键字，通过|分隔，其中i是必要词。

 GO

 CREATE function Get_StrArrayLength

 (

  @str varchar(1024),  --要分割的字符串

  @split varchar(10)  --分隔符号

 )

 returns int

 as

  begin

   declare @location int

   declare @start int

   declare @length int

   set @str=ltrim(rtrim(@str))

   set @location=charindex(@split,@str)

   set @length=1

    while @location<>0

      begin

       set @start=@location+1

       set @location=charindex(@split,@str,@start)

       set @length=@length+1

      end

    return @length

  end

  GO

  CREATE function Get_StrArrayStrOfIndex

 (

  @str varchar(1024),  --要分割的字符串

  @split varchar(10),  --分隔符号

  @index int --取第几个元素

 )

 returns varchar(1024)

 as

 begin

  declare @location int

  declare @start int

  declare @next int

  declare @seed int

  set @str=ltrim(rtrim(@str))

  set @start=1

  set @next=1

  set @seed=len(@split)

  set @location=charindex(@split,@str)

  while @location<>0 and @index>@next

    begin

     set @start=@location+@seed

     set @location=charindex(@split,@str,@start)

     set @next=@next+1

    end

  if @location =0 select @location =len(@str)+1

 --这儿存在两种情况：1、字符串不存在分隔符号 2、字符串中存在分隔符号，跳出while循环后，@location为0，那默认为字符串后边有一个分隔符号。

  return substring(@str,@start,@location-@start)

 end

 GO

 CREATE PROCEDURE proc_Common_SuperLike

     --要查询的表的主键字段名称

     @primaryKeyName varchar(999),

     --要查询的表名

     @talbeName varchar(999),

     --要查询的表的字段名称，即内容所在的字段

     @contentFieldName varchar(999),

     --查询记录的个数(TOP *),匹配的个数越多,排名越靠前

     @selectNumber varchar(999),

     --匹配字符分隔标记

     @splitString varchar(999),

     --匹配字符组合字符串

     @words varchar(999)

 AS

     declare @sqlFirst varchar(999)

     declare @sqlCenter varchar(999)

     declare @sqlLast varchar(999)

     declare @next int

     declare @arrayLength int

     declare @newWords varchar(999)

     declare @newTable varchar(999)

 BEGIN

     set @newTable=@talbeName

     set @newWords=@words

     set @next=dbo.Get_StrArrayLength(@words,'[')

     --判断是否有必要词

     if @next>1

     begin

         set @newTable=''

         --构造必要表sql语句

         while @next>1

         begin

             set @newTable=@newTable+@contentFieldName+' like ''%'+dbo.Get_StrArrayStrOfIndex(dbo.Get_StrArrayStrOfIndex(@words,'[',@next),']',1)+'%'' AND '

             set @next=@next-1

         end

         set @newTable=left(@newTable,(len(@newTable)-4))

         --构造临时表

         set @newTable='SELECT * into ##tempTable FROM '+ @talbeName + ' WHERE ' + @newTable

         execute(@newTable)

         --指定临时表

         set @newTable='##tempTable'

         --去掉关键词组中的必要词标记

         set @newWords=REPLACE(REPLACE(@words,'[',''),']','')

     end

     set @sqlCenter=''

     set @next=1

     set @arrayLength=dbo.Get_StrArrayLength(@newWords,@splitString)

     while @next<=@arrayLength

     begin

         --构造sql查询条件(中间部分)

         set @sqlCenter = @sqlCenter+'SELECT '+@primaryKeyName+','+CONVERT(varchar(999),@arrayLength-@next+1)+' AS wordPower FROM '+@newTable+' WHERE '+@contentFieldName+' like ''%'+dbo.Get_StrArrayStrOfIndex(@newWords,@splitString,@next)+'%'' UNION ALL '

         set @next=@next+1

     end

     --处理sql语句中间部分,去除最后无用语句

     set @sqlCenter=left(@sqlCenter,(len(@sqlCenter)-10))

     --构造sql语句开头部分

     set @sqlFirst='SELECT TOP '+@selectNumber+' '+@primaryKeyName+',COUNT(*)+SUM(wordPower) AS finalPower FROM ('

     --构造sql语句结尾部分

     set @sqlLast=') AS t_Temp GROUP BY '+@primaryKeyName+' ORDER BY finalPower DESC'

     --拼接出完整sql语句,并执行

     Execute(@sqlFirst+@sqlCenter+@sqlLast)

     --判断临时表是否存在，存在则删除，一定要删除！

     if OBJECT_ID('tempDb..##tempTable') is not null

     begin

         drop table ##tempTable

     end

 END

大数据量版本：

l 描述：基于SQL的全文索引实现，使用较为复杂，但执行速度极快，适合处理大数据量。指定必要词会降低处理速度。

l 使用范围：千万级别的数据量，i3一代笔记本处理器，查询1千万条记录仅需2秒。

l 使用方法：在查询分析器中运行脚本导入数据库，再为要查询的表创建全文索引，索引字段设置为要查询的字段。

l 调用示例：execute proc_Common_SuperLike'id','t_test','content','20','|','[i]|o|c'

 GO

 CREATE function Get_StrArrayLength

 (

  @str varchar(1024),  --要分割的字符串

  @split varchar(10)  --分隔符号

 )

 returns int

 as

  begin

   declare @location int

   declare @start int

   declare @length int

   set @str=ltrim(rtrim(@str))

   set @location=charindex(@split,@str)

   set @length=1

    while @location<>0

      begin

       set @start=@location+1

       set @location=charindex(@split,@str,@start)

       set @length=@length+1

      end

    return @length

  end

  GO

  CREATE function Get_StrArrayStrOfIndex

 (

  @str varchar(1024),  --要分割的字符串

  @split varchar(10),  --分隔符号

  @index int --取第几个元素

 )

 returns varchar(1024)

 as

 begin

  declare @location int

  declare @start int

  declare @next int

  declare @seed int

  set @str=ltrim(rtrim(@str))

  set @start=1

  set @next=1

  set @seed=len(@split)

  set @location=charindex(@split,@str)

  while @location<>0 and @index>@next

    begin

     set @start=@location+@seed

     set @location=charindex(@split,@str,@start)

     set @next=@next+1

    end

  if @location =0 select @location =len(@str)+1

 --这儿存在两种情况：1、字符串不存在分隔符号 2、字符串中存在分隔符号，跳出while循环后，@location为0，那默认为字符串后边有一个分隔符号。

  return substring(@str,@start,@location-@start)

 end

 GO

 CREATE PROCEDURE proc_Common_SuperLike

     --要查询的表的主键字段名称

     @primaryKeyName varchar(999),

     --要查询的表名

     @talbeName varchar(999),

     --要查询的表的字段名称，即内容所在的字段

     @contentFieldName varchar(999),

     --查询记录的个数(TOP *),匹配的个数越多,排名越靠前

     @selectNumber varchar(999),

     --匹配字符分隔标记

     @splitString varchar(999),

     --匹配字符组合字符串

     @words varchar(999)

 AS

     declare @sqlFirst varchar(999)

     declare @sqlCenter varchar(999)

     declare @sqlLast varchar(999)

     declare @next int

     declare @arrayLength int

     declare @newTable varchar(999)

 BEGIN

     set @newTable=''

     set @sqlCenter=''

     set @next=1

     set @arrayLength=dbo.Get_StrArrayLength(@words,@splitString)

     while @next<=@arrayLength

     begin

         --构造sql查询条件(中间部分)

         --判断是否是必要词

         if CHARINDEX('[',dbo.Get_StrArrayStrOfIndex(@words,@splitString,@next))>0

         begin

             set @sqlCenter = @sqlCenter+'SELECT '+@primaryKeyName+','+CONVERT(varchar(999),@arrayLength-@next+1)+' AS wordPower FROM '+@talbeName+' WHERE CONTAINS(' + @contentFieldName + ',''"*'+REPLACE(REPLACE(dbo.Get_StrArrayStrOfIndex(@words,@splitString,@next),'[',''),']','')+'*"'') UNION ALL '

             --构造必要词

             set @newTable=@newTable+'CONTAINS(' + @contentFieldName + ',''"*'+REPLACE(REPLACE(dbo.Get_StrArrayStrOfIndex(@words,@splitString,@next),'[',''),']','')+'*"'') AND '

         end

         else

         begin

             set @sqlCenter = @sqlCenter+'SELECT '+@primaryKeyName+','+CONVERT(varchar(999),@arrayLength-@next+1)+' AS wordPower FROM '+@talbeName+' WHERE CONTAINS(' + @contentFieldName + ',''"*'+dbo.Get_StrArrayStrOfIndex(@words,@splitString,@next)+'*"'') UNION ALL '

         end

         set @next=@next+1

     end

     --判断是否有必要词

     if CHARINDEX('[',@words)>0

     begin

         ---处理必要词部分,去除最后无用语句

         set @newTable=left(@newTable,(len(@newTable)-4))

         set @newTable='AS t_Temp WHERE '+ @primaryKeyName +' IN (SELECT '+@primaryKeyName+' FROM ' + @talbeName+' WHERE ' + @newTable + ')'

     end

     else

     begin

         set @newTable='AS t_Temp'

     end

     --处理sql语句中间部分,去除最后无用语句

     set @sqlCenter=left(@sqlCenter,(len(@sqlCenter)-10))

     --构造sql语句开头部分

     set @sqlFirst='SELECT TOP '+@selectNumber+' '+@primaryKeyName+',COUNT(*)+SUM(wordPower) AS finalPower FROM ('

     --构造sql语句结尾部分

     set @sqlLast=') ' + @newTable + ' GROUP BY '+@primaryKeyName+' ORDER BY finalPower DESC'

     --拼接出完整sql语句,并执行

     Execute(@sqlFirst+@sqlCenter+@sqlLast)

 END

附-SQL数据库表全文索引创建指南：

--开启全文索引

sp_fulltext_database enable

--创建索引目录(创建出来是一个目录，用来放索引文件)

CREATE FULLTEXT CATALOG 索引目录名称 --例如myFullText

--创建全文索引

CREATE FULLTEXT INDEX ON 表名(字段名) --为哪个表的哪个字段创建全文索引，例如t_test(content)

KEY INDEX 主键索引名称 ON 索引目录名称 --注意是主键索引名称，而不是主键字段名称！例如，PK__t_test__3213E83F0EA330E9；指定全文索引目录，即放在哪个目录下，例如myFullText

注意：如果在创建数据库表全文索引之前，数据库表中已经有大量记录，那么创建全文索引是需要时间的，因此创建完全文索引后马上使用可能查不到数据。

【转】SQL多条件模糊查询解决方案-存储过程的更多相关文章

asp下实现多条件模糊查询SQL语句
常写一个简单的模糊查询的SQL语句格式可以如下例: sql="select * from 表名 where 字段名 like ’%" & request.form(&quo ...
实现多条件模糊查询SQL语句
很多网友问到如何写模糊查询语句和多条件查询,这里我整理了一下,假设以姓名.性别.电话号...作为数据库中的字段名. 通常写一个简单的模糊查询的SQL语句格式可以如下例: sql="selec ...
JSP+Servlet+javabean+oracle实现页面多条件模糊查询
之前写过一篇JSP+Servlet+javabean+mysql实现页面多条件模糊查询使用的是mysql进行的分页查询,mysql用limit控制,而oracle则是用rownum,今天第一次写or ...
mongoose多条件模糊查询实例
mongoose多条件模糊查询这是今天手头项目中遇到的一个问题,关于mongoose如何实现类似于SQL中 nick LIKE '%keyword%' or email LIKE '%keyword ...
避免SQL全表模糊查询查询下载文件时-修改文件名字
避免SQL全表模糊查询查询 1.模糊查询效率很低: 原因:like本身效率就比较低,应该尽量避免查询条件使用like:对于like %...%(全模糊)这样的条件,是无法使用索引的,全表扫描自然效 ...
ASP.NET MVC+EF框架+EasyUI实现权限管理系列(20)-多条件模糊查询和回收站还原的实现
原文:ASP.NET MVC+EF框架+EasyUI实现权限管理系列(20)-多条件模糊查询和回收站还原的实现 ASP.NET MVC+EF框架+EasyUI实现权限管系列 (开篇) (1):框架 ...
在JDBC中实现SQL语句的模糊查询
在JDBC中实现SQL语句的模糊查询在大多数情况下我们可以在JDBC中写入sql语句通过占位符的方式来直接查询,但是如果要进行模糊查询,需要转义字符才能够正常查询. sql语句: select * ...
thinkphp5.0多条件模糊查询以及多条件查询带分页如何保留参数
1,多条件模糊查询等于:map[‘id′]=array(‘eq′,100);不等于:map[‘id′]=array(‘eq′,100);不等于:map[‘id’] = array(‘neq’,100 ...
laravel多条件模糊查询
1.运用cmd在项目根目录下创建路由组 php artisan make:controller queryController --resource 1.1数据库信息(student) CREATE ...

随机推荐

OpenCV探索之路（十）：图像修复技术
在实际应用中,我们的图像常常会被噪声腐蚀,这些噪声或是镜头上的灰尘或水滴,或是旧照片的划痕,或者是图像遭到人为的涂画(比如马赛克)或者图像的部分本身已经损坏.如果我们想让这些受到破坏的额图片尽可能恢复 ...
android 本地数据库sqlite的封装
单机android sqlite数据库的实现,这个数据库可与程序一起生成在安装包中一.下载sqlite3.exe文件二.运行 cmd 转到sqlite3.exe 所在目录运行 sqlite ...
React源码学习——ReactClass
前言之前一直在使用react做开发,但是对其内部的工作机制却一点儿都不了解,说白了就是一直在套api,毫无成就感.趁最近比较闲,对源码做了一番研究,并通过博客的方式做一些记录. 进入正题通过编写自 ...
使用ThreadLocal实现的读写分离在迁移后的偶发错误
最近莫名的会有错误日志,说有写操作因为走了读库而报了read only的异常,由于并没有造成应用使用的问题,开始我以为哪的配置错误就没当回事让程序员自己去查了,然而... 背景:之前的博客里提到过,读 ...
SpringMVC实现账号只能在一处登陆
一.问题引导在Web开发中,实现一个账号只能在一处登陆有两种形式:1.当某个账号在某处登陆后,如果再在其他处登陆,将前一个账号挤掉:2.当某个账号登陆后,此账号在其他设备登陆提示已经登陆,无法登陆. ...
Customer segmentation – LifeCycle Grids, CLV and CAC with R（转）
We studied a very powerful approach for customer segmentation in the previous post, which is based o ...
Lock（二）解决Lock问题
本文介绍通过Toad.EM及SQL语句来处理数据库产生的锁.在这之前需要对v$lock和v$session这两个数据字典有一定的了解. (一)使用Toad处理锁 (1)使用Toad的session b ...
sql备份(.mdf文件备份)
第一步: 右键需要备份的数据库(这里以MyDB为例),选择“属性”. 第二步: 选择“文件”,复制路径第三步: 打开文件所在目录,复制MyDB.mdf和MyDB_log.ldf 第四步: 把数据库停 ...
Tips_of_JS 之利用JS实现水仙花数的寻找与实现斐波那契数列
一.水仙花数 1.啥是水仙花数? 水仙花数是指一个 n 位正整数 ( n≥3 ),它的每个位上的数字的 n 次幂之和等于它本身.(例如:1^3 + 5^3+ 3^3 = 153) 2.利用JS实现对水 ...
06.04 html
域名跟ip地址是绑定的看某个网站的ip地址可以ping网址知道ip地址最终访问的都是ip地址每个ip地址都对应了一个空间(一块区域要用来存储内容)网页访问的原理: 客户端电脑发动请求到服 ...

【转】SQL多条件模糊查询解决方案-存储过程

【转】SQL多条件模糊查询解决方案-存储过程的更多相关文章

随机推荐

热门专题