Mysql中文检索匹配与正则

今天在用sql模糊查询包含字母d的时候，发现一些不包含此字母的也被查询出来了：

SELECT *

FROM custom

WHERE  custom_realname LIKE '%d%'

查询了一下，发现以下说明：

（最后修改为：

SELECT *

FROM custom

WHERE  custom_realname LIKE BINARY '%d%'

）

今天在做mysql的一个搜索的时候发现我用 select name from contact where name like '%a%'的时候出来的结果除了包含a的名字外连包含中文“新”的名字也出现在搜索结果里面，这令我想弄清楚mysql的匹配模式和规则到底是怎么样的,所以决定查查资料了解了解，另外在匹配的时候正则表达式也很常用！所以准备在这里记录我学习这两个玩意的收获！
出现这个问题的原因是：MySQL在查询字符串时是大小写不敏感的，在编绎MySQL时一般以ISO-8859字符集作为默认的字符集，因此在比较过程中中文编码字符大小写转换造成了这种现象。

解决办法：
1.在建表的时候对于包含中文的字段加上“BINARY”属性，使之进行二进制比较，例如讲"name char(10)"改成"name char(10) BINARY"。但是这样你对该表的该字段进行匹配的时候是区分大小写的。

2.如果使用源码编译MySQL，可以在编译的时候使用--with--charset=gbk参数，这样mysql就直接支持中文查找和排序。

3.使用mysql的locate函数来判断。如：
SELECT * FROM table WHERE locate(substr,str)>0 ;
locate()有两个形式：LOCATE(substr,str), LOCATE(substr,str,pos)。返回substr在str中的位置，如果str不包含substr返回0。这个函数也是不区分大小写的。

4.这样使用sql语句：SELECT * FROM TABLE WHERE FIELDS LIKE BINARY '%FIND%'，但是这和1一样是区分大小写的如果你想进行不区分大小写的查询的时候就要使用upper或者lower进行转换。

5.使用binary和ucase函数及concat函数。ucase是讲英文全部转换大写，concat对字符串进行连接。新的sql语句如下： select id,title,name from achech_com.news where binary ucase(title) like concat('%',ucase('a'),'%') 也可以写为select id,title,name from achech_com.news where binary ucase(title) like ucase('%a%') 检索的结果还算满意吧，不过速度可能会因此而慢N毫秒喔。因为使用like和%进行匹配的话对效率会有一定的影响。

正则表达式：正则表达式是为复杂搜索指定模式的强大方式。
^
所匹配的字符串以后面的字符串开头
mysql> select "fonfo" REGEXP "^fo$"; -> 0（表示不匹配）
mysql> select "fofo" REGEXP "^fo"; -> 1（表示匹配）
$
所匹配的字符串以前面的字符串结尾
mysql> select "fono" REGEXP "^fono$"; -> 1（表示匹配）
mysql> select "fono" REGEXP "^fo$"; -> 0（表示不匹配）
.
匹配任何字符（包括新行）
mysql> select "fofo" REGEXP "^f.*"; -> 1（表示匹配）
mysql> select "fonfo" REGEXP "^f.*"; -> 1（表示匹配）
a*
匹配任意多个a（包括空串)
mysql> select "Ban" REGEXP "^Ba*n"; -> 1（表示匹配）
mysql> select "Baaan" REGEXP "^Ba*n"; -> 1（表示匹配）
mysql> select "Bn" REGEXP "^Ba*n"; -> 1（表示匹配）

a+
匹配1个或多个a字符的任何序列。

mysql> select "Ban" REGEXP "^Ba+n"; -> 1（表示匹配）
mysql> select "Bn" REGEXP "^Ba+n"; -> 0（表示不匹配）

a?
匹配一个或零个a
mysql> select "Bn" REGEXP "^Ba?n"; -> 1（表示匹配）
mysql> select "Ban" REGEXP "^Ba?n"; -> 1（表示匹配）
mysql> select "Baan" REGEXP "^Ba?n"; -> 0（表示不匹配）

(abc)*
匹配任意多个abc（包括空串)
mysql> select "pi" REGEXP "^(pi)*$"; -> 1（表示匹配）
mysql> select "pip" REGEXP "^(pi)*$"; -> 0（表示不匹配）
mysql> select "pipi" REGEXP "^(pi)*$"; -> 1（表示匹配）

{1} {2,3}
这是一个更全面的方法，它可以实现前面好几种保留字的功能
a*
可以写成a{0,}
a
可以写成a{1,}
a?
可以写成a{0,1}
在{}内只有一个整型参数i，表示字符只能出现i次；在{}内有一个整型参数i，
后面跟一个“，”，表示字符可以出现i次或i次以上；在{}内只有一个整型参数i，
后面跟一个“，”，再跟一个整型参数j,表示字符只能出现i次以上，j次以下
（包括i次和j次）。其中的整型参数必须大于等于0，小于等于 RE_DUP_MAX（默认是25
5）。如果同时给定了m和n，m必须小于或等于n.

[a-dX], [^a-dX]

匹配任何是（或不是，如果使用^的话）a、b、c、d或X的字符。两个其他字符之间的“-”字符构成一个范围，与从第1个字符开始到第2个字符之间的所有字符匹配。例如，[0-9]匹配任何十进制数字。要想包含文字字符“]”，它必须紧跟在开括号“[”之后。要想包含文字字符“-”，它必须首先或最后写入。对于[]对内未定义任何特殊含义的任何字符，仅与其本身匹配。

mysql> select "aXbc" REGEXP "[a-dXYZ]"; -> 1（表示匹配）
mysql> select "aXbc" REGEXP "^[a-dXYZ]$"; -> 0（表示不匹配）
mysql> select "aXbc" REGEXP "^[a-dXYZ] $"; -> 1（表示匹配）
mysql> select "aXbc" REGEXP "^[^a-dXYZ] $"; -> 0（表示不匹配）
mysql> select "gheis" REGEXP "^[^a-dXYZ] $"; -> 1（表示匹配）
mysql> select "gheisa" REGEXP "^[^a-dXYZ] $"; -> 0（表示不匹配）

[[.characters.]]
表示比较元素的顺序。在括号内的字符顺序是唯一的。但是括号中可以包含通配符,
所以他能匹配更多的字符。举例来说：正则表达式[[.ch.]]*c匹配chchcc的前五个字符
。

[=character_class=]
表示相等的类，可以代替类中其他相等的元素，包括它自己。例如，如果o和( )是
一个相等的类的成员，那么[[=o=]]、[[=( )=]]和[o( )]是完全等价的。

[:character_class:]
在括号里面，在[:和:]中间是字符类的名字，可以代表属于这个类的所有字符。
字符类的名字有: alnum、digit、punct、alpha、graph、space、blank、lower、uppe
r、cntrl、print和xdigit
mysql> select "justalnums" REGEXP "[[:alnum:]] "; -> 1（表示匹配）
mysql> select "!!" REGEXP "[[:alnum:]] "; -> 0（表示不匹配）

alnum	文字数字字符
alpha	文字字符
blank	空白字符
cntrl	控制字符
digit	数字字符
graph	图形字符
lower	小写文字字符
print	图形或空格字符
punct	标点字符
space	空格、制表符、新行、和回车
upper	大写文字字符
xdigit	十六进制数字字符

[[:<:]]
[[:>:]]
分别匹配一个单词开头和结尾的空的字符串，这个单词开头和结尾都不是包含在alnum中
的字符也不能是下划线。
mysql> select "a word a" REGEXP "[[:<:]]word[[:>:]]"; -> 1（表示匹配）
mysql> select "a xword a" REGEXP "[[:<:]]word[[:>:]]"; -> 0（表示不匹配）
mysql> select "weeknights" REGEXP "^(wee|week)(knights|nights)$"; -> 1（表示
匹配）

要想在正则表达式中使用特殊字符的文字实例，应在其前面加上2个反斜杠“/”字符。MySQL解析程序负责解释其中一个，正则表达式库负责解释另一个。例如，要想与包含特殊字符“+”的字符串“1+2”匹配，在下面的正则表达式中，只有最后一个是正确的：

mysql> SELECT '1+2' REGEXP '1+2';                       -> 0

mysql> SELECT '1+2' REGEXP '1/+2';                      -> 0

mysql> SELECT '1+2' REGEXP '1//+2';                     -> 1

Mysql中文检索匹配与正则的更多相关文章

Web开发相关笔记 #05# MySQL中文无法匹配
2018-06-02 在 Class.forName 的时候记得先尝试 import 一下. 2018-06-04 1.JDBC SELECT 查询,中文条件查不出东西,可能是字符编码问题: Stri ...
Linux下PHP+MySQL+CoreSeek中文检索引擎配置
说明: 操作系统:CentOS 5.X 服务器IP地址:192.168.21.127 Web环境:Nginx+PHP+MySQL 站点根目录:/usr/local/nginx/html 目的:安装co ...
Mybatis使用MySQL进行模糊查询时输入中文检索不到结果
Mybatis使用MySQL进行模糊查询时输入中文检索时,需要在jdbcURL后增加参数 ?useUnicode=true&characterEncoding=UTF-8
Mybatis使用MySQL模糊查询时输入中文检索不到结果怎么办--转自http://www.jb51.net/article/88236.htm
这篇文章主要介绍了Mybatis使用MySQL模糊查询时输入中文检索不到结果的解决办法的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下项目开发中,在做Mybatis动态查询时,遇到了 ...
CoreSeek中文检索引擎
目的:安装coreseek中文检索引擎,配置MySQL数据库访问接口,使用PHP程序实现中文检索. CoreSeek官方网站: http://www.coreseek.cn/ http://www.c ...
(转载)常用正则表达式大全！（例如：匹配中文、匹配html）
正则匹配java注意点: 如果加 ^[\n]* 表示替换遇到 \n 的前后内容,如果加[\n]表示替换\n本处内容原文地址:http://blog.csdn.net/dl020840504/arti ...
Python中正则表达式对中文的匹配问题
python匹配中文的时候特别要注意的是匹配的正则字符串是否是Unicode格式的: import re source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序 ...
sphinx中文版Coreseek中文检索引擎安装和使用方法(Linux)
sphinx中文版Coreseek中文检索引擎安装和使用方法(Linux) 众所周知,在MYSQL数据库中,如果你在百万级别数据库中使用 like 的话那你一定在那骂娘,coreseek是一个 ...
js正则表达式验证、匹配数字、匹配字符串、匹配中文、匹配任意字符备忘录
本文转自:91博客 :原文地址:http://www.9191boke.com/235792704.html 正则表达式或“regex”用于匹配字符串的各个部分,下面是我创建正则表达式的备忘录.包括一 ...

随机推荐

雕刻效果的实现【OpenCV+QT】
雕刻能够区分为凸雕和凹雕. 凸雕基右下角的点减去左上角的点. 凹雕是左上角的点减去右下角的点. [效果图] 由于进行了缩放.效果看起来差一些.
1.1　合用weightSum属性和layout_weight属性
<打造高质量Android应用:Android开发必知的50个诀窍>第1章活用布局,本章将介绍Android布局相关的一些窍门和建议.通过本章,读者不仅可以学习如何从零开始创建特定类型的布 ...
38: 立方根getCubeRoot
题目描述:计算一个数字的立方根,不使用库函数 •接口说明原型:public static double getCubeRoot(double input) 输入:double 待求解参数返回值:d ...
关于海康视频采集卡的简介---基于pci的插潮采集卡
vga 640x480 qvga vga的1/4,宽高分别是vga的一半 (1)采集类型海康威视 DS-2CE16A2P-IT3P 700TVL 1/3" DIS ICR 红外防水筒型摄像 ...
LeetCode222——Count Complete Tree Nodes
Given a complete binary tree, count the number of nodes. Definition of a complete binary tree from W ...
Can a GridView have a footer and header just like ListView?
Aquick question: In ListView I use this code: list.addHeaderView(headerView); How to deal with it wh ...
npm 全局配置放在c盘/用户/当前用户/目录下
prefix=D:\Users\Ed\AppData\Roaming\nodejs\npm-globalcache=D:\Users\Ed\AppData\Roaming\npm-cacheregis ...
EasyPlayer播放海康大华RTSP流时RTSPClient客户端连接兼容问题的解决
在之前的博客<EasyPlayer RTSP播放器对RTSP播放地址url的通用兼容修改意见>中,我描述了遇到的一个客户在播放大华某款摄像机时地址不兼容的问题,这不,团队刚刚参考我的这个意 ...
EasyDSS流媒体解决方案之多方式虚拟直播方法
EasyDSS_Solution虚拟直播 EasyDSS_Solution虚拟直播,是EasyDSS流媒体解决方案提供的虚拟直播方案.可以通过三种方式创建虚拟直播. (1)点播的视频文件: (2)本地 ...
在调用Response.End()时，会执行Thread.CurrentThread.Abort()操作
在调用Response.End()时,会执行Thread.CurrentThread.Abort()操作. 如果将Response.End()放在try...catch中,catch会捕捉Thread ...

Mysql中文检索匹配与正则

Mysql中文检索匹配与正则的更多相关文章

随机推荐

热门专题