php中文正则匹配

今天接到一个需求,用户昵称系统需要将昵称输入的字符类型限定为中文,英文,数字, -,_ 显然这个应该用正则来实现,那么最终的规则是怎么样的呢?示例代码如下: <?php $str = '我爱北京天安门-1234567_abacABCDDD'; if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_-]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 { echo "输入非法"; }else{ echo…

Python中使用中文正则表达式匹配指定的中文字符串

业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别. 示例一: 从QQ纯真数据库中解析出省市县等特定词语,这里的正则表达式基本能够满足业务场景,懒惰匹配?非…

php 正则匹配中文(转)

我使用正则表达式来匹配中问的时候,出现了无法匹配的问题,问题如下 PCRE does not support \L, \l, \N{name}, \U, or \u at offset 2 我原来的匹配公式是: /[\u4e00-\x9fa5]/ 然后我在网上找的,下面的解决方案解决后的匹配方案是: /^[\x{4e00}-\x{9fa5}]+$/u 下面是具体文章在做表单验证时对用户姓名的验证规则有以下要求要求:输入的内容需要满足的条件是: 1.允许输入字符:数字(0-9).字母(a…

Python2.7 转义和正则匹配中文

今天爬虫(新浪微博个人信息页面)的时候遇到了转义和正则匹配中文出乱码的问题. 先给出要匹配的部分网页源代码如下: <span class=\"pt_title S_txt2\">昵称:<\/span><span class=\"pt_detail\">他们叫我远凸哥哥<\/span><\/li>\r\n\t\t 想要匹配得到的结果是这个人的昵称,即“他们叫我远凸哥哥” 1.转义比较简单,需要转义的是反斜…

【php正则】php正则匹配UTF-8格式的中文汉字和【,】【，】【。】等符号

1.php正则匹配UTF-8格式的中文汉字和 [,][,][.]等符号 if (preg_match_all("/([\x{4e00}-\x{9fa5}]+((,)?)+((,)?)+((.)?))/u", (string)$jingdian_arr['view_desc'], $match)) { //var_dump($match[0]); $count = count($match[0]); unset($jingdian_arr['view_desc']); for($i=1…

python 正则匹配中文(unicode)(转)

由于需求原因,需要匹配提取中文,大量google下,并没有我需要的.花了一个小时大概测试,此utf8中文通过,特留文. 参考: http://hi.baidu.com/nivrrex/blog/item/e6ccaf511d0926888d543071.html http://topic.csdn.net/u/20070404/15/b011aa83-f9b7-43b3-bbff-bfe4f653df03.html 首先,确保所有编码都为 unicode …

python正则匹配——中文字符的匹配

# -*- coding:utf-8 -*- import re '''python 3.5版本正则匹配中文,固定形式:\u4E00-\u9FA5 ''' words = 'study in 山海大学' regex_str = ".*?([\u4E00-\u9FA5]+大学)" match_obj = re.match(regex_str, words) if match_obj: print(match_obj.group(1)) 结果:山海大学…

php 使用正则匹配中文返回结果

$str = 'eg5455正则匹配中文123三国杀'; $patten='/[\x{4e00}-\x{9fa5}]+/u'; $a = preg_match($patten, $str, $mn); var_dump($mn[0]);// 打印 '正则匹配中文' ps: utf8编码,正则写在变量里面,否则要转义…

VIM 用正则表达式,非贪婪匹配,匹配竖杠,竖线, 匹配中文,中文正则,倒数第二列, 匹配任意一个字符 :

VIM 用正则表达式批量替换文本,多行删除,复制,移动在VIM中用正则表达式批量替换文本,多行删除,复制,移动 :n1,n2 m n3 移动n1-n2行(包括n1,n2)到n3行之下: :n1,n2 co n3 复制n1-n2行(包括n1,n2)到n3行之下: :n1,n2 d 删除n1-n2行(包括n1,n2)行: vi替换使用规则: :g/s1/s/s2/s3/g 第一个g表示对每一个包括s1的行都进行替换,第二个g表示对每一行包括s1的行所有的s2都用s…

mysql正则匹配中文时存在的问题

可以看到,目前正则匹配字母没问题,c出现1次,2次,3次匹配的结果都是正常的接下来我们看看匹配中文的效果可以看到,当匹配连续出现歪时,结果就开始不正常了然后我去看了下mysql的中文文档中关于正则表达式的部分(https://www.mysqlzh.com/doc/233.html) 上面是文档中的一部分,看着跟我之前的写法有点不一样,它在花括号里写了逗号,我在思考难道我的语法写错了?必须这样写才行吗?然后我按上面的语法又去试了试可以看到,即使我按文档上的写法,依然存在问题正确的做法,…

JavaScript 正则匹配中文，中文符号，空格，全数字，以https:// 开头的url，用于各种场景的输入校验

业务场景1: 密码输入框需要验证输入中文,中文符号,空格等情况,以便于给出错误提示业务场景2: 输入框只允许输入数字的情况业务场景3: 输入框允许输入均为数字或以https:// 开头的url的情况备注: 网上查阅的大部分JavaScript中文/中文符号/空格等正则匹配,在中文加一个英文或者数字都能校验通过,无法满足实际的校验需求,使用下面的字符串替换方法,并比对str替换前后的length,即可完成准确的实际校验需求 var length = str.length // str为想要验…

正则匹配闭合HTML标签（支持嵌套）

任何复杂的正则表达式都是由简单的子表达式组成的,要想写出复杂的正则来,一方面需要有化繁为简的功底,另外一方面,我们需要从正则引擎的角度去思考问题.关于正则引擎的原理,推荐<Mastering Regular Expression>中文名叫<精通正则表达式>.挺不错的一本书. OK,先确定我们要解决的问题--从一段Html文本中找出特定id的标签的innerHTML. 这里面最大的难点就是,Html标签是支持嵌套的,怎么能够找到指定标签相对应的闭合标签呢? 我们可以这样想,先匹配最前…

Hive 正则匹配函数 regexp_extract

regexp_extract 语法: regexp_extract(string subject, string pattern, int index) 返回值: string 说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符. 第一参数: 要处理的字段第二参数: 需要匹配的正则表达式第三个参数: 0是显示与之匹配的整个字符串 1 是显示第一个括号里面的 2 是显示第二个括号里面的字段... 注意,在有些情况下要使用转义字符…

jQuery中的一些正则匹配表达式

jQuery常用正则匹配表达式落雨 //整数 "^-?[1-9]\\d*$", //正整数 "^[1-9]\\d*$", //负整数 intege2: "^-[1-9]\\d*$", //数字 num: "^([+-]?)\\d*\\.?\\d+$", //正数(正整数 + 0) num1: "^[1-9]\\d*|0$", //负数(负整数 + 0) num2: "^-[1-9]\\d*|0$…

常用的JavaScript正则匹配规则代码收藏，很实用

收集一些常用的JavaScript正则表达式匹配规则,比如匹配电话号码.Email.中文字符.身份证号.邮编.QQ号.过滤空白行.匹配特定数字等.觉得这玩意是很有用的,只不过自己水平菜,老是自己写不出,看了这个文档,觉得心里踏实很多,用到正则匹配的时候,看下这个,相信为让你省不少时间.注:本正则不仅限于在JS中使用,其它语言也可以借鉴. 匹配特定数字: ^[1-9]\d*$ //匹配正整数 ^-[1-9]\d*$ //匹配负整数 ^-?[1-9]\d*$ //匹配整数 ^[1-9]\d*|0$…

正则匹配<img src="xxxxxx" alt="" />标签的相关写法

1.(<img\ssrc[^>]*>) 2.content.replace(/<img [^>]*src=['"]([^'"]+)[^>]*>/gi, function (match) { console.log(match);}); 结果是:<img src="http://www.jb51.net/images/logo.gif" alt="" width="142"…

iOS 中的正则匹配(工具类方法)

正则表达式正则表达式是对字符串操作的一种逻辑公式, 用事先定义好的一些特定字符.及这些特定字符的组合, 组成一个"规则字符串", 这个"规则字符串"用来表达对字符串的一种过滤逻辑, 正则表达式就是用于描述这些规则的工具, 或者说, 正则表达式就是记录文本规则的代码. 在开发中, 我们经常会有查找符合某些复杂规则的字符串的需要, 比如数据校验: 判断用户的输入是否合法(如:用户注册的时候,QQ号码,电话号码,邮箱是否符合要求) 下面让我们先来看看正则匹配常用的一些字…

关于JAVA正则匹配空白字符的问题

今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件显示“\u3000” ,这是什么? 这是全角空格!!! 查了一下 \s 不支持全角 1."\s"匹配的是哪一种空格? \s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格正则表达式中\s匹配任何空白字符,包括空格.制表符.换页符等等: \s 并不能匹配中文全角空格. \s 只能匹配下面六种字符(详见 java.util.regex.Pattern 的 API…

(转载)常用正则表达式大全！（例如：匹配中文、匹配html）

正则匹配java注意点: 如果加 ^[\n]* 表示替换遇到 \n 的前后内容,如果加[\n]表示替换\n本处内容原文地址:http://blog.csdn.net/dl020840504/article/details/8880603 新加:匹配日期和时间 '2017-3-24 14:53:59 String regex = "^\\d{4,}\\-(?:0?\\d|1[12])\\-(?:[012]?\\d|3[01]) (?:[01]?\\d|2[0-4]):(?:[0-5]?\\d|…

通用且常用的Java正则匹配工具，用以检查邮箱名、电话号码、用户密码、邮政编码等合法性

一个通用且常用的Java正则匹配工具,用以检查邮箱名.电话号码.用户密码.邮政编码等合法性. import java.util.regex.Matcher; import java.util.regex.Pattern; public class RegexUtils { /** * 验证Email * @param email email地址,格式:zhang@gmail.com,zhang@xxx.com.cn,xxx代表邮件服务商 * @return 验证成功返回true,验证失败返回fa…

关于JAVA正则匹配空白字符的问题(全角空格与半角空格)

今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件显示“\u3000” ,这是什么? 这是全角空格!!! 查了一下 \s 不支持全角 1."\s"匹配的是哪一种空格? 正则表达式中\s匹配任何空白字符,包括空格.制表符.换页符等等:中文全角空格 \s 并不能匹配中文全角空格. \s 只能匹配下面六种字符(详见 java.util.regex.Pattern 的 API DOC): 半角空格( ) 水平制表符(\t) 竖直制表符…

用python处理时间、utf8文本、正则匹配、序列化、目录路径搜索、xml解析

python 处理时间 import time import re now = time.strftime("%Y-%m-%d %H:%M:%S", time.gmtime()) timeobj = re.match(r'(.*)-(.*)-(.*) (.*):(.*):(.*)', now) if timeobj is not None: timestamp = time.mktime(time.strptime(now, "%Y-%m-%d %H:%M:%S")…

shell grep正则匹配汉字

Shell grep正则匹配中文测试文本 demo_exe.c,内容如下,需要注意保存的编码格式,对输出到终端有影响: 我们中文操作系统ASNI默认是GBK的. #include<stdio.h> #include<stdlib.h> #include <string.h> #include <errno.h> #include <locale.h> #include <dlfcn.h> /* * export LD_LIBRARY…

常用的re模块的正则匹配的表达式

07.01自我总结常用的re模块的正则匹配的表达式一.校验数字的表达式 1.数字 ^[0-9]\*$ 2.n位的数字 ^\d{n}$ 3.至少n位的数字 ^\d{n,}$ 4.m-n位的数字 ^\d{m,n}$ 5.零和非零开头的数字 ^(0|[1-9][0-9]\*)$ 6.非零开头的最多带两位小数的数字 ^([1-9][0-9]\*)+(\.[0-9]{1,2})?$ 7.带1-2位小数的正数或负数 ^(\-)?\d+(\.\d{1,2})$ 8.正数.负数.和小数 ^(\-|\+)?\…

js正则表达式验证、匹配数字、匹配字符串、匹配中文、匹配任意字符备忘录

本文转自:91博客 :原文地址:http://www.9191boke.com/235792704.html 正则表达式或“regex”用于匹配字符串的各个部分,下面是我创建正则表达式的备忘录.包括一些常用的验证.匹配数字.匹配字符串.匹配中文.匹配任意字符串. 匹配正则使用 .test() 方法 let testString = "My test string"; let testRegex = /string/; testRegex.test(testString); 匹配多个模…

python中正则匹配之re模块

Python中正则表达式 re:re是提供正则表达式匹配操作的模块一.什么是正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某个模式匹配,Python 自1.5版本起增加了re模块,它提供Perl风格的正则表达式. 二.正则表达式的基本使用 1.re.match()介绍 match() 试图从字符串的起始位置对模式进行匹配,如果匹配成功,就返回一个匹配对象,如果匹配失败,就返回None,匹配对象的group()方法能显示成功匹配的对象. 使用语法: re.mat…

开发小技巧之:unicode的排序和正则匹配

目录简介 ASCII字符的排序本地字符的排序为什么不使用unicode进行排序 emoji的正则匹配总结简介我们知道计算机最先兴起是在国外,出于当时计算机性能的考虑和外国常用字符的考虑,最开始计算机使用的是ASCII,ASCII编码能够表示的字符毕竟是有限的,随着计算机的发展和全世界范围的流行,需要更多的能够表示世界各地字符的编码方式,这种编码方式就是unicode. 当然在unicode出现之前,各个国家或者地区根据本国的字符需求都制定过本国的编码标准,当然这些编码标准都是本地化的…

正则匹配抓取input 隐藏输入项和 <td>标签内的内容

这里不多作解释了,只要提供方法,如果想了解正则匹配,就去百度. 第一条是,匹配出所有的隐藏输入域 $patern = "/<input(.*?)type=\"hidden\"(.*?)name=\"(.*?)\"(.*?)value=\"(.*?)\"(.*?)>/im"; if(preg_match_all($patern,$content,$hidden_match)){ for($i=0;$i<coun…

js正则匹配的一个日常应用

应用实例 1 /** 将段落中的 \n 转换为 <p></p>, 规范存储 */ 2 function formatParagraphForStore(val) { 3 var formatText = ""; 4 var list = val.split('\n'); 5 if (list.length == 0) { 6 return val; 7 } 8 for (var i = 0; i < list.length; i++) { 9 format…

详解一个自己原创的正则匹配IP的表达式

这里给大家详细讲解一下一个匹配IP地址的正则表达式, 有关正则方面的知识,会在详细的讲解中提到. 在讲解之前,我先给大家介绍一下,ip地址的生成规则. IP地址,是由32位数字二进制转为四个十进制的字符串组成. 怎么转化?下面讲解: 二进制:11111111111111111111111111111111 分为四部分:11111111.11111111.11111111.11111111 转化:2^7+2^6+2^5+2^4+2^3+2^2+2^1+2^0=255 转为十进制范围:0~255.0…

【php中文正则匹配】的更多相关文章