JavaScript 中的正则表达式
1、正则表达式概述
ECMAScript 3 开始支持正则表达式,其语法和 Perl 语法很类似,一个完整的正则表达式结构如下:
1
|
var expression = / pattern / flags ; |
其中,模式(pattern)部分可以是任何简单或复杂的正则表达式,可以包含字符类、限定符、分组、向前查找以及反向引用。
每个正则表达式都可带有一或多个标志(flags),用以标明正则表达式的行为,正则表达式支持下列 3 个标志:
- g: 表示全局(global)模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止;
- i : 表示不区分大小写(case-insensitive)模式,即在确定匹配项时忽略模式与字符串的大小写;
- m:表示多行(multiline)模式,即在到达一行文本末尾时还会继续查找下一行中是否存在与模式匹配的项。
如果多个标志同时使用时,则写成:gmi 。
正则表达式的创建有两种方式: new RegExp(expression) 和 直接字面量。
1
2
3
4
5
|
//使用直接字面量创建 var exp1 = /(^\s+)|(\s+$)/g; //使用RegExp对象创建 var exp2 = new RegExp( "(^\\s+)|(\\s+$)" , "g" ); |
exp1 和 exp2 是两个完全等价的正则表达式,需要注意的是,传递给 RegExp 构造函数的两个参数都是字符串,不能把正则表达式字面量传递给 RegExp 构造函数。
与其他语言中的正则表达式类似,模式中使用的所有元字符都必须转义。正则表达式中的元字符包括:
1
|
( [ { \ ^ $ | ) ? * + .] } |
这些元字符在正则表达式中都有一或多种特殊用途,因此如果想要匹配字符串中包含的这些字符,就必须对它们进行转义。
1
2
|
//匹配 .docx var exp = /\.docx/gi ; |
由于 RegExp 构造函数的模式参数是字符串,所以在某些情况下要对字符进行双重转义。所有元字符都必须双重转义,那些已经转义过的字符也是如此。
1
2
3
4
5
6
|
// 对 \. 再次转义 var exp = new RegExp( "\\.docx" , "gi" ); //匹配 \n var exp1 = /\\n/g; //对\n中的\转义 var exp2 = new RegExp( "\\\\n" , "g" ); // 对 \\n 再次转义 |
2、() [] {} 的区别
() 的作用是提取匹配的字符串。表达式中有几个()就会得到几个相应的匹配字符串。比如 (\s+) 表示连续空格的字符串。
[] 是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示字符文本要匹配英文字符和数字。
{} 一般用来表示匹配的长度,比如 \d{3} 表示匹配三个数字,\d{1,3} 表示匹配1~3个数字,\d{3,} 表示匹配3个以上数字。
3、^ 与 $
^ 匹配一个字符串的开头,比如 (^a) 就是匹配以字母a开头的字符串
$ 匹配一个字符串的结尾,比如 (b$) 就是匹配以字母b结尾的字符串
^ 还有另个一个作用就是取反,比如[^xyz] 表示匹配的字符串不包含xyz
注意问题:
- 如果 ^ 出现在[ ] 中一般表示取反,而出现在其他地方则是匹配字符串的开头。
- ^ 和 $ 配合可以有效匹配完整字符串: /d+/.test('4xpt') -> true,而 /^\d+$/.test('4xpt')->false
4、\d \s \w .
\d 匹配一个非负整数, 等价于 [0-9]
\s 匹配一个空白字符
\w 匹配一个英文字母或数字,等价于[0-9a-zA-Z]
. 匹配除换行符以外的任意字符,等价于[^\n]
5、* + ?
* 表示匹配前面元素0次或多次,比如 (\s*) 就是匹配0个或多个空格
+ 表示匹配前面元素1次或多次,比如 (\d+) 就是匹配由至少1个整数组成的字符串
? 表示匹配前面元素0次或1次,相当于{0,1} ,比如(\w?) 就是匹配最多由1个字母或数字组成的字符串
6、$1 与 \1
$1-$9 存放着正则表达式中最近的9个正则表达式的提取的结果,这些结果按照子匹配的出现顺序依次排列。基本语法是:RegExp.$n ,这些属性是静态的,除了replace中的第二个参数可以省略 RegExp 之外,其他地方使用都要加上 RegExp 。
1
2
3
4
5
6
7
8
9
10
|
//使用RegExp访问 /(\d+)-(\d+)-(\d+)/.test( "2016-03-26" ) RegExp.$1 // 2016 RegExp.$2 // 03 RegExp.$3 // 26 //在replace中使用 "2016-03-26" .replace(/(\d+)-(\d+)-(\d+)/, "$1年$2月$3日" ) // 2016年03月26日 |
\1 表示后向引用,是指在正则表达式中,从左往右数,第1个()中的内容,以此类推,\2表示第2个(),\0表示整个表达式。
1
2
3
4
5
6
|
//匹配日期格式,表达式中的\1代表重复(\-|\/|.) var rgx = /\d{4}(\-|\/|.)\d{1,2}\1\d{1,2}"/ rgx.test( "2016-03-26" ) //true rgx.test( "2016-03.26" ) //false |
两者的区别是:\n只能用在表达式中,而$n只能用在表达式之外的地方。
7、test 与 match
前面的大都是JS正则表达式的语法,而test则是用来检测字符串是否匹配某一个正则表达式,如果匹配就会返回true,反之则返回false
1
2
3
|
/\d+/.test( "123" ) ; //true /\d+/.test( "abc" ) ; //false |
match是获取正则匹配到的结果,以数组的形式返回
1
|
"186a619b28" .match(/\d+/g); // ["186","619","28"] |
8、replace
replace 本身是JavaScript字符串对象的一个方法,它允许接收两个参数:
1
|
replace([RegExp|String],[String|Function]) |
第1个参数可以是一个普通的字符串或是一个正则表达式
第2个参数可以是一个普通的字符串或是一个回调函数
如果第1个参数是 RegExp,JS会先提取RegExp匹配出的结果,然后用第2个参数逐一替换匹配出的结果
如果第2个参数是回调函数,每匹配到一个结果就回调一次,每次回调都会传递以下参数:
1
2
3
4
5
6
7
|
result: 本次匹配到的结果 $1,...$9: 正则表达式中有几个(),就会传递几个参数,$1~$9分别代表本次匹配中每个()提取的结果,最多9个 offset:记录本次匹配的开始位置 source:接受匹配的原始字符串 |
9、经典案例
【1】实现字符串的 trim 函数,去除字符串两边的空格。
1
2
3
4
5
6
7
8
9
10
|
String.prototype.trim = function(){ //方式一:将匹配到的每一个结果都用""替换 return this .replace(/(^\s+)|(\s+$)/g,function(){ return "" ; }); //方式二:和方式一的原理相同 return this .replace(/(^\s+)|(\s+$)/g, '' ); }; |
^\s+ 表示以空格开头的连续空白字符,\s+$ 表示以空格结尾的连续空白字符,加上() 就是将匹配到的结果提取出来,由于是 | 的关系,因此这个表达式最多会match到两个结果集,然后执行两次替换:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
String.prototype.trim = function(){ /** * @param rs:匹配结果 * @param $1:第1个()提取结果 * @param $2:第2个()提取结果 * @param offset:匹配开始位置 * @param source:原始字符串 */ this .replace(/(^\s+)|(\s+$)/g,function(rs,$1,$2,offset,source){ //arguments中的每个元素对应一个参数 console.log(arguments); }); }; " abcd " .trim(); 输出结果: [ " " , " " , undefined, 0, " abcd " ] //第1次匹配结果 [ " " , undefined, " " , 5, " abcd " ] //第2次匹配结果 |
【2】提取浏览器 url 中的参数名和参数值,生成一个key/value 的对象。
1
2
3
4
5
6
7
8
9
10
11
|
function getUrlParamObj(){ var obj = {}; //获取url的参数部分 var params = window.location.search.substr(1); //[^&=]+ 表示不含&或=的连续字符,加上()就是提取对应字符串 params .replace(/([^&=]+)=([^&=]*)/gi,function(rs,$1,$2){ obj[$1] = decodeURIComponent($2); }); return obj; } |
/([^&=]+)=([^&=]*)/gi 每次匹配到的都是一个完整key/value,形如 xxxx=xxx, 每当匹配到一个这样的结果时就执行回调,并传递匹配到的 key 和 value,对应到$1和$2 。
【3】扩展 typeof,包含引用类型的具体类型。
1
2
3
4
5
6
7
8
9
10
|
function getDataType(obj){ let rst = Object.prototype.toString.call(obj); rst = rst.replace(/\[ object \s(\w+)\]/, '$1' ); //[object Xxx] return rst.toLowerCase() } getDataType(1); //number getDataType( 'a' ); //string getDataType( null ); //null getDataType([]); //array |
$1 是正则表达式中第一个() 中匹配的内容。需要注意的是,replace的第二个参数只能是字符串或函数,因此,这里的 $1 需要放在引号中。
【4】在字符串指定位置插入新字符串。
1
2
3
4
5
6
7
8
9
10
11
|
String.prototype.insetAt = function(str,offset){ offset = offset + 1; //使用RegExp()构造函数创建正则表达式 var regx = new RegExp( "(^.{" +offset+ "})" ); return this .replace(regx, "$1" +str); }; "abcd" .insetAt( 'xyz' ,2); //在c字符后插入xyz >> "abcxyzd" |
当offset=2时,正则表达式为:(^.{3}) .表示除\n之外的任意字符,{3} 表示匹配前三个连续字符,加()就会将匹配到的结果提取出来,然后通过replace将匹配到的结果替换为新的字符串,形如:结果=结果+str
【5】将手机号12988886666转化成129****6666 。
1
2
3
4
5
6
7
8
9
10
11
12
|
function telFormat(tel){ tel = String(tel); //方式一 return tel.replace(/(\d{3})(\d{4})(\d{4})/,function (rs,$1,$2,$3){ return $1+ "****" +$3 }); //方式二 return tel.replace(/(\d{3})(\d{4})(\d{4})/, "$1****$3" ); } |
(\d{3}\d{4}\d{4}) 可以匹配完整的手机号,并分别提取前 3 位、4-7 位和 8-11位,"$1****$3" 是将第 2 个匹配结果用****代替并组成新的字符串,然后替换完整的手机号。
【6】实现HTML编码,将< / > " & ` 等字符进行转义,避免XSS攻击 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
function htmlEncode(str) { //匹配< / > " & ` return str.replace(/[<>"&\/`]/g, function(rs) { switch (rs) { case "<" : return "<" ; case ">" : return ">" ; case "&" : return "&" ; case "\"" : return "" "; case "/" : return "/" case "`" : return "'" } }); }
|
JavaScript 中的正则表达式的更多相关文章
- JavaScript中的正则表达式(终结篇)
JavaScript中的正则表达式(终结篇) 在之前的几篇文章中,我们了解了正则表达式的基本语法,但那些语法不是针对于某一个特定语言的.这篇博文我们将通过下面几个部分来了解正则表达式在JavaScri ...
- Javascript中的正则表达式
Javascript中的正则表达式 刚开始接触正则表达式的时候,觉得这是个很死板的东西(没办法,计算机不能像人眼一样能很快的辨认出我们需要的结果,它需要一定的规则来对它进行限制),了解的越多,发现这个 ...
- 浅谈JavaScript中的正则表达式
引言 对于正则表达式我想作为程序员肯定使用过它,那天书般的表达方式,我用一次就记住它了.这篇博客先介绍一些正则表达式的内容,然后介绍JavaScript中对正则表达式特有的改进.下面开始介绍正则表达式 ...
- 转载 javascript中的正则表达式总结 一
定义正则表达式的方法 定义正则表达式的方法有两种:构造函数定义和正则表达式直接量定义.例如: var reg1 = new RegExp('\d{5, 11}'); // 通过构造函数定义 var r ...
- C++、Java、JavaScript中的正则表达式
C++(VS2013编译器):http://msdn.microsoft.com/zh-cn/library/bb982727.aspx#grammarsummary Java: ...
- 浅谈JavaScript中的正则表达式(适用初学者观看)
浅谈JavaScript中的正则表达式 1.什么是正则表达式(RegExp)? 官方定义: 正则表达式是一种特殊的字符串模式,用于匹配一组字符串,就好比用模具做产品,而正则就是这个模具,定义一种规则去 ...
- 精通 JavaScript中的正则表达式
精通 JS正则表达式 (精通?标题党 ) 正则表达式可以: •测试字符串的某个模式.例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式.这称为数据有效性验证 ...
- JavaScript中的正则表达式详解
摘要:javascript中的正则表达式作为相当重要的知识,本文将介绍正则表达式的相关知识和用法. 正则表达式(Regular Expression)是一门简单语言的语法规范,是强大.便捷.高效的文本 ...
- javascript中的正则表达式学习
一.前言 关于正则表达式自身的语法这里不做过多介绍(详情可参见http://www.php100.com/manual/unze.html),这里仅仅解释javascript中和正则表达式相关的几个方 ...
随机推荐
- select2的设置选中
select2插件设置选中值并显示的问题 在select2中,要想设置指定值为选中状态并显示: $("#select2_Id").val("XXXXX").se ...
- 方位话机X2主、备用服务器问题
1.当主.备用服务器有关联时采用开启分组,SIP1.SIP2的方式 2.当主.备用服务器无关联时采用,SIP1主.备用服务器的方式
- Hillstone防火墙sslvpn配置与使用
1.山石的sslvpn称为Secure Connect VPN,即scvpn. 2.WEB界面登陆防火墙,“用户”,“AAA服务器”,新建用户: 3.定义源IP池 即用户通过sslvpn拨号成功后获取 ...
- LAB12 Transaction
思路:就是把aotocommit()里面的东西改改就行了. 查询要求可用房间>=所需要的房间. SQL里面查数字时,不要加单引号.字符串才要. 查询里的set ONHAND=要改成自己的变量名s ...
- Junit集成测试
Spring4.x高级话题(七):Spring的测试 一. 点睛 测试是开发工作中不可缺少的部分,单元测试只针对当前开发的类和方法进行测试,可以简单通过模拟依赖来实现,对运行环境没有依赖:但是仅仅单元 ...
- zabbix添加nginx监控
nginx内置了一个status状态的功能,通过配置可以看到nginx的运行情况,status显示的内容包括当前连接数,处于活动状态的连接数,已经处理的请求数等等,可以利用这个功能编写zabbix监控 ...
- linux一台服务器配置多个Tomcat
前提:linux服务器上已经运行多个Tomcat,再去搭建一个Tomcat服务 1.官网下载Tomcat 2.上传到服务器指定一个目录/usr/local/tomcat 3.然后解压tar包,tar ...
- Tomcat7 目录详解
1.bin:该目录下存放的是二进制可执行文件,如果是安装版,那么这个目录下会有两个exe文件:tomcat6.exe.tomcat6w.exe,前者是在控制台下启动Tomcat,后者是弹出UGI窗口启 ...
- FastDFS api介绍
1. 命令行api介绍 FastDFS提供了可用于运维测试的命令行api,下面进行介绍: 1.1 fastdfs服务管理 tracker进程服务管理脚本 /etc/init.d/fdfs_tracke ...
- UI行业发展预测 & 系列规划的调整
又双叒叕拖更了,上一篇还是1月22号更新的,这都3月9号了…… 前面几期把职业规划.能力分析.几个分析用的设计理论都写完了,当然实际工作中用到的方法论不止上面这些,后续会接着学习: 如果你的目标是一线 ...