本文地址:http://www.cnblogs.com/blackmanba/p/regular-expressions-introduce.html 或者 http://forkme.info/regular-expressions-introduce/, 转载请注明源地址。

基本字符

Javascript 正则表达式的基本字符如下:( [ ] { } \ ^ $ | ) . -,原则上来说,简单字符表示的是一个字符对应一个字符,当然,我们可以通过指定 [] 来使用多个字符对应一个字符。如下:

简单类

alert(/hehe/.test('hehe'));                   // true
alert(/[abc]/.test('a')); // true
alert(/[abc]/.test('b')); // true
alert(/[abc]/.test('c')); // true
alert('hello, world'.match(/[eo]/gi)); // ['e', 'o', 'o']

取反类

alert(/[^abc]/.test('a'));                    // false
alert(/[^abc]/.test('b')); // false
alert(/[^abc]/.test('c')); // false
alert(/[^abc].test('hehe')/); // true

范围类

范围类主要的操作符是 - (下划线),表示选择某一个范围的值 (ps: 一般被中括号 [] 包裹),例如:

alert(/[a-z]/.test('b'));                    // true
alert(/[a-z]/.test('c')); // true

组合

注意:以上类型可以任意组合 (ps: | 表示或者,放在 [] 里面,表示的就是普通的字符 | ),例如:

alert(/[^a-z]/.test('b'));                    // false
alert(/[^a-z]/.test(1)); // true
alert(/[^a-z0-9]/).test(1); // true
[0-9|a-z] // 表示 0-9 | a-z 任意选择一个

预定义字符

为了减少输入字符的长度,正则表达式规定了一些字符表示特殊的含义。如下:

字符 等同于 描述
. [^\n\r] 除了回车和换行符之外的所有字符
\d [0-9] 数字字符
\D [^0-9] 非数字字符
\s [ \t\n\x0B\f\r] 空白字符
\S [^ \t\n\x0B\f\r] 非空白字符
\w [a-zA-Z_0-9] 所有英文字符和数字字符
\W [^a-zA-Z_0-9] 所有非英文字符和数字字符
alert(/./.test('a'));                         // true
alert(/\d/.test(1)); // true
alert(/\D/.test(1)); // true
alert(/\s/.test(' ')); // true
alert(/\S/.test('s')); // true
alert(/\w/.test('1')); // true
alert(/\W/.test('1')); // true

量词

量词 基本字符都是和单词的组合 (中括号 []) 或者字符本身进行一对一的匹配。我们匹配类似 aaabbb.... 很长的字符串时,如果使用基本字符直接匹配,那每次都要输入很长的正则表达式 ( 估计没人能做到吧 )。量词的出现就是用来处理重复字符匹配的利器。

代码 类型 描述
? 软性量词 出现 0 次或者是 1 次
* 软性量词 出现 0 次或者是多次
+ 软性量词 至少出现一次 ( 可出现多次 )
{n} 硬性量词 对应 0 次或者是 n 次
{n,m} 软性量词 至少出现 n 次但是不能超过 m 次
{n,} 软性量词 至少出现 n 次
alert(/[a-z]?/.test(''));                       // true
alert(/[a-z]*/.test('aaaa')); // true
alert(/[a-z]+/.test('aaa')); // true
alert(/[a-z]{2}/.test('aa')); // true
alert(/[a-z]{2,3}/.test('aaaa')); // false
alert(/[a-z]{2,}/.test('aaa')); // true
ps: /[\u4e00-\u9fa5]/用于匹配单个汉字

贪婪量词和惰性量词

贪婪量词:上面提到的所有基本字符和除了 ? 外的量词,贪婪量词先是从字符串的末尾开始遍历,如果不能匹配,就去掉结尾的字符继续进行匹配。 ( 不断重复直到长度为0 )

惰性量词:在简单量词后面加上 ?,惰性量词采用顺序遍历的方式,也就是先获取第一个字符进行匹配,如果不饱和就继续获取下一个字符 ( 发现字符不匹配就舍弃读取下一个字符进行匹配...... )。工作方式与贪婪量词相反。

var reg1 = /.*bbb/,                             // 贪婪量词
reg2 = /.*?bbb/; // 惰性量词 alert(reg1.test('aaaaabbbbbbaabbbbaabbbwww')); // true
alert('aaaaabbbbbbaabbbbaabbbwww'.match(reg1)); // aaaaabbbbbbaabbbbaabbb alert('aaaaabbbbbbaabbbbaabbbwww'.match(reg2)); // aaaaabbb

分组

简单字符能够进行单词一对一的匹配,量词能够处理一排紧密相连的同类型字符,但这是不够的。中括号表示范围内选择,大括号表示重复次数,小括号允许我们重复多个字符。

alert(/(dog){2}/.test('dogdog'));                 // true
alert('baddad'.match(/([bd]ad?)*/)); // baddad, dad
alert('mon and dad'.match(/(mon ( and dad))/)); // mon and dad, mon and dad, and dad

反向引用

反向引用是由正则表达式匹配分组捕获的子字符串,每个反向引用都由一个数字编号来标识。如下:

var color = '#90000';
/(\d)+/.test('color');
alert(RegExp.$1); // 90000 alert(/(dog)\1.test('dogdog')/); // true
var num = '1234 5678';
var newNum = num.replace(/(\d){4} (\d){4}/, '$2 $1');

候选

在分组时使用,通过插入管道符 | ,划分为两个或多个候选项。

var reg = /(red|black|yellow)!!/;
alert(reg.test('red!!')); // true
alert(reg.test('black!!')); // black

非捕获性分组

并不是所有的分组都需要建立反向引用,非捕获性分组表示不会创建反向引用的分组。反之,普通的分组就是捕获性分组,如下:

var color = '#90000';
/#(?:\d)+/.test(color);
alert(RegExp.$1); // ''

example: 移除所有的标签,只剩下 innerHTML

var html = '<p><a href="http://www.baidu.com">www.baidu.com</p>';
var text = html.replace(/<(?:.|\s)*>/g, '');
alert(text);

边界

一个与字符串合用的东西。

正则 名称 描述
^ 开头 注意不能出现在左中括号的位置
$ 结尾
\b 单词边界 指 [a-zA-Z0-9] 之外的字符
\B 非单词边界
实例属性 描述
global 是当前表达式模式首次匹配内容的开始位置,从0开始计数。其初始值为-1,每次成功匹配时,index属性都会随之改变。
ignore case 返回创建RegExp对象实例时指定的ignoreCase标志(i)的状态。如果创建RegExp对象实例时设置了i标志,该属性返回True,否则返回False,默认值为False。
lastIndex 是当前表达式模式首次匹配内容中最后一个字符的下一个位置,从0开始计数,常被作为继续搜索时的起始位置,初始值为-1, 表示从起始位置开始搜索,每次成功匹配时,lastIndex属性值都会随之改变。(只有使用exec()或test()方法才会填入,否则为0)
multiLine 返回创建RegExp对象实例时指定的multiLine标志(m)的状态。如果创建RegExp对象实例时设置了m标志,该属性返回True,否则返回False,默认值为False。
source 返回创建RegExp对象实例时指定的表达式文本字符串。
var str = "JS's Louvre";
var reg = /\w/g;
alert(reg.exec(str));//J
alert(reg.lastIndex);//1
alert(reg.exec(str));//S
alert(reg.lastIndex);//2
alert(reg.exec(str));//s
alert(reg.lastIndex);//4
alert(reg.exec(str));//L
alert(reg.lastIndex);//6

总结

正则表达式 是每一个开发人员必学知识,本文基本是参考 司徒正美 大神的 这篇文章 而写,只是自己搬运过来做一个笔记,可以在开发的过程中随时查阅,感谢 司徒正美 的这篇文章,作为文档基本记录了正则表达式的所有用法!

Javascript 正则表达式简述的更多相关文章

  1. javascript正则表达式简述

    compile 编译或改变字符串,参数跟new RegExp相同 var patt = /man/g; var str = "man and woman"; str.replace ...

  2. JavaScript正则表达式,你真的知道?

    一.前言 粗浅的编写正则表达式,是造成性能瓶颈的主要原因.如下: var reg1 = /(A+A+)+B/; var reg2 = /AA+B/; 上述两个正则表达式,匹配效果是一样的,但是,效率就 ...

  3. 【JS】javascript 正则表达式 大全 总结

    javascript 正则表达式 大全 总结 参考整理了一些javascript正则表达式 目的一:自我复习归纳总结 目的二:共享方便大家搜索 微信:wixf150 验证数字:^[0-9]*$ 验证n ...

  4. 理清JavaScript正则表达式--上篇

    在JavaScript中,正则表达式由RegExp对象表示.RegExp对象呢,又可以通过直接量和构造函数RegExp两种方式创建,分别如下: //直接量 var re = /pattern/[g | ...

  5. 理清JavaScript正则表达式--下篇

    紧接:"理清JavaScript正则表达式--上篇". 正则在String类中的应用 类String支持四种利用正则表达式的方法.分别是search.replace.match和s ...

  6. JavaScript正则表达式详解(一)正则表达式入门

    JavaScript正则表达式是很多JavaScript开发人员比较头疼的事情,也很多人不愿意学习,只是必要的时候上网查一下就可以啦~本文中详细的把JavaScript正则表达式的用法进行了列表,希望 ...

  7. JavaScript正则表达式详解(二)JavaScript中正则表达式函数详解

    二.JavaScript中正则表达式函数详解(exec, test, match, replace, search, split) 1.使用正则表达式的方法去匹配查找字符串 1.1. exec方法详解 ...

  8. Python自动化 【第十八篇】:JavaScript 正则表达式及Django初识

    本节内容 JavaScript 正则表达式 Django初识 正则表达式 1.定义正则表达式 /.../  用于定义正则表达式 /.../g 表示全局匹配 /.../i 表示不区分大小写 /.../m ...

  9. JavaScript正则表达式下——相关方法

    上篇博客JavaScript 正则表达式上——基本语法介绍了JavaScript正则表达式的语法,有了这些基本知识,可以看看正则表达式在JavaScript的应用了,在一切开始之前,看看RegExp实 ...

随机推荐

  1. RAP开发入门-主题更换

    通过配置扩展点修改应用主题    ps:需要提前准备好主题(theme.css)文件   <!-- 注册主题扩展点 -->    <extension          point= ...

  2. CDR中是否有图层,如何调出图层面板?

    什么是图层?如果有点PS基础的同学,应该会非常清楚这个概念,它是构成图像的重要组成单位,许多效果可以通过对层的直接操作而得到,并在当前图层操作时候不会影响到其他图层,所以在绘图的过程中有着很重要的作用 ...

  3. Windows自调试Redis

    一.安装Redis 1. Redis官网下载地址:http://redis.io/download,下载相应版本的Redis,在运行中输入cmd,然后把目录指向解压的Redis目录. 2.启动服务命令 ...

  4. Codeforces Round #471 (Div. 2)A. Feed the cat

    After waking up at hh:mm, Andrew realised that he had forgotten to feed his only cat for yet another ...

  5. php程序员需要撑握的知识点

    1. 基本知识点 HTTP协议中几个状态码的含义:1xx(临时响应) 表示临时响应并需要请求者继续执行操作的状态代码. 代码   说明 100   (继续) 请求者应当继续提出请求. 服务器返回此代码 ...

  6. BZOJ 3439 Kpm的MC密码 (Trie树+线段树合并)

    题面 先把每个串反着插进$Trie$树 每个节点的子树内,可能有一些节点是某些字符串的开头 每个节点挂一棵权值线段树,记录这些节点对应的原来字符串的编号 查询的时候在线段树上二分即可 为了节省空间,使 ...

  7. python第三周:集合、函数、编码、文件

    1.集合: 集合的创建: list_1 = set([1,2,3,4,5]) list_2 = set([2,3,44,7,8]) 集合的特性:集合是无序的,集合可以去掉重复的元素 集合的操作:求交集 ...

  8. 洛谷 P1137 旅行计划 (拓扑排序+dp)

    在DAG中,拓扑排序可以确定dp的顺序 把图的信息转化到一个拓扑序上 注意转移的时候要用边转移 这道题的dp是用刷表法 #include<bits/stdc++.h> #define RE ...

  9. Ubuntu中的Docker搭建Tensorflow环境

    一.docker环境安装 1)更新.安装依赖包 sudo apt-get update sudo apt-get install apt-transport-https ca-certificates ...

  10. 2015 Multi-University Training Contest 8 hdu 5385 The path

    The path Time Limit: 2000ms Memory Limit: 65536KB This problem will be judged on HDU. Original ID: 5 ...