正则表达式 - JavaScript描述
正则表达式 - JavaScript描述
概述
正则表达式是被用来匹配字符串中的字符组合的模式。在JavaScript中,正则表达式也是对象。
创建正则表达式
var re = /abc/; // 使用对象字面量
var re = new RegExp('ab+c'); // 调用构造函数
上面两种方法都可以用来创建正则表达式。如果正则表达式固定不变,建议使用第1种方法创建,这样性能会高一些。如果事先不知道要创建什么样的正则表达式则使用第2种方法。第1种方法的斜杠,第2中方法的单引号或者双引号,均是1种固定写法。
正则表达式的模式
使用简单的模式
简单模式就是使用一些简单的字符,直接进行匹配。比如/abc/
会成功匹配"Hi, do you know your abc's?"和"The latest airplane designs evolved from slabcraft."但是不会匹配"Grab crab"。
特殊字符
一些复杂的正则表达式匹配,需要用到一些特殊字符,在JavaScript中这些特殊字符及其功能如下。默认量词匹配模式为贪婪模式,也就是匹配尽可能多的字符。
字符 | 含义 |
---|---|
\ | 转义字符 |
^ | 匹配输入的开始 |
$ | 匹配输入的结束 |
* | 匹配前一个表达式0次,或者多次。等价于{0, } |
+ | 匹配前一个表达式1次,或者多次。等价于{1, } |
? | 匹配前一个表达式0次或者1次。等价于{0, 1} |
. | (小数点)匹配除了换行符(\n)之外的任何单个字符。 |
(x) | 匹配 'x' 并且记住匹配项。使用$1、$2 可以拿到括号中的内容。 |
x|y |
匹配x或者y |
{n} | n是一个正整数,匹配了前面一个字符刚好发生了n次。 |
{n, m} | n 和 m 都是正整数。匹配前面的字符至少n次,最多m次。 |
[xyz] | 一个字符集合。匹配方括号的中任意字符。可以使用破折号(-)来指定一个字符范围。 |
[^xyz] | 一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。 |
\b | 匹配一个词的边界。(匹配一个单个的单词) |
\d | 匹配一个数字。等价于[0-9] |
\D | 匹配一个非数字。等价于[^0-9] |
\n | 匹配一个换行符。 |
\s | 匹配一个空白字符,包括空格、制表符、换页符和换行符。 |
\S | 匹配一个非空白字符。 |
\w | 匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。 |
\W | 匹配一个非单字字符。 |
详细介绍
\
在正则表达式中出现有3种可能性。第1种,在非特殊字符之前加入\
代表其后字符不能当做普通字符来使用,具有特殊功能。第2种,在特殊字符之前加入\
代表将其后特殊字符的功能移除,使其变成普通字符而能够正常被匹配。第3种,使用new RegExp('pattern')
时,需要对\
进行2次转义,因为\
在字符串里面也是1个转义字符。
^
匹配输入的开始。例如/^A/.test('an A')
匹配失败,而/^A/.test('An E')
匹配成功。
$
匹配输入的结束。/t$/.test('eater')
匹配失败,而/t$/.test('eat')
匹配成功。
*
匹配前一个表达式0次或多次,等价于{0,}。例如:/bo*/.test('bx');/bo*/.test('booo');
都能匹配成功,可以理解为只要字母b出现就匹配成功。
+
匹配前一个表达式1次或多次,等价与{1,}。/a+/.test('a');/a+/.test('aaaww');
能匹配成功,而/a+/.test('qww');
则匹配失败,也就是说a至少要出现1次才能匹配成功。
?
匹配前面1个表达式0次或者1次,等价于{0,1}。例如:/e?le?/
匹配"angel"中的'el',和"angle"中的'le'以及"oslo"中的'l'。
如果紧跟在任何量词* + ? {}
的后面,将会使量词变为非贪婪模式(匹配尽可能少的字符),和默认的贪婪模式正好相反。例如,对 "123abc" 应用 /\d+/ 将会返回 "123",如果使用 /\d+?/,那么就只会匹配到 "1"。
.
小数点将匹配除换行符之外的任何单个字符。例如:/.n/将会匹配 "nay, anapple is on the tree" 中的 'an' 和 'on',但是不会匹配 'nay'。
(x)
匹配 'x' 并且记住匹配项,括号被称为 捕获括号。示例:/Chapter (\d+)\.\d*/
将会匹配"Open Chapter 4.3, paragraph 6"中的'4'并记住。
x|y
匹配'x'或'y'。示例:/green|red/匹配"green apple"中的'green'和"red apple"中的'red'。
{n}
n是一个正整数,匹配前面一个字符刚好发生了n次。示例:/a{2}/不会匹配"candy"中的'a',但是会匹配"caandy"中所有的a,以及"caaaandy"中前2个a。
{n,m}
n和m都是正整数,并且n<=m。匹配至少n次,最多m次。示例:/a{1,3}/匹配"cndy"失败,匹配"candy"结果为'a',匹配"caaaaaaandy"结果为'aaa'。
[xyz]
字符集合。将匹配在中括号中的任意字符,包括转义序列,特殊字符例如* .
将被认为是普通字符,因此不必对它们进行转义,不过转义也是可以的。可以使用破折号(-)来指定一个字符范围。
例如,[abcd] 和[a-d]是一样的。他们都匹配"brisket"中得'b',也都匹配"city"中的'c'。/[a-z.]+/ 和/[\w.]+/都匹配"test.i.ng"中得所有字符。
[^xyz]
一个反向字符集。匹配任何没有包含在方括号中的字符。例如,[^abc] 和 [^a-c] 是一样的。
\b
匹配一个词的边界。
示例:/\bm/匹配"moon"中得'm'
/oo\b/并不匹配"moon"中得'oo',因为'oo'被一个词汇字符'n'紧跟着。
/oon\b/匹配"moon"中得'oon',因为'oon'是这个字符串的结束部分。这样他没有被一个词汇字符紧跟着。
\B
匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置:都是单词或者都不是单词。一个字符串的开始和结尾都被认为是非单词。
例如,/\B../匹配"noonday"中得'oo', 而/y\B./匹配"possibly yesterday"中得'ye'
\d
匹配一个数字。等价于[0-9]。
例如, /\d/ 或者 /[0-9]/ 匹配"B2 is the suite number."中的'2'。
\D
匹配一个非数字字符。等价于[^0-9]。
例如, /\D/ 或者 /[^0-9]/ 匹配"B2 is the suite number."中的'B' 。
\s
匹配一个空白字符,包括空格、制表符、换页符、和换行符。
例如, /\s\w*/ 匹配"foo bar."中的' bar'。
\S
匹配一个非空白字符。例如, /\S\w*/ 匹配"foo bar."中的'foo'。
\w
匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。
示例:/\w/ 匹配 "apple," 中的 'a',"$5.28,"中的 '5' 和 "3D." 中的 '3'。
\W
匹配1个非单字字符,等价于[^A-Za-z0-9_]。
示例:例如, /\W/ 或者 /[^A-Za-z0-9_]/ 匹配 "50%." 中的 '%'。
使用正则表达式
正则表达式可以被用于RegExp的exec和test方法以及String的match、replace、search和split方法。
RegExp.prototype.test()
概述
test() 方法执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。
语法
regexObj.test(str)
示例
/hel/.test("hello world");
参考链接
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp/test
String.prototype.match()
概述
当一个字符串与正则表达式匹配时,match方法会提取匹配项,并返回一个数组。否则返回null。
语法
str.match(regexp);
参数 - regexp是一个正则表达式对象。
返回值 - 1个包含了整个匹配结果以及任何括号捕获的匹配结果数组对象。如果没有匹配项,则返回null。
描述
如果正则表达式没有g标志,则返回的数组对象拥有input属性,表示被解析的原始字符串,还拥有index属性,表示匹配结果在原字符串中的索引。
如果正则表达式包含g标志,则返回的数组对象中不会有index和input属性。
示例
// 简单示例
console.log( "ab".match(/ab/) );
// ["ab", index: 0, input: "ab"]
console.log( "ab".match(/a(b)/) );
// ["ab", "b", index: 0, input: "ab"]
console.log( "ab".match(/a(b)/g) );
// ["ab"]
// 复杂示例
var str = 'For more information, see Chapter 3.4.5.1';
var re = /see (chapter \d+(\.\d)*)/i;
var found = str.match(re);
console.log(found);
// logs [ 'see Chapter 3.4.5.1',
// 'Chapter 3.4.5.1',
// '.1',
// index: 22,
// input: 'For more information, see Chapter 3.4.5.1' ]
// 'see Chapter 3.4.5.1' 是整个匹配。
// 'Chapter 3.4.5.1' 被'(chapter \d+(\.\d)*)'捕获。
// '.1' 是被'(\.\d)'捕获的最后一个值。
// 'index' 属性(22) 是整个匹配从零开始的索引。
// 'input' 属性是被解析的原始字符串。
参考链接
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/match
使用括号的子字符串匹配
在正则表达式的模式中使用括号,可以把括号里面的内容"记住"。在脚本中可以按顺序依次使用$1、$2
表示
第一个和第二个括号里面的内容。下面的例子说明了如何使用括号的子字符串匹配。
var re = /(\w+)\s(\w+)/;
var str = "Hello World";
var newstr = str.replace(re, "$2AND$1");
console.log(newstr); // → WorldANDHello
通过标志进行高级搜索
正则表达式一共有4个标志。这里只介绍最常用最主要的两个g
和i
。分别表示全局搜索和不区分大小写搜索。
默认的搜索是区分大小写的。下面的例子展示了标志的使用方法。
包含标志的正则表达式语法如下:
var re = /pattern/flags; // or
var re = new RegExp("pattern", "flags");
var str = "I am a boy. She is a girl";
/A/.test(str); // → false
/a/i.test(str); // → true
str.match(/a/); // → ["a"]
str.match(/a/g); // → ["a", "a", "a"]
常用正则表达式
- 中文字符
[\u4e00-\u9fa5]
- Email地址
\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}
- 手机
[0-9]{11}
参考资料
正则表达式 - JavaScript描述的更多相关文章
- 翻阅《数据结构与算法javascript描述》--数组篇
导读: 这篇文章比较长,介绍了数组常见的操作方法以及一些注意事项,最后还有几道经典的练习题(面试题). 数组的定义: JavaScript 中的数组是一种特殊的对象,用来表示偏移量的索引是该对象的属性 ...
- 数据结构与算法javascript描述
<数据结构与算法javascript描述>--数组篇 导读: 这篇文章比较长,介绍了数组常见的操作方法以及一些注意事项,最后还有几道经典的练习题(面试题). 数组的定义: JavaScri ...
- 十大经典排序算法总结(JavaScript描述)
前言 读者自行尝试可以想看源码戳这,博主在github建了个库,读者可以Clone下来本地尝试.此博文配合源码体验更棒哦~~~ 个人博客:Damonare的个人博客 原文地址:十大经典算法总结 这世界 ...
- 《数据结构与算法JavaScript描述》
<数据结构与算法JavaScript描述> 基本信息 作者: (美)Michael McMillan 译者: 王群锋 杜欢 丛书名: 图灵程序设计丛书 出版社:人民邮电出版社 ISBN:9 ...
- 列表的实现-----数据结构与算法JavaScript描述 第三章
实现一个列表 script var booklist = new List(); booklist.append('jsbook'); booklist.append('cssbook'); book ...
- 《数据结构与算法JavaScript描述》中的一处错误
最近在看<数据结构与算法JavaScript描述>这本书,看到选择排序这部分时,发现一个比较大的错误. 原书的选择排序算法是这样的: function selectionSort() { ...
- 数据结构与算法 Javascript描述
数据结构与算法系列主要记录<数据结构与算法 Javascript描述>学习心得
- 正则表达式: javascript Unicode 中文字符 编码区间:\u4e00-\u9fa5
正则表达式: javascript Unicode 中文字符 编码区间:\u4e00-\u9fa5 RegExp 对象 javascript Unicode 中文字符的 编码区间: \u4e00-\ ...
- 史上最全常用正则表达式(Javascript公众号推文)
2017-04-13 zxin JavaScript很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求.所以我最近把开发中常用的一些正则表达式整理了一下 ...
随机推荐
- I帧、B帧、P帧、NALU类型
i帧 i frame,即内部画面 intra picture,通常是GOP的第一个帧(即IDR)I帧是最大去除图像空间冗余信息而压缩得到的帧,自带全部信息,不参考其他帧可独立解码,称为帧内编码帧所有视 ...
- Hive学习笔记——HQL用法及UDF,Transform
Hive中没有定义专门的数据格式,数据格式可以由用户指定,用户定义数据格式需要指定三个属性:列分隔符(通常为空格.”\t”.”\x001″).行分隔符 (”\n”)以及读取文件数据的方法(Hive 中 ...
- idea传入HttpServletRequest时显示cannot resolve symbol的问题
在使用idea ide的时候,在控制器中我需要获取HttpServletRequest这个request对象,编译时出现cannot resolve symbol的问题,然后网上查找资料,这里记录一下 ...
- jQuery Colorbox使用教程
jQuery Colorbox是一款弹出层,内容播放插件,效果极佳,最关键的是大小只有10KB,当然我主要是用来弹出图片啦,(之前介绍过jquery Fancybox插件,个人很喜欢).jQuery ...
- 【BZOJ】3396: [Usaco2009 Jan]Total flow 水流 (最大流)
http://www.lydsy.com/JudgeOnline/problem.php?id=3396 裸的最大流跑过.. #include <cstdio> #include < ...
- 【SR】正则化超分辨率复原
正则化超分辨率图像重建算法研究--中国科学技术大学 硕士学位论文--路庆春 最大后验概率(MAP)的含义就是在低分辨率图像序列已知的前提下,使高分辨率图像出现的概率达到最大.
- Python 实现购物商城,含有用户入口和商家入口
这是模拟淘宝的一个简易的购物商城程序. 用户入口具有以下功能: 登录认证 可以锁定用户 密码输入次数大于3次,锁定用户名 连续三次输错用户名退出程序 可以选择直接购买,也可以选择加入购物车 用户使用支 ...
- AWS系列-申请Redis
1.1 打开aws控制台,可以直接搜索redis 1.2 进入redis控制面板 点击启动缓存集群(这个只是启动创建的意思,不是启动下面创建好的node.我也不懂为啥翻译过来是这个意思...) 1.3 ...
- iOS-将NSString转换成UTF8编码的NSString
在使用网络地址时,一般要先将url进行encode成UTF8格式的编码,否则在使用时可能报告网址不存在的错误,这时就需要进行转换 下面就是转换函数: NSString *urlString= [NSS ...
- iOS-layoutSubvies和drawRect何时调用