javascript正则表达式(一)——语法
前言
js中类RegExp类表示正则表达式,具有强大的模式匹配、文本检索和替换功能。正则表达式的模式规则是由一个字符序列组成,包括所有字母和数字在内,大多数的字符都是按照直接量匹配字符,某些特殊字符并不按照字面含义匹配字符例如$等,当按照非字面含义匹配时使用需要利用反斜杠转义
可以采用下面两种方式创建RegExp对象:
eg:下面两种方式都可以匹配以s结尾的字符串
//方式一($匹配字符串的结尾),采用构造函数方式
var pattern = new RegExp("s$"); //方式二 ,采用正则表达式直接量的方式,定义在一对斜杠之间的字符
var pattern = /s$/;
注意: 在ECMAScript3中一个正则表达式在执行到它时会转换为一个RegExp对象,同一段代码所表示的正则表达式直接量的每次运算都返回同一个对象(区别于{}和[],每次会创建新的对象),而ECMAScript5中不是
即ECMAScript3中RegExp对象会共享同一个实例,而在ECMAScript5中是两个独立的实例
字符
1、直接量字符
字母和数字字符: 自身 \o: NUL字符 \t: 制表符 \n: 换行符 \v: 垂直制表符 \f: 翻页符 \r: 回车符 ....
2、字符类
将直接量字符放进方括号内组成了字符类,一个字符类可以匹配它所包含的任意字符 eg:/[abc]/可以匹配a、b、c
字符类列表如下:
[....]: 方括号内任意字符 [^...]: 不在方括号内的任意字符 . : 除换行符和其他Unicode行终止符之外的任意字符 \w : 任意ASCII字符组成的单词,等价于[a-zA-Z0-9] \W : 任何不适ASCII字符组成的单词,等价于[^a-zA-Z0-9] \s : 任何Unicode空白符 \S : 任何非Unicode空白符的字符 \d : 任何ASCII数字,等价于[0-9] \D : 等价于[^0-9] [\b] : 退格直接量
重复
/\d\d/可以匹配两个数字,如果位数很多时怎么办呢,可以采用如下方式:
{n}: 匹配前一项n次
{n,}: 匹配前一项n次或者是更多次
{n,m}: 匹配前一项至少n次,至多m次
* : 匹配前一项0次或者多次,等价于{0,}
+ : 匹配前一项1次或者多次,等价于{1,}
? : 匹配前一项0次或者1次(即前一项是可选的)等价于{0,1}
上面这种方式是”贪婪的“匹配,即尽可能多的匹配。如果要”非贪婪的“匹配,可以在匹配的字符后加一个问号。
eg:/a+/ 和 /a+?/, 如果将aaa作为匹配字符串,前一种方式会匹配aaa,后一种方式只会匹配第一个a
当需要匹配aaab时 /a+b/和/a+?b/等价
分组
字符|用于分割供选择的字符,eg /ab|cd|ef/可以匹配字符串 ab或者cd或者ef。
选择项的尝试匹配次序是从左到右,知道发现匹配项,如果左边的选择项匹配就会忽略右边的匹配项,eg /a|ab/ 匹配ab时只能匹配a
圆括号()
圆括号()作用:
1. 将单独的项组合为表达式
eg:/java(script)?/ 可以匹配java或者javascript
2. 在完成模式中定义子模式,当一个正则表达式成功的与目标字符串相匹配时可以从目标串中抽出和圆括号中的子模式相匹配的部分
eg: /[a-z]+(\d+)/ 模式中 /[a-z]+\d+/可以匹配一个或者多个小写字母后加一个和多个数字,那么我们使用()将\d+括起来后,就可以从匹配项中抽取出数字部分。当我们更关心后面的数字时可以使用这种方式
3. 允许在同一正则表达式的后面引用前面的子表达式。 通过在反斜杠\后加一个或者多个数字来实现,这个数字指定了带圆括号的子表达式在正则表达式中的位置
eg1: /(java(script)[abc]+)/ 中(script)可以使用\2来指代
eg2: /[' "][^' "]*[' "]可以使用 /([' "])[^' "]*\1/替代
(?:....)
(?:) 把项组合成一个单元,但是不生成引用,区别于子表达式中的()
eg:在/([Jj]ava(?:[Ss]cript)?)\sis\s(fun\w*)/中 \2与(fun\W*)匹配
锚(指定匹配位置)
锚用于指定匹配表达式出现的合法位置。最常用的锚元素是^用于匹配字符串的开始,锚元素$用于匹配字符串的结束
总结列表:
^ : 匹配字符串的开头,多行检索时用于匹配一行的开头 $ : 匹配字符串的结尾,多行检索时用于匹配一行的结尾 \b: 匹配一个单词的边界(区别于[\b]退格) \B: 匹配非单词边界的位置 (?=p): 正向先行断言,接下来的字符与p匹配 (?!p): 负向先行断言,接下来的字符不与p匹配
举例说明下正向先行断言和负向先行断言:
eg1: /[Jj]ava([Ss]cript)?(?=\:)/ 则改模式能匹配Javascript:is a very interesting language 中的Javascript,但是不能匹配Java is a very interesting language 中的Java
eg2:/Java(?! script)[A-Z]\w*/ 能够匹配Java后跟随一个大写字母和任意多个ASCII单词,但是不能跟随Script
例如它能匹配JavaBeans 不能匹配Javanese
修饰符
修饰符放在"/"之外,下面的修饰符可以任意组合
i:说明匹配模式不区分大小写 g:说明匹配模式时全局的,应该找出所有的匹配,而不是找到第一个就停止 m:多行执行模式,此时^和$除了匹配整个字符串的开始和结尾之外,还能匹配每行的开始和结尾
eg: /\bjava\b/i 可以匹配java Java JAVA等
/JAVA$/im 可以匹配java Java\nis fun
例子
1)邮箱
/^[a-zA-Z0-9_-]+\@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$/
注意
1.正则表达式中不允许双引号括起来的内容中有单引号,反之亦然.
2.在字符类中不能使用字表达式的引用
eg:/([' "])[^\1]*\1/ 是非法的
相关方法:
javascript正则表达式(一)——语法的更多相关文章
- JavaScript 正则表达式基础语法
前言 正则表达式在人们的印象中可能是一堆无法理解的字符,但就是这些符号却实现了字符串的高效操作.通常的情况是,问题本身并不复杂,但没有正则表达式就成了大问题.javascript中的正则表达式作为相当 ...
- JavaScript正则表达式之语法
Regular Expressions翻译成中文叫正则表达式.也不知道是谁翻译过来的,听起来就很严肃.似乎翻译成通用表达式更能传达其精髓. 为什么叫通用表达式?因为它有一套和编程语言无关的文本匹配规则 ...
- JavaScript 正则表达式——基本语法(2)
来源:http://www.cnblogs.com/dolphinX/p/3486214.html 定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> ...
- JavaScript正则表达式下——相关方法
上篇博客JavaScript 正则表达式上——基本语法介绍了JavaScript正则表达式的语法,有了这些基本知识,可以看看正则表达式在JavaScript的应用了,在一切开始之前,看看RegExp实 ...
- javascript正则表达式语法
1. 正则表达式规则 1.1 普通字符 字母.数字.汉字.下划线.以及后边章节中没有特殊定义的标点符号,都是"普通字符".表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的 ...
- JavaScript 正则表达式上——基本语法
定义 JavaScript种正则表达式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%&g ...
- javascript正则表达式(RegExp)简述
首先我们来思考以下两个个场景 我们使用window操作系统,有时候需要找一个文件,刚刚好这个文件我不知道放哪里去了,这个时候我们该怎么办呢? 我们使用word写论文的时候,不小心将"订价&q ...
- JavaScript正则表达式详解(一)正则表达式入门
JavaScript正则表达式是很多JavaScript开发人员比较头疼的事情,也很多人不愿意学习,只是必要的时候上网查一下就可以啦~本文中详细的把JavaScript正则表达式的用法进行了列表,希望 ...
- 5分钟教你学会JavaScript正则表达式
正则表达式在实际开发过程中和技术面试过程中的重要性不言而喻,本文仅仅只是教你如何在几分钟之类学会正则表达式,对于它的原理及运行机制不做介绍. 第一:什么是正则 正则表达式是一种用来描述一定数量文本的模 ...
随机推荐
- C++对象模型学习笔记
1. 全局变量是如何初始化的 //global var A a; int main() { cout<<a<<endl; ; } 如上述例子,全局变量a是在main()函数之前 ...
- java的通信机制
通信机制无非就那几种:http访问.socket访问: http又分为:jsp.servlet.html,用的就是get和post方法 socket则可分为:tcp或者udp方式 从以上内容又衍生出其 ...
- zabbix图中出现中文乱码问题
我这周部署了zabbix监控服务器,但是配置过程中发现当有中文时,图中的中文会变成方块 如下图所示: 这个问题是由于zabbix的web端没有中文字库,我们最需要把中文字库加上即可 解决办法如下 1. ...
- python自学笔记
python自学笔记 python自学笔记 1.输出 2.输入 3.零碎 4.数据结构 4.1 list 类比于java中的数组 4.2 tuple 元祖 5.条件判断和循环 5.1 条件判断 5.2 ...
- IDEA中添加各种依赖pom.xml文件内容
刚实习的小白,今天准备进入项目,纳尼,前辈把框架什么的都搭建好了,默默的抹了一把辛酸泪,刚刚接触自学框架的时候,添加依赖的时候总是各种问题,让前辈发给我之后,才发现人家写的代码相当优美了.下面就是前辈 ...
- 模仿qq音乐播放字母效果
html <div class="cont"> <ul class="cont_ul" id="cont_ul"> ...
- jquery 的日期时间控件(年月日时分秒)
<!-- import package --> <script type="text/javascript" src="JS/jquery.js&quo ...
- 学习python——博客记录第一天
HELLO WORLD! 今天第一次开立博客,专门记载学习编程语言中的点点滴滴.今日学习内容: 搭建vs code+ python3.5 "ide" 学习廖雪峰python教程 ...
- python文件处理
python中对文件处理需要涉及到os模块和shutil模块得到当前工作目录路径:os.getcwd()获取指定目录下的所有文件和目录名:os.listdir(dir)删除文件:os.remove(f ...
- 柯里化(Curing)
柯里化:把接受多个参数的函数变换成接受单个参数的函数,并且返回准备接受余下参数,还能返回结果的一种技术. function currying(fn){ var args = Array.prototy ...