正则表达式小结(Regular Expressions)
(原创文章,谢绝转载~)
日常开发中,常用正则表达式方便的进行匹配、筛选工作。正则的常用内容有:
- 一般情况下原则:从左至右,越多越好(贪婪)
- 字符;转义:\ ,如 \*,\d (数字)等
- 选择,case1|case2|case3,
注意:对于大部分正则引擎,匹配规则是从左至右优先,因而,string|stringlong 会匹配到 stringlong 的 string 部分;
少数 Text-Directed Engine 的匹配规则则是最长优先,此时 string|stringlong 会匹配到 stringlong ;
- 起始位置:^ ,结束位置: $, 注意^和$并不匹配字符而是匹配位置,例如 d$ 可以匹配到 end 的 d,其中end的d字符的右边位置恰为结束位置。
- 重复数量:
- 精确重复数量,{n},例如: char{3} 匹配 charrr,r 重复3次
- 非精确重复数量,
- 0-1 次: ? ,例如 char? 匹配char(优先)或cha
- 1-无穷:+ , 例如 char+ 匹配char,charr,charrr,.......其中r至少重复1次
- 0-无穷:* , 例如 char* 匹配 cha,char,charr,.......其中r重复0次及以上
- lazy懒惰模式,在上面三种情况下后面再加?号, ??, +?, *? ,在这种情况下,匹配越少越好,
例如 char?? ,本来一个问号是 0-1,再lazy模式,则越少越好,0次,于是char?? 可匹配 cha 而不能匹配 char
再如 char+? ,本来一个加号是1-无穷,再lazy模式,则越少越好,1次,于是char+? 可匹配 char 而不能匹配 charr ,charrr等
- possessive占有模式,在上面三种情况下后面再加+号, ?+, ++, *+ ,在这种情况下,匹配越多越好,且不回溯
例如 char++, 越多越好 ,charrrrr,有多少r匹配到多少,
另一方面,不回溯,是什么含义呢,考虑以下问题: char++r, 它能否匹配 charrrrr ?答案是 不能。事实上:
cha r++ r
cha rrrr r 看过去好像可以让r++ 匹配4个r,最后一个r匹配r,这样正好匹配上,但因为独占模式是越多越好,所以第5个r 也会被 r++ 匹配到,也就是下图所示:
cha r++ r
cha rrrrr r++ 匹配到 rrrrr, 一旦匹配上则占有,不会再回溯(减少r的数量),因而 char++r 中的最后一个r ,没有东西和它匹配,所以匹配失败。
细思则有: char++r 无法匹配任何形式。。。
捕获组和索引值(Capturing Groups and Backreferences )
捕获组 用括号括住捕获部分,(regex),例如 (regex1)(regex2){3} ,regex1 和regex2 分别为两个捕获组,且分别具有索引值1和2,
注意:索引值序列123...的编码顺序为根据括号先从左至右,从外到内递归,
例如 (str1)(str(str3))(str4), str1索引值为1,(str(str3)) 整体索引值为2,str3 索引值为3,str4 索引值为 4。
正则表达式小结(Regular Expressions)的更多相关文章
- 正则表达式备忘录-Regular Expressions Cheatsheet中文版
正则表达式备忘录Regular Expressions Cheatsheet中文版原文:https://www.maketecheasier.com/cheatsheet/regex/ 测试文件a.t ...
- 正则表达式(Regular expressions)使用笔记
Regular expressions are a powerful language for matching text patterns. This page gives a basic intr ...
- [笔记] 精通正则表达式/Mastering Regular Expressions
/ 匹配<emphasis>这个tag标注的IP地址的RE:‘<emphasis>([0-9]+(\.[0-9]+){3})</emphasis>' / 锚定--a ...
- 自学Zabbix8.1 Regular expressions 正则表达式
点击返回:自学Zabbix之路 点击返回:自学Zabbix4.0之路 点击返回:自学zabbix集锦 自学Zabbix8.1 Regular expressions 正则表达式 1. 配置 点击Adm ...
- Python之Regular Expressions(正则表达式)
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要.正则表达式就是用于描述这些规则的工具.换句话说,正则表达式就是记录文本规则的代码. 很可能你使用过Windows/Dos下用 ...
- 转载:邮箱正则表达式Comparing E-mail Address Validating Regular Expressions
Comparing E-mail Address Validating Regular Expressions Updated: 2/3/2012 Summary This page compares ...
- Regular Expressions --正则表达式官方教程
http://docs.oracle.com/javase/tutorial/essential/regex/index.html This lesson explains how to use th ...
- Regular Expressions in Grep Command with 10 Examples --reference
Regular expressions are used to search and manipulate the text, based on the patterns. Most of the L ...
- Introducing Regular Expressions 学习笔记
Introducing Regular Expressions 读书笔记 工具: regexbuddy:http://download.csdn.net/tag/regexbuddy%E7%A0%B4 ...
- 【Python学习笔记】Coursera课程《Using Python to Access Web Data 》 密歇根大学 Charles Severance——Week2 Regular Expressions课堂笔记
Coursera课程<Using Python to Access Web Data > 密歇根大学 Charles Severance Week2 Regular Expressions ...
随机推荐
- 《如莲春天》Java开发框架
关于 如莲者,净洁如莲之意,希望打造一个简洁的系统框架.系统主要采用Spring相关技术,故取名:如莲春天. 如莲春天,包括一套系统界面.一个权限管理系统.一个CURD代码生成模块.一些基础模块 ...
- 快速排序(Quicksort)的Javascript实现
日本程序员norahiko,写了一个排序算法的动画演示,非常有趣. 这个周末,我就用它当做教材,好好学习了一下各种排序算法. 排序算法(Sorting algorithm)是计算机科学最古老.最基本的 ...
- [1] Spring.Net
开发框架之Spring.Net
- printf和scanf整理(后续填补)
scanf和printf头文件:<stdio.h> 1.%d.%3d.%03d.%-3d区分 %d:以十进制形式输出整数(int) %3d:指定宽度为3,不足的左边补空格 %03d:一种左 ...
- 【VC6.0】getline需要输入2次回车才会结束的BUG修复方法
原始日期:2013-09-30 23:22 今天看C++Primer的时候发现一个问题,getline需要输入2次回车才会显示结果,上网找了一下,发现是VC6.0的原因,修复原因如下: (1)建立一个 ...
- cesium自定义气泡窗口infoWindow后续优化篇
http://www.cnblogs.com/giserhome/p/6248858.html该篇文章实现的自定义气泡窗口是基于修改cesium源代码基础上,这种做法只是援兵之计,凑合应付的,投机取巧 ...
- HTML5 中的拖放
今天,给大家整理一个html5 拖放. 首先,我们先了解一下什么是拖放? 拖放(Drag 和 drop)是 HTML5 标准的组成部分. 拖放是一种常见的特性,即抓取对象以后拖到另一个位置. 在 HT ...
- PHP设计模式:工厂方法
示例代码详见https://github.com/52fhy/design_patterns 工厂方法 工厂方法是针对每一种产品提供一个工厂类.通过不同的工厂实例来创建不同的产品实例. 相比简单工厂, ...
- java 多线程访问同一个对象数据保护的问题
java 多线程同时访问统一个数据的时候,会引起一些错误,后面的线程会修改数据,而前面的线程还在使用修改前的内容, 使用 synchronized 关键字,保证代码块只能有一个线程来访问 public ...
- react-router 踩坑记
react-router踩坑分享 背景 辛苦历程 JavaScript动态修改 第一次尝试 第二次尝试 第三次尝试 第四次尝试 总结步骤 其他方案 原理 History 常见的3种History Br ...