(原创文章,谢绝转载~)

日常开发中,常用正则表达式方便的进行匹配、筛选工作。正则的常用内容有:

  • 一般情况下原则:从左至右,越多越好(贪婪)
  • 字符;转义:\ ,如 \*,\d (数字)等
  • 选择,case1|case2|case3,

注意:对于大部分正则引擎,匹配规则是从左至右优先,因而,string|stringlong  会匹配到 stringlong 的 string 部分;

少数  Text-Directed Engine  的匹配规则则是最长优先,此时 string|stringlong  会匹配到 stringlong ;

  • 起始位置:^  ,结束位置: $,  注意^和$并不匹配字符而是匹配位置,例如 d$ 可以匹配到 end 的 d,其中end的d字符的右边位置恰为结束位置。
  • 重复数量:
  1. 精确重复数量,{n},例如: char{3}   匹配 charrr,r 重复3次
  2. 非精确重复数量,
    • 0-1 次: ?  ,例如 char?  匹配char(优先)或cha
    • 1-无穷:+ , 例如 char+   匹配char,charr,charrr,.......其中r至少重复1次
    • 0-无穷:* ,  例如 char*   匹配 cha,char,charr,.......其中r重复0次及以上
    • lazy懒惰模式,在上面三种情况下后面再加?号,  ??, +?, *?  ,在这种情况下,匹配越少越好,

例如 char??  ,本来一个问号是 0-1,再lazy模式,则越少越好,0次,于是char?? 可匹配 cha 而不能匹配 char

再如 char+?  ,本来一个加号是1-无穷,再lazy模式,则越少越好,1次,于是char+? 可匹配 char 而不能匹配 charr ,charrr等

    • possessive占有模式,在上面三种情况下后面再加+号,  ?+, ++, *+  ,在这种情况下,匹配越多越好,且不回溯

例如  char++, 越多越好 ,charrrrr,有多少r匹配到多少,

另一方面,不回溯,是什么含义呢,考虑以下问题:  char++r,   它能否匹配 charrrrr ?答案是 不能。事实上:

cha  r++  r

cha  rrrr  r             看过去好像可以让r++ 匹配4个r,最后一个r匹配r,这样正好匹配上,但因为独占模式是越多越好,所以第5个r 也会被 r++ 匹配到,也就是下图所示:

cha  r++       r

cha  rrrrr                r++ 匹配到 rrrrr, 一旦匹配上则占有,不会再回溯(减少r的数量),因而  char++r  中的最后一个r ,没有东西和它匹配,所以匹配失败。

细思则有:   char++r  无法匹配任何形式。。。

  • 捕获组和索引值(Capturing Groups and Backreferences )

捕获组 用括号括住捕获部分,(regex),例如 (regex1)(regex2){3} ,regex1 和regex2 分别为两个捕获组,且分别具有索引值1和2,

   注意:索引值序列123...的编码顺序为根据括号先从左至右,从外到内递归,

        例如 (str1)(str(str3))(str4), str1索引值为1,(str(str3)) 整体索引值为2,str3 索引值为3,str4 索引值为 4。

正则表达式小结(Regular Expressions)的更多相关文章

  1. 正则表达式备忘录-Regular Expressions Cheatsheet中文版

    正则表达式备忘录Regular Expressions Cheatsheet中文版原文:https://www.maketecheasier.com/cheatsheet/regex/ 测试文件a.t ...

  2. 正则表达式(Regular expressions)使用笔记

    Regular expressions are a powerful language for matching text patterns. This page gives a basic intr ...

  3. [笔记] 精通正则表达式/Mastering Regular Expressions

    / 匹配<emphasis>这个tag标注的IP地址的RE:‘<emphasis>([0-9]+(\.[0-9]+){3})</emphasis>' / 锚定--a ...

  4. 自学Zabbix8.1 Regular expressions 正则表达式

    点击返回:自学Zabbix之路 点击返回:自学Zabbix4.0之路 点击返回:自学zabbix集锦 自学Zabbix8.1 Regular expressions 正则表达式 1. 配置 点击Adm ...

  5. Python之Regular Expressions(正则表达式)

    在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要.正则表达式就是用于描述这些规则的工具.换句话说,正则表达式就是记录文本规则的代码. 很可能你使用过Windows/Dos下用 ...

  6. 转载:邮箱正则表达式Comparing E-mail Address Validating Regular Expressions

    Comparing E-mail Address Validating Regular Expressions Updated: 2/3/2012 Summary This page compares ...

  7. Regular Expressions --正则表达式官方教程

    http://docs.oracle.com/javase/tutorial/essential/regex/index.html This lesson explains how to use th ...

  8. Regular Expressions in Grep Command with 10 Examples --reference

    Regular expressions are used to search and manipulate the text, based on the patterns. Most of the L ...

  9. Introducing Regular Expressions 学习笔记

    Introducing Regular Expressions 读书笔记 工具: regexbuddy:http://download.csdn.net/tag/regexbuddy%E7%A0%B4 ...

  10. 【Python学习笔记】Coursera课程《Using Python to Access Web Data 》 密歇根大学 Charles Severance——Week2 Regular Expressions课堂笔记

    Coursera课程<Using Python to Access Web Data > 密歇根大学 Charles Severance Week2 Regular Expressions ...

随机推荐

  1. cpp(第十章)

    1. const class & func(const class &) const { do something.. } 第一个const返回后的类不允许被赋值,第二个const不允 ...

  2. 【Selenium】idea的selenium环境配置

    1.maven配置 下载地址:http://maven.apache.org/download.cgi# 下载内容:apache-maven-3.5.0-bin.zip 环境变量:M2_HOME:E: ...

  3. 浅论ajax跨域!从一个例子开始!

    //所谓跨域,简单来说就是去访问不是自己域名下的数据 <!DOCTYPE html> <html lang="en"> <head> <m ...

  4. spring非controller类获取service方法

    ApplicationContext ctx = new ClassPathXmlApplicationContext("spring.xml"); pushMessageServ ...

  5. 备份Rhythmbox播放器的曲目和播放列表信息

    Rhythmbox音乐播放器只能保存单个播放列表,如果在rhythmbox下建了很多播放列表(比如按歌手名分类),每个播放列表下包含一些歌曲,为了避免重装系统后重新建这些播放列表,可以备份下面的文件. ...

  6. 微信小程序 - 自定义创建

    自定义创建与默认创建完全相同, 只是不要勾选quick start即可 淡定(不要看到报错就紧张, 一定要淡定) 看看它说了什么, no such file or directory(没有文件或目录) ...

  7. 实现Ant Design 自定义表单组件

    Ant Design 组件提供了Input,InputNumber,Radio,Select,uplod等表单组件,但实际开发中这是不能满足需求,同时我们希望可以继续使用Form提供的验证和提示等方法 ...

  8. java中方法总结(每周更新)

    1.URLEncoder.encode(username,"utf-8")将"utf-8"编码的username先解码,然后再采用URL编码 2.URLDeco ...

  9. Service 中添加同步块防止并发 重复

    Service 中添加同步块防止并发 重复. synchronized(this){}

  10. Kotlin基本语法和使用

    Kotlin 是一个基于 JVM 的新的编程语言,由 JetBrains 开发.与Java相比,Kotlin的语法更简洁.更具表达性,而且提供了更多的特性. Kotlin是使用Java开发者的思维被创 ...