1.肯定断言:必须匹配一个字符

排除型字符组:匹配未列出字符的字符组

2.范围表示法——列出范围内所有的字符 大多数情况下,不会影响执行速度。但是,某些实现方式不能完全优化字符组。所以,最好是有范围表示法,有可能速度更快。 [a-Z],可能存在遗漏;[a-zA-Z],可以匹配所有字母。

3.点号:在某些软件中,可以匹配任何字符;在其他软件中,匹配处理换行符之外的任何字符。 .* :通常情况下,不能匹配换行符; [^"]* :替代

4.字符组减法:在字符组中进行减法运算,.NET提供 [a-a]-[aeiou]:[a-z]能够匹配字符的减去[aeiou]能够匹配的字符

5.锚点、"零长短断言":不会匹配实际的文本,而是寻找文本中的位置

6.环视:大多实现方式,都限制了逆序环视中的表达式的长度,但是顺序环视则没有限制。有些软件支持逆序环视匹配任意长度的文本,但是可能带来严重的效率问题 逆序环视:只能匹配固定长度的文本。

?<!\w :ok ; ?<!this|that :ok; ?<!books? :wrong,匹配文本不确定,改为 (?<!book)(?<!books) :ok;

?<^\w+: :wrong;匹配文本不确定

7、命名捕获:为捕获的内容命名 \b(?\d\d\d\)- (?\d\d\d)- (?\d\d\d\d)\b : 可以通过 RegexObj.Groups["Area"]来访问括号捕获的内容,

8、某些时候正则表达式处理各种极端情形会降低收益/成本的比例。

某些情况下,更适合的做法就是不依赖正则表达式完成全部的工作。用括号将每个字段括起来$1、$2、$3用其他程序验证。

正则表达式不总是最优解,多数程序设计语言都提供了处理文件名的费正则表达式函数。

9、设置锚点,可以提高正则效率。

10、嵌套:正则表达式无法匹配任意深度的嵌套结构。但可以匹配特定深度的嵌套括号,不是任意深度的嵌套括号   \[^()*(\([^()]*\)[^()]*\)]  可以匹配  val=foo(bar(this),3.7)+2*(that-1);

11、注意,没有匹配任何必须元素,导致任何字符都可以匹配成功   -?[0-9]*\.?[0-9]*

12、占有优先量词或固化分组,可以禁止引擎回溯到可能出问题的地方。

ip地址正则匹配:^([01]?\d\d?|2[0-4]\d|25[0-5]\.)([01]?\d\d?|2[0-4]\d|25[0-5]\.){2}([01]?\d\d?|2[0-4]\d|25[0-5]$)

注意 \d\d? 比\d?\d 效率更高

所在路径和文件名:^(.*)/[^/]*$  优于  ^(.*)/(.*)$  更加明确的表达了意图。提醒8.

匹配引号内的字符: "(\\.|[^\\"])*"   或"(?>(\\.|[^"])*")   或"(\\.|[^"]*+")        \\.  :可以包括转义字符    ;    固化分组、占有优先量词:可以禁止引擎回溯到可能出问题的地方

精通正则表达式(第三版)—Mastering Regular Expressions,3rd Edition—读书笔记2的更多相关文章

  1. 精通正则表达式(第三版)——Mastering Regular Expressions,3rd Edition——读书笔记1

    基础知识介绍: 子表达式匹配 环视 引号内的字符串:"(^")*" 12小时制:(1[0123]|[1-9]):[0-5][0-9]*(am|pm) 24小时制:(([0 ...

  2. Java 线程第三版 第九章 Thread调度 读书笔记

    一.Thread调度的概述 import java.util.*; import java.text.*; public class Task implements Runnable { long n ...

  3. Java 线程第三版 第四章 Thread Notification 读书笔记

    一.等待与通知 public final void wait() throws InterruptedException      等待条件的发生. public final void wait(lo ...

  4. 转载:邮箱正则表达式Comparing E-mail Address Validating Regular Expressions

    Comparing E-mail Address Validating Regular Expressions Updated: 2/3/2012 Summary This page compares ...

  5. [笔记] 精通正则表达式/Mastering Regular Expressions

    / 匹配<emphasis>这个tag标注的IP地址的RE:‘<emphasis>([0-9]+(\.[0-9]+){3})</emphasis>' / 锚定--a ...

  6. Javascript模式(第三章字面量与构造函数)------读书笔记

    一 对象字面量 1.1对象字面量的语法 1,对象键值对哈希表,在其他的编程语言中称之为“关联数组”, 2 键值对里面的值,可以是原始类型也可以是其他类型的对象,称之为属性,函数称之为方法 3 自定义对 ...

  7. 《Visual C# 从入门到精通》第一章使用变量、操作符和表达式——读书笔记

    前言: 这个笔记是我个人总结,主要是熟练自己查看<Visual C# 从入门到精通>(第8版)这本书时,懵然起总结的想法,只是总结一些知识点,在工作项目会用得上,但是对毫无C#语言基础的, ...

  8. < 利用Python进行数据分析 - 第2版 > 第五章 pandas入门 读书笔记

    <利用Python进行数据分析·第2版>第五章 pandas入门--基础对象.操作.规则 python引用.浅拷贝.深拷贝 / 视图.副本 视图=引用 副本=浅拷贝/深拷贝 浅拷贝/深拷贝 ...

  9. Regular Expressions --正则表达式官方教程

    http://docs.oracle.com/javase/tutorial/essential/regex/index.html This lesson explains how to use th ...

随机推荐

  1. 【Linux学习四】正则表达式

    环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 一.grep:显示匹配行v:反显示e:使用扩展正则表达式E:不使用正则 ...

  2. java踩坑

    1. java判断两个字符串是否相等用equals 2. java只传递指针遇到的坑: 1 import java.util.*; 2 3 public class mapTest { 4 publi ...

  3. 多线程(threading)示例

    一.多线程简单示例 import threading,time print('第一线程(默认):程序开始啦!') def takeANap(): time.sleep(5) print('第二线程:5 ...

  4. python 将字节字符串转换成十六进制字符串

    想将一个十六进制字符串解码成一个字节字符串或者将一个字节字符串编码成一个十六进制字符串 1)只是简单的解码或编码一个十六进制的原始字符串,可以使用 binascii模块 >>> s ...

  5. 20165215 2017-2018-2 《Java程序设计》第九周学习总结

    20165215 2017-2018-2 <Java程序设计>第九周学习总结 教材学习内容总结 URL类 URL 类是 java.net 包中的一个重要的类,使用 URL 创建对象的应用程 ...

  6. Linux基础命令---文本显示tac

    tac 将指定文件中的行,按照反序方式显示.此命令的适用范围:RedHat.RHEL.Ubuntu.CentOS.SUSE.openSUSE.Fedora. 1.语法         tac [选项] ...

  7. android TextView Unicde编码转换 android中一些特殊字符Unicode码值

    android TextView Unicde编码转换 android中一些特殊字符Unicode码值 android中一些特殊字符(如:←↑→↓等箭头符号,约等于号≍)的Unicode码值 Text ...

  8. bzoj3678 简单题

    题目链接 bitset #include<algorithm> #include<iostream> #include<cstdlib> #include<c ...

  9. Step7:SQL Server 多实例下的复制

    一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 搭建步骤(Procedure) 注意事项(Attention) 二.背景(Contexts) ...

  10. 重复打印相同内容(Doc档)的时候自动生成打印编号

    昨天突然接到一个好久未联系的朋友电话,说是江湖救急,要打印一份单据,单据上有个号码要自动生成,如下图,最土的办法是打印完一张,手工改下号码,但这种方法估计碰到成百上千张时估计会疯掉 网上找了实现方法, ...