【.NET】正则表达式笔记
很早就听说正则表达式的强大,今天终于一睹它的真容,在这里记下学习时候的笔记,以便以后查看
1、正则表达式
用于描述字符串规则的的特殊的字符(正则表达式本身是字符串,用来描述字符串的相关规则,用于与其他字符串进行匹配)
例如:
正则表达式:\bHttp\b 表示单词 Http,两边的\b表示单词的开始于结束
可以与"Here is a Http tag"匹配,但是不能与'", "HttpRequest", "XMLHttpRequest"等字符串匹配,
2、元字符(meta character)
用于描述最基本的信息,常见的有以下元字符
\b 单词的开始于结束
\w 字母(大小写),数字,下划线
\s 任意空字符(空格,制表符,回车)
\d 匹配数字0-9
. 小数点,匹配非换行字符
^ 字符串的开始(注意:\b是表示单词)
$ 字符串的结束
其中:\B,\W,\S,\D的含义与小写的相反
例如:\D表示非数字字符
3、转义字符
小数点: \.
星号: \*
下划线: \\
括号: \( \)
3、限定字符
* 重复0次或多次
+ 重复1次或多次
? 重复0次或1次
{n} 重复n次
{n,} 重复n次以上
{n,m} 重复n次到m次,包括n,m次
当要匹配多个字符的时候,可以使用限定字符
例如:^\d{5}\w*$ 表示以5个数字开头的后面跟任意长度的字符(字母或数字或下划线)
4、字符类
匹配单个字符 [abc] 匹配所有a,b,c字符
[^acd] 匹配所有的部位a,c,d的字符
[,.?!;'"] 匹配半角标点
[a-zA-Z0-9_] 相当于\w
5、分枝条件
当有多个匹配条件的时候,可以使用 '|' 符号来连接几个条件,会优先匹配第一个
例如:\d{5}-\d{4}|\d{4}-\d{5}
IP地址: ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)
6、分组
后向引用:用于搜索前面匹配的结果
例如:在后面的匹配需要用到前面的匹配结果,
\b(?<name>\w+)\b\s+\k<name>\b 匹配两个连续相同的单词
(exp) 匹配exp表达式,并将匹配文本放到自动命名组里
(?<name>exp) 可对匹配的文本手动命名,并通过\k<name>引用,也可以吧尖括号换成单引号(?'name'exp)
(?:exp) 不获取文本,不分配组号
7、断言
1)正预测先行断言 (?=exp) 先匹配断言里面的表达式,匹配出之前的位置,再匹配外面的表达式,匹配结果不包含断言内容
例如:\d[0-9]*(?=9\b) 先判断单词是否以9结束,在判断是否为全数字,匹配结果不包含9
78159 匹配结果为 7815 断言位置在9之前
2)正回顾后发断言 (?<=exp) 匹配出之后的位置
例如:(?<=\bre)\w* 匹配以 re 开头的单词,不包括re
I'm reading 匹配结果为 eading 断言位置在re之后
3)负向零宽先行断言 (?!exp)
与正预测先行断言相似,只是匹配的条件为相反
例如: \d{3}(?!\d) 匹配三位数字,而且这三位数字的后面不能是数字;
\b((?!abc)\w)+\b 匹配不包含连续字符串abc的单词。
4)负向零宽后发断言 (?<!exp)
与郑回顾后发断言相似,匹配条件相反
例如: (?<![a-z])\d{7} 匹配前面不是小写字母的七位数字。
8、注释
(?#comment) 例如 \d{3}(?!\d)(?#这里是注释)
9、贪婪匹配与懒惰匹配
在默认情况下,所有的匹配都会采取贪婪匹配,即匹配竟可能多的项
例如: a.*b 匹配 abaaababaa
默认情况下回匹配出 abaaabab, 而不是 ab,aaab,ab
在限定符后面加上?则可以竟可能少的匹配
a.*? 匹配 abaaababaa 结果为 ab,aaab,ab
10、在.NET中使用
Regex regex = new Regex(@"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$", RegexOptions.Multiline | RegexOptions.IgnorePatternWhitespace);
bool b = regex.IsMatch("44917929@qq.com");
在new Regex的时候,可以设置一些参数 http://msdn.microsoft.com/zh-cn/library/system.text.regularexpressions.regexoptions.aspx
Compiled 指定将正则表达式编译为程序集。 这会产生更快的执行速度,但会增加启动时间。
ExplicitCapture 仅捕获显式命名的组
IgnoreCase 指定不区分大小写的匹配。
None 匹配任何字符除了\n。^和$不起作用。
Singleline 匹配任何字符。^和$匹配整个字符串
Multiline 匹配任何字符除了\n。^和$匹配每行的开头和结尾。
IgnorePatternWhitespace 忽略表达式中的非转义空白,并启用#标记注释
11、练习
1、非负整数 ^\d+$
2、正整数 ^[1-9]*[1-9][0-9]*$
3、非正整数 ^(-\d+10)$
4、负整数 ^-[1-9]*[1-9][0-9]*$
5、整数 ^-?\d+$
5、非负浮点数 ^\d+(\.\d+)?$
6、正浮点数
7、长度为8-10的用户名(以字母或下划线开头) ^[A-Za-z_]\w{7,9}$
8、电子邮件 ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
9、一个没有属性的html标签的内容(例如<div>内容</div>) (?<=<(\w+)>).*(?=<\/\1>)
参考文章:
http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html#lookaround
【.NET】正则表达式笔记的更多相关文章
- PHP正则表达式笔记和实例
转自: https://www.cnblogs.com/yafei236/p/4168290.html 本文主要介绍如何在PHP使用正则表达式,并附带几个实例. 这两天工作用到了正则表达式,发现自己 ...
- Python的正则表达式笔记
1. "先抓大再抓小": 遇到一个正则表达式无法一次性筛选出所需内容时, 可以先在一个范围内筛选第一次, 再在小范围中筛选第二次. 2. pattern = re.compile( ...
- Javascript正则表达式笔记
一.字符类 将单独的直接字符放进[]内,就组成了字符类.一个字符类和它所包含的任何字符都匹配. 例如:/[abc]/ 与abc三个字母的任意一个匹配. 同时,还可以定义否定字符类.利用^字符.例如:/ ...
- python 正则表达式笔记
#!usr/bin/env python3 #-*- coding:utf-8 -*- #正则表达式 #在正则表达式中,如果直接给出字符,就是精确匹配.用\d可以匹配一个数字,\w可以匹配一个字母.数 ...
- c# 正则表达式笔记
估计要写几天 看得一个不错的正则教程包括字符串教程 C#字符串和正则表达式参考手册.pdf 正则所需要的命名空间是 using System.Text.RegularExpressions 它包含了8 ...
- apache url rewrite及正则表达式笔记
什么是mod_rewrite? mod_rewrite是apache一个允许服务器端对请求url做修改的模块.入端url将和一系列的rule来比对.这些rule包含一个正则表达式以便检测每个特别的模式 ...
- JS正则表达式笔记
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串.将匹配的子串替换或者从某个串中取出符合某个条件的子串等. 正则 描述 ...
- Python之正则表达式笔记
概述 概念 Regular Expression 一种文本模式,描述在搜索文本时要匹配的一个或多个字符串 典型场景 数据验证.文本扫描.文本提取.文本替换.文本分割 语法 字面值 普通字符 需转义:\ ...
- 果然学习好是有道理的,学习Mysql与正则表达式笔记
正则表达式是用来匹配文本的特殊的字符集合,将一个正则表达式与文本串进行比较,Mysql中用where子句提供支持,正则表达式关键字:regexp1.使用‘|’匹配两个串中的一个 2.使用‘[]’匹配几 ...
随机推荐
- MBCS与Unicode的转换
一.绪 其实刚开始编程的时候我不太喜欢用Unicode编码,所以比较喜欢 VC6.0,即使使用VS2010,也会设置为未设置模式. 后来,没办法的接触了些Unicode的编程的东西,必须得研究字符集的 ...
- Scala开发入门指南
作者:chszs,转载需注明.博客主页:http://blog.csdn.net/chszs 一.下载Scala 当前Scala的最新版本为2.10.2版,Windows有两种发布包: 1)Windo ...
- 4. K-Means和K-Means++实现
1. K-Means原理解析 2. K-Means的优化 3. sklearn的K-Means的使用 4. K-Means和K-Means++实现 1. 前言 前面3篇K-Means的博文从原理.优化 ...
- JDK1.8 重识HashMap
摘要 JDK1.8相较于1.7对HashMap做了很大的优化,比如加入了新数据结构红黑树.Hash算法的优化和扩容的优化. 本篇结合这些区别,探索HashMap的结构实现和功能原理. 存储结构-字段 ...
- Android——监听事件总结
各种监听事件 1.按钮 Button(1)点击监听 btn_1.setOnClickListener(new View.OnClickListener() { (2)长按监听 btn_1.setOnL ...
- 安装corel x8提示你已安装了另外一个版本
如果之前安装了其他版本,提示安装不进去,需卸载visual c++ 2015 redistributable(x64)即可(测试环境是安装了x6后,x8安装不了) windows install cl ...
- Spring Cloud / Spring Boot There was an unexpected error (type=Unauthorized, status=401). Full authentication is required to access this resource.
访问EndPoint时会出现没有权限 There was an unexpected error (type=Unauthorized, status=401). Full authenticat ...
- R语言:读取数据
主要学习如何把几种常用的数据格式导入到R中进行处理,并简单介绍如何把R中的数据保存为R数据格式和csv文件. 1.保存和加载R的数据(与R.data的交互:save()函数和load()函数)a &l ...
- CSS遮罩层的实现
偶然发现自己原来写了一个CSS遮罩层,虽然这个东西没什么技术含量,但如果本人离开公司后又遇见此类问题,那么可能又得花些时间来找资料了.所以决定还是把它记下来吧. 直接上代码吧. 第一步,html代码: ...
- QTcpSocket 发送和接收数据的几种方法
1.QTcpSocket 继承于QAbstractSocket继承于QIODevice 2.QTcpSocket 提供的几种接收和发送数据方法 write ( const char *, qint64 ...