.NET正则表达式基础入门(三)
括号
正则表达式中的括号能将多个字符或者表达式当做一组,即将他们看成一个整体。这样量词就可以修饰这一组表达式。阅读本章前,建议先下载我于CSDN上传的示例代码,下载无需分数,下载链接。
1.分组
假设我们要匹配偶数个数字,如何匹配?尝试"^\d{2}+$"来匹配。"\d{2}"匹配2个数字,"+"匹配至少一次,两者组合起来应该是偶数个数字。但是由下例可看出这个正则表达式并不合法。只能尝试修改这个正则表达式为"^(\d{2})+$"。将"\d{2}"看做一个分组,再来使用量词。
Regex.IsMatch("",@"^\d{2}+$");
//抛出异常:System.ArgumentException
//异常信息:正在分析“^\d{2}+$”- 嵌套限定符 +。
Regex.IsMatch("",@"^(\d{2})+$");//true
2.捕获分组
捕获分组十分有用,他可以捕获匹配正则表达式的子字符串。分组其实是带有捕获功能的,例如分组"(\d)"匹配呢数字"5",则可以通过匹配对象获得"5"这个值。现在有几个匹配日期格式的正则表达式"(\d{4}-\d{2}-\d{2})","(\d{4}-\d{2})-\d{2}","(\d{4})-(\d{2})-(\d{2})"和一个十分没有规律的输入字符串"2015-06-15-20-30-2014-02-28-01-015-2015-08-09-00"。我们要从中提取出一些日期,不同的正则表达式会让程序输出不同的结果,但是他们均会匹配出他们想要的三个日期。"2015-06-15","2014-02-28","2015-08-09"。
//一个用于输出匹配子字符串的辅助方法
public static void ShowAllMatch(Match match, bool isCapture)
{
int MatchCount = ;//匹配次数
while (true)
{
if (match.Success)
{
MatchCount++;
Console.WriteLine("第{0}个匹配的字符串为:{1}", MatchCount.ToString(), match.Value);
int GroupIndex = ;
/*
* 对于任意一个Match对象,其Gruops集合中至少有一个元素,下标为0。
* 若Match对象能成功匹配子字符串,则下标0的位置默认存储整个匹配的字符串。若不成功则为空。
* 若通过下标寻找不存在的项,则只返回空字符串,不会报错。
* 其余下标对应正则表达式中括号出现的位置。如第一个Gruops[1],对应匹配第一个括号的分组。
*/
foreach (Group group in match.Groups)
{
Console.WriteLine("分组下标:{0},分组的值为:{1}", GroupIndex.ToString(), group.Value);
/*
* 当在括号分组后加上量词时(如'(\d){m,n}'这种形式),可通过Capture类获得每一次捕获的字符串。
* 如,若匹配了字符串"2015",则Capture会分别捕获,"2","0","1","5",group.Value的值为"5"
* 此时,group.Value仅获取最后捕获的子字符串。
*/
if (isCapture)
{
int CaptureIndex = ;
foreach (Capture capture in group.Captures)
{
Console.WriteLine("分组下标:{0},第{1}个捕获的子字符串为:{2}", GroupIndex.ToString(), CaptureIndex.ToString(), capture.Value);
CaptureIndex++;
}
}
GroupIndex++;
}
match = match.NextMatch();//获取从该匹配位置结束之后的下一个匹配对象。
Console.WriteLine();
}
else
{
if (MatchCount == )
Console.WriteLine("没有匹配项!");
else
Console.WriteLine("匹配结束!");
break;
}
}
} /*Main方法中的调用*/ Console.WriteLine("---捕获分组示例1---");
string InputB = "2015-06-15-20-30-2014-02-28-01-015-2015-08-09-00";
string RegexStrB = @"(\d{4})-(\d{2})-\d{2}";//匹配一个日期,格式为YYYY-MM-DD。再通过分组获取匹配字符串中的年份和月份。
Regex RegexB = new Regex(RegexStrB);
Match MatchB = RegexB.Match(InputB);
ShowAllMatch(MatchB, false);
Console.WriteLine(); Console.WriteLine("---捕获分组示例2---");
string InputC = "2015-06-15-20-30-2014-02-28-01-015-2015-08-09-00";
string RegexStrC = @"(\d){4}-(\d){2}-\d{2}";//匹配一个日期,格式为YYYY-MM-DD。再通过分组获取匹配字符串中的年份和月份。
Regex RegexC = new Regex(RegexStrC);
Match MatchC = RegexC.Match(InputC);
ShowAllMatch(MatchC, true);
Console.WriteLine(); Console.WriteLine("---捕获分组示例3---");
string InputD = "2015-06-15-20-30-2014-02-28-01-015-2015-08-09-00";
/*
* 匹配一个日期,格式为YYYY-MM-DD。再通过分组获取匹配字符串中的年份和月份。
* 若括号之间有嵌套,则Group的下标先算外层括号,再算内层。
*/
string RegexStrD = @"((\d){4}-(\d){2})-(\d){2}";
Regex RegexD = new Regex(RegexStrD);
Match MatchD = RegexD.Match(InputD);
ShowAllMatch(MatchD, true);
Console.WriteLine();
以上代码由各位复制到自己的机器查看运行结果。以下代码给出直观的捕获匹配值的例子。
Regex regex = new Regex(@"(\d{4}-\d{2}-\d{2})");
Match match = regex.Match("2015-06-15-20-30-2014-02-28-01-015-2015-08-09-00");
while(true)
{
if (match.Success)
{
Console.WriteLine(match.Value);
match = match.NextMatch();//匹配下一个符合的子字符串
}
else
break;
} //一共输出3个结果。
//2015-06-15
//2014-02-28
//2015-08-09
Match类是匹配结果的对象。可通过Match.Success判断匹配是否成功,通过Match.Value来获得符合匹配的子字符串。
3.反向引用
如果我们要判断一个英文单词是否有相邻两个字母重复。例如"book","sleep"等。我们可以使用反向引用这个特性。其正则表达式语法"(regStr)\num",其中regStr为子正则表达式,num为需要引用的括号的位置。
Regex regex = new Regex(@"([a-z])\1");
regex.IsMatch("book");//true
regex.IsMatch("sleep");//true
regex.IsMatch("where");//false
由于\num容易引起不确定,因为有可能转换为对应的ascii码。所以.NET还可以以"(regStr)\k<num>"这样的语法确保反向引用。
Regex regex = new Regex(@"([a-z])\k<1>");
regex.IsMatch("book");//true
regex.IsMatch("sleep");//true
regex.IsMatch("where");//false
4.命名分组
当分组太多的时候,容易出现计算分组下标错误的情况。因此可以给分组命名,直接通过名字来获取分组的值。正则表达式语法"(?<name>regStr)",name的值由你自己决定。
Regex regex = new Regex(@"(?<Year>\d{4})-(?<Month>\d{2})-(?<Day>\d{2})");
Match match = regex.Match("2015-06-15");
Console.WriteLine(match.Groups["Day"].Value);//"15"
Console.WriteLine(match.Groups["Year"].Value);//"2015"
Console.WriteLine(match.Groups["Month"].Value);//"06"
//也可以使用下标查找,并不影响。
Console.WriteLine(match.Groups[].Value);//"2015-06-15"
Console.WriteLine(match.Groups[].Value);//"2015"
Console.WriteLine(match.Groups[].Value);//"06"
Console.WriteLine(match.Groups[].Value);//"15"
5.非捕获分组
由于捕获会造成性能的损耗,当我们仅想将多个正则表达式组成一组而不想捕获他的值时,可使用非捕获分组。正则表达式语法"(?:regStr)"。
Regex regex = new Regex(@"(?:\d{4})-(?:\d{2})-(?:\d{2})");
Match match = regex.Match("2015-06-15");
Console.WriteLine(match.Groups[].Value);//"2015-06-15"
Console.WriteLine(match.Groups[].Value);// "" 没有值,但是不会报错
Console.WriteLine(match.Groups[].Value);// "" 没有值,但是不会报错
Console.WriteLine(match.Groups[].Value);// "" 没有值,但是不会报错
6.贪婪匹配与懒惰匹配
对于一个输入字符串"123456789",如果用"(\d*)"来匹配,则整个字符串都将被捕获了。我们可以看出这个正则表达式十分贪婪,如果输入一个一百位的数字他也是会捕获回来的。如果我们要尽可能少的捕获子字符串呢?那么可以在量词后添加"?",懒惰匹配正则表达式语法"regStr{n,m}?"。
Regex regex = new Regex(@"\d{2,5}");
Match match = regex.Match("");
Console.WriteLine(match.Value);//"12345"
regex = new Regex(@"\d{2,5}?");
match = regex.Match("");
Console.WriteLine(match.Value);//"12"
match = match.NextMatch();
Console.WriteLine(match.Value);//"34"
分组括号暂时介绍这么多,谢谢!
.NET正则表达式基础入门(三)的更多相关文章
- .NET正则表达式基础入门
这是我第一次写的博客,个人觉得十分不容易.以前看别人写的博客文字十分流畅,到自己来写却发现十分困难,还是感谢那些为技术而奉献自己力量的人吧. 本教程编写之前,博主阅读了<正则指引>这本入门 ...
- Swift语法基础入门三(函数, 闭包)
Swift语法基础入门三(函数, 闭包) 函数: 函数是用来完成特定任务的独立的代码块.你给一个函数起一个合适的名字,用来标识函数做什么,并且当函数需要执行的时候,这个名字会被用于“调用”函数 格式: ...
- C#基础入门 三
C#基础入门 三 类 类使用class关键字进行声明,前面加一个访问修饰符,public class car{} 访问修饰符:修师傅可以用来修饰类和类成员等,控制它们的可见度 修饰符关键字分别为:pu ...
- .NET正则表达式基础入门(二)
量词 正则表达式的量词用于表明前面的子表达式需要匹配的次数.阅读本章前,建议先下载我于CSDN上传的示例代码,下载无需分数,下载链接. 1.量词的一般形式 "{n}"," ...
- PHP正则表达式基础入门
思维导图 介绍 正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如JavaScript.Java..Net.PHP 等,我今天就把我对正则表达式的理解跟大家唠唠,不当之 ...
- .NET正则表达式基础入门(四)
断言 判断某个位置左侧或者右侧是否符合匹配.常见断言有三种,单词边界.行起始/结束位置.环视.阅读本章前,建议先下载我于CSDN上传的示例代码,下载无需分数,下载链接. 1.单词边界 正则表达式&qu ...
- .NET正则表达式基础入门(一)
字符组 正则表达式的字符组十分简单,就是列出你所想要匹配的字符.阅读本章前,建议先下载我于CSDN上传的示例代码,下载无需分数,下载链接. 1.普通字符组 普通字符组,列出所有你需要匹配的字符. 例如 ...
- Oracle基础入门(三)
一:PLsql一些基本操作 调节plsql的字体大小 二:创建表,如果学过sql server的数据库就会发现其实Oracle跟的一些新建表和新增修改其实是差不多的 新建表 Create table ...
- C#学习笔记---基础入门(三)
泛型<T> 使用泛型能够最大限度的重用代码/保护类型安全,提高性能 泛型成员因为类型的不确定性,不能使用算术运算符/比较运算符 类型参数可以有多个,可以是编译器能够识别的任何类型 类型参数 ...
随机推荐
- 关于EF6的记录Sql语句 与 EntityFramework.Extend 的诟病
1.关于EF6的记录Sql语句,一个老生长谈的问题. 他生成的sql语句实在是烂,大家都这样说 2.EF6 更新删除不方便,没有批量操作.所以,有人出了EF6.Extend 大家用起来也很爽 基于以 ...
- iOS开发系列--Objective-C之协议、代码块、分类
概述 ObjC的语法主要基于smalltalk进行设计的,除了提供常规的面向对象特性外,还增加了很多其他特性,这一节将重点介绍ObjC中一些常用的语法特性.当然这些内容虽然和其他高级语言命名不一样,但 ...
- 如何在没有域的环境中搭建AlwaysOn(一)
对DBA而言,不需要域就可以搭建SQL Server AlwaysOn是Windows Server 2016中最令人兴奋的功能了,它不仅可以降低搭建的成本,而且还减少了部署和运维的工作量. 该特性可 ...
- [译]Asp.net MVC 之 Contorllers(一)
Asp.net MVC contorllers 在Ajax全面开花的时代,ASP.NET Web Forms 开始慢慢变得落后.有人说,Ajax已经给了Asp.net致命一击.Ajax使越来越多的控制 ...
- ASP.NET MVC 路由(四)
ASP.NET MVC路由(四) 前言 在前面的篇幅中我们讲解路由系统在MVC中的运行过程以及粗略的原理,想必看过前面篇幅的朋友应该对路由有个概念性的了解了,本篇来讲解区域,在读完本篇后不会肯定的让你 ...
- Aspose.Words 16.8 破解版、添加自定义HTML导出Jpeg压缩质量配置
0x01 Aspose.Words 介绍Aspose.Words是一个商业.NET类库,可以使得应用程序处理大量的文件任务.Aspose.Words支持Doc,Docx,RTF,HTML,OpenDo ...
- 《Entity Framework 6 Recipes》中文翻译系列 (36) ------ 第六章 继承与建模高级应用之TPC继承映射
翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 6-12 TPC继承映射建模 问题 你有两张或多张架构和数据类似的表,你想使用TP ...
- 【NodeJS 学习笔记04】新闻发布系统
前言 昨天,我们跟着这位大哥的博客(https://github.com/nswbmw/N-blog/wiki/_pages)进行了nodeJS初步的学习,最后也能将数据插入数据库了 但是一味的跟着别 ...
- iOS----- Crash 分析(文三)- 符号化崩溃日志
未符号化的崩溃日志就象一本天书,看不懂,更别谈分析崩溃原因了.所以我们在分析日志之前,要把日志翻译成我们可以看得懂的文字.这一步我们称之为符号化. 在iOS Crash分析(文一)中已经提到过符号化的 ...
- WPF入门教程系列十七——WPF中的数据绑定(三)
四. XML数据绑定 这次我们来学习新的绑定知识,XML数据绑定.XmlDataProvider 用来绑定 XML 数据,该XML数据可以是嵌入.Xmal文件的 XmlDataProvider 标记中 ...