正则表达式 之 C#后台应用
正则表达式在.Net就是用字符串表示,这个字符串格式比较特殊,无论多么特殊,在C#语言看来都是普通的字符串,具体什么含义由Regex类内部进行语法分析。
Regex 类 存在于 System.Text.RegularExpressions 名称空间。
正则表达式可以进行字符串的匹配、字符串的提取、字符串的替换。
C#中分别对应正则表达式的三个重要方法。
1、 IsMatch() 返回值为bool类型:
格式:Regex.IsMatch("字符串", "正则表达式");
作用:判断字符串是否符合模板要求
例如:bool b =Regex.IsMatch("bbbbg","^b.*g$");判断字符串是否以b开头且以g结尾,中间可以有其他字符,若正确返回true,否则else。
2、 Match() 返回值为Match类型,只能匹配一个
Matches() 返回值为MatchCollection集合类型,匹配所有符合的
格式:Match match = Regex.Match("字符串", "正则表达式");
或MatchCollection matches= Regex. Matches ("字符串", "正则表达式");
作用:
①提取匹配的子字符串
②提取组。Groups的下标由1开始,0中存放match的value。
例如:
Match match = Regex.Match("age=30", @"^(.+)=(.+)$");
if (match.Success){
Console.WriteLine(match.Groups[] .Value);//输出匹配的子字符串
Console.WriteLine(match.Groups[] .Value);//获取第一个分组的内容
Console.WriteLine(match.Groups[] .Value);//获取第二个分组的内容
}
或
MatchCollection matches = Regex.Matches("2010年10月10日", @"\d+");
for (int i = ; i < matches.Count; i++)
{
Console.WriteLine(matches[i].Value);
}
3、 Replace() 返回值为string
//将所有的空格替换为单个空格
string str = " aa afds fds f ";
str = Regex.Replace(str, @"\s+", " ");
Console.WriteLine(str); string str = "hello“welcome to ”beautiful “China”";
//hello"welcome to "beautiful "China"
//$1表示引用第一组。$2表示用第二组。
string strresult = Regex.Replace(str, "“(.+?)”", "\"$1\"");
Console.WriteLine(strresult);
常用情况:
1、贪婪模式与终结贪婪模式
string str = "1。 11。 111。 111。 ";
//".+"表示匹配任意多个任意字符,会得到整个字符串
//又因为需要匹配"。 ",所以得到结果为"1。 11。 111。 111。 "
//贪婪模式
Match matchA = Regex.Match(str, "^.+。 $"); //"?"表示终极贪婪模式,匹配时会只取一个字符
//又因为需要匹配"。 ",所以得到结果为"1。 "
Match matchB = Regex.Match(str, "^.+?。 $");
如果发现结果与想象有差别,查看是否是贪婪模式造成的。
2、实际应用采集器(从某个网页上采集邮箱、图片或其他信息)、敏感词过滤、UBB翻译器。
[1]采集器
采集邮箱:
string url = "http://www.example.com";
//通过WebClient下载网页的源码
System.Net.WebClient client = new System.Net.WebClient();
client.Encoding = System.Text.Encoding.UTF8;
string strHtml = client.DownloadString(url);
//匹配邮箱
MatchCollection collection = Regex.Matches(strHtml, @"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");
for (int i = ; i < collection.Count; i++)
{
Console.WriteLine(collection[i].Value);
}
保存图片:
string url = "https://www.example.com/";
//通过WebClient下载网页的源码
System.Net.WebClient client = new System.Net.WebClient();
client.Encoding = System.Text.Encoding.UTF8;
string strHtml = client.DownloadString(url);
//假设需要匹配的字符串格式都为:<img alt="" src="img/example.jpeg" />
//\s是为了针对写完<img回车的情况:<img\n alt="" src="img/example.jpeg" />
MatchCollection collection = Regex.Matches(strHtml, "<img\\s*.*src=\"(.+?)\".*/>");
for (int i = ; i < collection.Count; i++)
{
string img = collection[i].Groups[].Value.Replace("\"",string.Empty);
client.DownloadFile(img, @"D:\Images\"+ Path.GetFileName(img));
Console.WriteLine(collection[i].Value);
}
网址处理:
//把"http://www.example.com/"替换为
//<a href="http://www.example.com/">http://www.example.com/</a>
string url = "http://www.example.com/";
url = Regex.Replace(url, @"(http://[a-zA-Z0-9_\-\?=\.&]+)", "<a href=\"$1\">$1</a>");
[2]敏感词过滤:

[3]UBB翻译:

正则表达式 之 C#后台应用的更多相关文章
- c#正则获取html里面a标签href的值
获取单个a中href的值: string str = "<a href=\"http://www.itsve.com\">下载</a>" ...
- cms系统视频分享
cms_001-CMS系统功能需求简介-1.avicms_002-如何采用用例分析方法来理解需求-1.avicms_003-后台管理系统用例-1.avicms_004-实现验证码的初步思路-1.avi ...
- opencart 3.0 版本数据库数据表字典(详细篇)
1.下文是opencart3.0版本数据库数据表字典,表字段与功能的介绍都比较详细. 数据表 address :地址表,会员在结账时储存的账单地址或者配送地址(这个与区域配送方 ...
- ASP.NET开发中主要的字符验证方法-JS验证、正则表达式、验证控件、后台验证
ASP.NET开发中主要的字符验证方法-JS验证.正则表达式.验证控件.后台验证 2012年03月19日 星期一 下午 8:53 在ASP.NET开发中主要的验证方法收藏 <1>使用JS验 ...
- 关于通用的C#后台获取前台页面的标签的正则表达式
Regex reg = new Regex("<div[^>]*?class=\"类属性名称\"[^>]*>(.*?) </div> ...
- cshtml中正则表达式使用后台代码
//定义变量 bool a = false; //正则表达式 string b = @" ^ (13[0 - 9] | 14[5 | 7] | 15[0 | 1 | 2 | 3 | 5 | ...
- 常用的正则表达式@java后台
package Regex; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * @作者 Goofy * @邮件 ...
- C#后台利用正则表达式查找匹配字符
/// <summary> /// 发送短信 系统固化短信 /// </summary> /// <param name=&qu ...
- asp.net后台正则表达式验证手机号码邮箱
//如果文本中可以为空的为NO,文本中内容不为空 if (input.nullable == "no" || !isnull(input.value)) { //文本中值的类型 s ...
随机推荐
- Spring AOP--返回通知,异常通知和环绕通知
在上篇文章中学习了Spring AOP,并学习了前置通知和后置通知.地址为:http://www.cnblogs.com/dreamfree/p/4095858.html 在本文中,将继续上篇的学习, ...
- POJ 2378-Tree Cutting(树形dp)
题意: n个节点的树,删除一个点,得到的最大联通分支大小不大于总节点数的一半,求这样点的集合 分析:和上题一样 #include <map> #include <set> #i ...
- HDU 1024 Max Sum Plus Plus 简单DP
这题的意思就是取m个连续的区间,使它们的和最大,下面就是建立状态转移方程 dp[i][j]表示已经有 i 个区间,最后一个区间的末尾是a[j] 那么dp[i][j]=max(dp[i][j-1]+a[ ...
- Robotium 系列(2) - 简单介绍Monkey和MonkeyRunner
除了Robotium,Android还有其他的自动化测试方法,比如Monkey和MonkeyRunner. 这里就做一个简单的介绍和使用方法. 本文提纲: 1. Android SDK以及SDK中的工 ...
- Zabbix探索:网络设备监控1
近期需要大量添加网络设备,为了避免以后在节点100上出现问题,所以特地申请了一台虚拟机,用作代理110. 虽然Zabbix模板中的英文很简单,但是为了同事着想,还是将大部分内容汉化了,避免今后说理解不 ...
- 怎么限制Google自动调整字体大小
Google默认的字体大小是12px,当样式表中font-size<12px时,或者没有明确指定字体大小,则在chrome浏览器里字体显示是12px. 最近在写代码玩的时候,我也碰到了 在FF和 ...
- uva 2218 Triathlon
题意:铁人三项赛,给定每个选手游泳,自行车,赛跑三个阶段的平均速度,不知道每段比赛的路程,询问当前这个选手能否胜利. 思路:把题意转化为一个不等式,设比赛长度是1,如果i要战胜j,x.y分别是第一阶段 ...
- 自定义实现MPVolumeView音量控件
http://blog.csdn.net/theonezh/article/details/8158420 http://www.cnblogs.com/cate/ios/ http://www.cn ...
- 类型检测汇总!typeof 和 instanceof 和isArray
, ]; alert(arr instanceof Array);//true 以上老方法判断是否是数组,存在一个问题,就是它只适用于单执行环境(窗口),如果该窗口有其他框架(比如 iframe)则会 ...
- Android 命名规范和编码规范
简明概要 多写注释 一.关于命名规范 对于开发项目来说肯定是要有统一的规范,然而命名规范需要做到哪几点呢? 答: 首先,不能反人类. 再来就是,要望文而知其意. 下面就来说说具体该怎么去规范我们的代 ...