CAtlRegExp Class

 

CAtlRegExp 类用于表示并处理正则表达式。模板类,定义如下:

 
 
template <
class CharTraits = CAtlRECharTraits
>
class CAtlRegExp

参数

CharTraits

字符特征对象.例如, 默认的 CAtlRECharTraitsA.

调用 Parse 方法设置正则表达式

 
CAtlRegExp<> re;
re.Parse( "{[0-9]?[0-9]}:{[0-9][0-9]}" ); // Time in h:mm or hh:mm format

Parse 将正则表达式转换为 CAtlRegExp 内部的模式匹配自动机.

调用 Match 方法实现对字符串的匹配

 
 
re.Match( "1:57", &mc );  // Returns TRUE: successful match
re.Match( "01/03", &mc ); // Returns FALSE: no match

Match 方法的参数是需要匹配的字符串以及一个 CAtlREMatchContext 对象。如上所述的正则表达式,有两组对比通过大括号分隔,如果正则表达式和输入字符串匹配,CAtlREMatchContext 对象可以用来从输入字符串中提取实际匹配组的字符串(在该例中,是小时和分钟)。详细信息可参考 CAtlReMatchContext.

Match 方法有第三个可选的参数。如果使用第三个可选的参数, Match 会设置其指向字符串中匹配的最后一个字符的下一个位置。这使得你可以继续比对剩余的字符串。

正则表达式语法:

CAtlRegExp 下使用的正则表达式语法

 
元字符 含义

.

匹配任意的单个字符.

[ ]

表示一个字符类.匹配方括号下的任意一个字符。 (例如, [abc] 匹配 "a", "b", 和 "c").

^

如果该元字符在一个字符类的开始处使用,它表示对字符类取反。一个取反的字符类匹配除该字符类里的任意字符。 (例如, [^abc] 匹配除了 "a", "b", 和 "c"以外的字符).

如果 ^ 处在正则表达式的开始处, 它将匹配输入的开始字符串部分。(例如, ^[abc] 只匹配以"a", "b", 或 "c"开始的字符串).

-

在字符类内部,表示字符的方位。 (例如, [0-9] 匹配从"0" 到 "9"的任意数字).

?

表示在前面的表达式是可选的: 它将匹配1次或0次 (例如, [0-9][0-9]? 匹配"2" 和 "12").

+

表示前面的表达式匹配一到多次。 (例如, [0-9]+   匹配 "1", "13", "456",等).

*

表示前面的表达式匹配0 到 多次.

??, +?, *?

? , + 和 * 的非穷尽(Non-greedy)版。和? , + , *  不同,非穷尽版进行尽可能少的匹配。

(例如, 假设有输入  "<abc><def>",   <.*?>    匹配 "<abc>"      但是  <.*>   匹配 "<abc><def>").

( )

组操作. 例如: (\d+,)*\d+  匹配一组被逗号分隔的数字(例如, "1" or "1,23,456").

{ }

表示一个匹配组. 对于输入字符串,匹配大括号里的正则表达式的实际文本可以通过 CAtlREMatchContext 对象检索.

\

转义字符: 对下一个字符进行字面翻译。(例如, [0-9]+ 匹配一个活多个数字,  但是[0-9]\+匹配一个数字后加一个"+"字符).

也可用于缩写(例如 \a 表示任意字母数字; 参见下表).

如果 \ 后面紧跟一个数字 n,它将匹配第n个匹配组(从0开始). 例如: <{.*?}>.*?</\0>   匹配 "<head>Contents</head>".

注意, 在C++的字符串中, 必须使用双斜杠: "\\+""\\a""<{.*?}>.*?</\\0>".

$

在正则表达式的尾部,该字符匹配输入字符串的尾部。 (例如,[0-9]$ 匹配以数字结尾的输入).

|

交替操作符: 分隔两个表达式, 表示两个匹配其中一个 (例如, T|the 匹配 "The" or "the").

!

取反操作符: the expression following ! does not match the input(for example, a!b matches "a" not followed by "b").

缩写词

CAtlRegExp 可以处理缩写词, 例如使用 \d 替换[0-9]. 缩写词由传递给CharTraits 的参数提供. 预定义的字符特性提供如下所示的缩写。

 
Abbreviation Matches

\a

任意字母数字: ([a-zA-Z0-9])

\b

空格 (空): ([ \\t])

\c

任意字母: ([a-zA-Z])

\d

任意十进制数字: ([0-9])

\h

任意十六进制数字: ([0-9a-fA-F])

\n

换行: (\r|(\r?\n))

\q

带引号的字符串: (\"[^\"]*\")|(\'[^\']*\')

\w

一个简单的单词: ([a-zA-Z]+)

\z

一个整数: ([0-9]+)

Example


 
下述例子使用正则表达式提取URL部分
 
 
// catlregexp_class.cpp
#include <afx.h>
#include <atlrx.h> int main(int argc, char* argv[])
{
CAtlRegExp<> reUrl;
// Five match groups: scheme, authority, path, query, fragment
REParseError status = reUrl.Parse(
"({[^:/?#]+}:)?(//{[^/?#]*})?{[^?#]*}(?{[^#]*})?(#{.*})?" ); if (REPARSE_ERROR_OK != status)
{
// Unexpected error.
return 0;
} CAtlREMatchContext<> mcUrl;
if (!reUrl.Match(
"http://search.microsoft.com/us/Search.asp?qu=atl&boolean=ALL#results",
&mcUrl))
{
// Unexpected error.
return 0;
} for (UINT nGroupIndex = 0; nGroupIndex < mcUrl.m_uNumGroups;
++nGroupIndex)
{
const CAtlREMatchContext<>::RECHAR* szStart = 0;
const CAtlREMatchContext<>::RECHAR* szEnd = 0;
mcUrl.GetMatch(nGroupIndex, &szStart, &szEnd); ptrdiff_t nLength = szEnd - szStart;
printf_s("%d: \"%.*s\"\n", nGroupIndex, nLength, szStart);
} return 0;
}

Output

0: "http"
1: "search.microsoft.com"
2: "/us/Search.asp"
3: "qu=atl&boolean=ALL"
4: "results"
 
需要头文件 兼容性

CAtlRegExp

<atlrx.h>

Windows 95, Windows 98, Windows 98 Second Edition, Windows Millennium Edition, Windows NT 4.0, Windows 2000, Windows XP Home Edition, Windows XP Professional, Windows Server 2003, Windows Server 2003

 
 
参考:
 
注: 英文很烂,翻译不好,如有错误,欢迎提醒!

【转】CAtlRegExp class .的更多相关文章

  1. 使用CAtlRegExp类进行密码校验

    前言 最近做了一个小需求,新建用户时输入的密码必须包含数字.小写字母.大写字符以及特殊字符,目的是为了增强密码的强度,如果没有其中一项,就需要弹出窗口进行提示. 正则表达式          对于此类 ...

  2. VC中使用ATL库实现正则表达式匹配(ADODB::Error)

    1. 确保项目属性中ATL使用处于打开状态. 如VS中项目属性常规—ATL使用—静态链接到ATL 2. 在使用时加上头文件 #include "atlrx.h" 3. 使用示例代码 ...

  3. 基于公网smtp协议实现邮件服务器

    刚开始做邮件服务器开发,一切都是茫然的.在书上网上都很难找到一套完整的邮件服务器开发教程.在个人的摸索中碰到了很多蛋疼得问题.现终于完成了,将我的开发经验分享给大家. 开发环境:vs2012 mfc ...

随机推荐

  1. POJ2503(Babelfish)--简单字典树

    思路:就是用一个字典树翻译单词的问题,我们用题目中给出的看不懂的那些单词建树,这样到每个单词的叶子结点中存放原来对应的单词就好. 这样查询到某个单词时输出叶子结点存的就行,查不到就"en&q ...

  2. [Vuex系列] - Actions的理解之我见

    Actions如何定义的 恕小端不才,对Action的总结如下: Action 可以提交mutation方法,通过mutation来改变state Action 函数可以接收一个context对象,通 ...

  3. EF方式增加数据

             单条记录添加 第一种方式: public void AddRegion() { using(Northwind db = new Northwind()) { Region regi ...

  4. HTML块级元素与行内元素的区别

    块级元素:块级大多为结构性标记 <address>...</adderss> <center>...</center> 地址文字 <h1>. ...

  5. PAT Basic 1078 字符串压缩与解压 (20 分)

    文本压缩有很多种方法,这里我们只考虑最简单的一种:把由相同字符组成的一个连续的片段用这个字符和片段中含有这个字符的个数来表示.例如 ccccc 就用 5c 来表示.如果字符没有重复,就原样输出.例如  ...

  6. CodeForces 768E SG函数 整数划分 Game of Stones

    一个标准的NIM游戏 加上一条规则:每堆石子对于每个数目的石子只能被取一次 可以SG打表 dp[i][j]表示现在有i个石子 j是可以取的石子数的状压 第i位为1就表示i个石子没被取过 #includ ...

  7. 【python】获取目录下的最新文件夹/文件

    直接上代码 def new_report(test_report): lists = os.listdir(test_report) #列出目录的下所有文件和文件夹保存到lists print(lis ...

  8. Nginx 配置参数中文说明

    Nginx配置参数中文详细说明: #定义Nginx运行的用户和用户组 user www www; # #nginx进程数,建议设置为等于CPU总核心数. worker_processes ; # #全 ...

  9. 6、组件注册-@Lazy-bean懒加载

    6.组件注册-@Lazy-bean懒加载 懒加载:单实例bean,默认是在容器启动的时候创建对象:懒加载就是启动的是不创建,在第一次使用的时候再创建对象. @Lazy // 单实例下懒加载bean

  10. myEclipse设置

    字符集设置 点击菜单:window——preferences 输入:Workspace 字体大小设置 输入:colors and fonts 本机字体:14 显示行号 输入:Text Editors ...