[02]APUE:POSIX 正则库(#include <regex.h>)
正则匹配流程:
- 声明一个 regex_t 类型的变量(结构体)
- regcomp 函数会将“正则匹配条件”写入此结构体,并编译成特定的二进制格式(加快匹配速度)
- 声明一个 regmatch_t 类型的变量数组(结构体数组)
- 调用 regexec 函数将匹配结果写入此结构体数组
- 从此结构体数组中取出匹配结果
- 以上两个函数若出错返回非 0 值,则调用 regerror 函数显示错误内存
- 最后调用 regfree 函数释放 regex_t 类型变量的资源
#include <sys/types.h>
#include <regex.h> int regcomp(regex_t *preg, const char *regex, int cflags);
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);
void regfree(regex_t *preg);
- regcomp 函数
- regex 参数是预定义的正则表达式字符串
- cflags 用于指定编译特性,可用参数如下
- REG_EXTENDED:启用扩展正则表达式规则,默认是基本正则表达式规则
- REG_ICASE:忽略大小写
- REG_NOSUB:仅检查是否存在匹配项,不返回结果
- REG_NEWLINE:换行符以常规语义对待,默认换行符不具有特殊含义,跟普通字符一样参与匹配
- regexec 函数
- 此处的 string 参数指将要对其进行匹配的目标字符串
- pmatch[] 参数用于存储匹配到的结果(若 REG_NOSUB 编译选项被设置,则此参数将被忽略)
- 此类型的结构体至少包含两个 regoff_t(某种整型数据,至少大于 off_t 或 size_t 的取值范围) 类型的成员:rm_so(即 regex match start offset)、rm_eo(即 regex match end offset),每个匹配到的结果都以其在目标字符串中的起始偏移位置标识
typedef struct {
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;- 未被填入匹配结果的项(即没有用到的结构体),其内部成员均被赋值为 -1,处理结果的时候可以以此为判断依据
- pmatch[] 的成员数量不能小于 nmatch 指定的数值,其中 pmatch[0] 存储的是目标字符串的地址(即 string 参数所代表的地址),从 pmatch[1] 开始的数组成员存储的是匹配结果的边界偏移量,因此 nmatch 应当指定为 N + 1,其中 N 是预期想要取得的匹配项数量
- eflags 用于定制匹配特性,可用参数如下
- REG_NOTBOL:即 not begin of line,在不启用 REG_NEWLINE 编译参数的前提下,以 ^ 匹配行首的将总是返回无匹配结果
- REG_NOTEOL:即 not end of line,语义同上,即不指定 REG_NEWLINE 情况下,永远匹配不到 $ 行尾
- regerror 函数
- errcode:指 regcomp 或 regexec 函数的返回值
- preg:指经过 regcomp 处理过正则匹配条件
- errbuf 及 errbuf_size:分别指自定义的用于存储错误信息的缓冲区及其大小
示例:
...
[02]APUE:POSIX 正则库(#include <regex.h>)的更多相关文章
- 使用POSIX正则库匹配一行中多个结果
正则匹配与正则表达式是什么东西我就不说了,在这里说下POSIX这个c语言正则库在对字符串进行正则匹配时取出多个结果的问题. 首先简单说明下POSIX正则库的几个函数和使用方法 第一个函数:int re ...
- posix 正则库程序
使用的是posix 正则库,参考: http://see.xidian.edu.cn/cpp/html/1428.html 执行匹配的时: gcc myreg.c ip.pat 内容: ip.*[0- ...
- C正则库做DNS域名验证时的性能对比
C正则库做DNS域名验证时的性能对比 本文对C的正则库regex和pcre在做域名验证的场景下做评测. 验证DNS域名的正则表达式为: "^[0-9a-zA-Z_-]+(\\.[0-9a ...
- #include<unistd.h>存在linux中,含有系统服务的函数
#include<unistd.h> linux标准库#include <unistd.h>与windows的#include <windows.h>(C语言开发) ...
- 在查找预编译头时遇到意外的文件结尾。是否忘记了向源中添加“#include "StdAfx.h"”?
在查找预编译头时遇到意外的文件结尾.是否忘记了向源中添加“#include "StdAfx.h"”? 右键选择该文件.cpp格式的->属性->预编译头,→ 不使用预编译 ...
- 用 #include “filename.h” 格式来引用非标准库的头文件
用 #include “filename.h” 格式来引用非标准库的头文件(编译器将 从用户的工作目录开始搜索) #include <iostream> /* run this progr ...
- 用 #include <filename.h> 格式来引用标准库的头文件
用 #include <filename.h> 格式来引用标准库的头文件(编译器将从 标准库目录开始搜索). #include <iostream> /* run this p ...
- vs2013载入zlib库,即include "zlib.h"
转自wo13142yanyouxin原文vs2013载入zlib库,即include "zlib.h" 在程序中,我们经常要用到压缩,解压函数.以压缩函数compress为例进行说 ...
- C++ 引用#include<math.h> 找不到动态库
问题: 使用g++ 编译C++文件报错了,无法识别abs,可是我这文件中已经添加了#include<math.h>? 于是在指令中加入-lm g++ main.cpp AStar.cpp ...
随机推荐
- 上传漏洞科普[1]-文件上传表单是Web安全主要威胁
为了让最终用户将文件上传到您的网站,就像是给危及您的服务器的恶意用户打开了另一扇门.即便如此,在今天的现代互联网的Web应用程序,它是一种 常见的要求,因为它有助于提高您的业务效率.在Facebook ...
- (转)JMS简明学习教程
转:http://www.cnblogs.com/jjj250/archive/2012/08/08/2628552.html 基础篇 JMS是应用系统或组件之间相互通信的应用程序接口,利用它,我们可 ...
- install busybox时报error: storage size of ‘rlimit_fsize’ isn’t known struct rlimit rlimit_fsize
解决办法: 在busybox根目录下查找到文件:find -name libbb.h 在libbb.h.h中包含sys/resource.h 说明: 上述错误的原因是rlimit结构体未知,原因是相应 ...
- CSS:CSS 列表
ylbtech-CSS:CSS 列表 1.返回顶部 1. CSS 列表 CSS列表属性作用如下: 设置不同的列表项标记为有序列表 设置不同的列表项标记为无序列表 设置列表项标记为图像 列表 在HTML ...
- Java学习之classpath
要运行class文件,必须在class文件所在的目录下,那么是不是也可以通过设置系统变量来配置呢,当然有了classpath就来了 环境变量配置有两种 1.一劳永逸的 2.set 临时变量 我们用临时 ...
- POJ3356-AGTC-dp+字符串处理
Let x and y be two strings over some finite alphabet A. We would like to transform x into y allowing ...
- 【Java多线程系列三】实现线程同步的方法
两种实现线程同步的方法 方法 特性 synchronized 不需要显式的加锁,易实现 ReentrantLock 需要显式地加解锁,灵活性更好,性能更优秀,结合Condition可实现多种条件锁 ...
- 0 ‘+new Array(017)’ 输出? js+相当于Number()类型转换
网站搬迁,给你带来的不便敬请谅解! http://www.suanliutudousi.com/2017/10/20/new-array017-%E8%BE%93%E5%87%BA%EF%BC%9F- ...
- python调用tushare获取IPO新股上市列表数据
接口:new_share 描述:获取新股上市列表数据 限量:单次最大2000条,总量不限制 积分:用户需要至少120积分才可以调取,具体请参阅本文最下方积分获取办法 注:tushare包下载和初始化教 ...
- 在vue中获取不到canvas对象? 两种解决办法。
1. mounted 钩子函数 初次肯定获取到id 2. 如果canvas父级用到了v-if 请改成v-show ,vue Dom节点 重新渲染导致methods 方法获取不到对象.