今天被@SVCHAO  勾起兴趣来了。。 有把正则表达式兴趣捡起来了,试了下notepad++基本上语法倒是没有忘记,不过如果是用在嵌入式的方案的话,似乎还是有点费劲的。

先mark一个基础语法。

单个字符匹配

采用方括号描述,例如[0135678]表示0 1 3 5 6 7 8 都可以通过该次匹配

采用方括号排除,例如[^azAZ]表示除了a z A 和Z 全部可以通过该字节匹配

允许使用-表示范围,例如[0-9a-zA-Z]表示所有数字跟字母

常用单个字符存在通用表达方式,例如\w 表示[0-9a-zA-Z] 剩下的慢慢补充

采用{}表示匹配次数描述,例如\w{2}表示连续两个字符都是数字或者字母

采用()捕获比较结果…

以上内容自行科普。

为了适应使用场景为嵌入式 找到了这个demo

slre(Github Super Light Regular Expression library)

但是我好像不支持{},而且没找到贪婪相关的… 所以暂时搁置

后来说熟悉一下GNU里面的regex.h

发现跟python的regex接口很像 应该是posix的原因。

坑爹的虚拟机 很久没更新了,折腾了一会环境之后总算是测试出效果了。

#include <stdio.h>
#include <sys/types.h>
#include <regex.h> int main(int char_c,char** char_v)
{
char* p_str = " Url = www.google.com.hk ;";
char* p_reg = " {0,}(\\S+) {0,}= {0,}(\\S+) {0,};"; regex_t reg;
regmatch_t matchs[20];
memset(matchs,0,sizeof(matchs));
int r; r = regcomp(&reg, p_reg, REG_EXTENDED); r = regexec(&reg, p_str, 20, matchs, 0);
    return 0;
}

因为是自己测试用的代码,所以并没有特地去做输出、直接断点打下来看就知道结果了,

其中REG_EXTENDED一定要加,不然某些特性用不了,

还有一个奇怪的点就是,matchs[0]中会存放一个整个p_reg的匹配范围,所以如果是只需要提取我们定义中()的目标结果的话、

从p_reg[1]开始就好了。

顺手吐槽下C的字符串语法、调了好久… 结果是\跟\\的锅… 不过似乎也没什么更高效的方案。

下一步如果再用到的话,可能就是手动往SLRE里面添加贪婪的部分、或者找到GNU的regex.c进行裁剪了…

到时候再说

#include <stdio.h>
#include <sys/types.h>
#include <regex.h>
#include <string.h> int main(int char_c, char** char_v) {
char* p_str = " Url = www.google.com.hk ;";
char* p_reg = " {0,}(\\S+) {0,}= {0,}(\\S+) {0,};"; regex_t reg;
regmatch_t matchs[20];
int r, i; r = regcomp(&reg, p_reg, REG_EXTENDED);
if (r != 0) {
printf("err");
} r = regexec(&reg, p_str, 20, matchs, 0);
if (r != 0) {
printf("err");
} for (i = 0; i < 20; i++) {
int start_index = matchs[i].rm_so;
int end_index = matchs[i].rm_eo;
int len = end_index - start_index; if (start_index >= 0) {
char dis_buffer[256];
strncpy(dis_buffer, &p_str[start_index], len);
dis_buffer[len]='\0';
printf("catch:%s\n",dis_buffer);
}
} return 0;
}

鉴于我抓输出抓了很久… 我决定还是把数据捕获的代码贴出来…

使用环境为G++ with eclipse-cdt

debug用习惯了就没换IDE

catch:  Url        =  www.google.com.hk ;
catch:Url
catch:www.google.com.hk

测试输出结果是正确的…

REGEX.C GNU 提取过滤数据的更多相关文章

  1. 测试开发Python培训:抓取新浪微博评论提取目标数据-技术篇

    测试开发Python培训:抓取新浪微博评论提取目标数据-技术篇   在前面我分享了几个新浪微博的自动化脚本的实现,下面我们继续实现新的需求,功能需求如下: 1,登陆微博 2,抓取评论页内容3,用正则表 ...

  2. python操作MONGODB数据库,提取部分数据再存储

    目标:从一个数据库中提取几个集合中的部分数据,组合起来一共一万条.几个集合,不足一千条数据的集合就全部提取,够一千条的就用一万减去不足一千的,再除以大于一千的集合个数,得到的值即为所需提取文档的个数. ...

  3. [PY3]——过滤数据——列表推导、filter()、itertools.compress()

    问题 你有一个数据序列,想利用一些规则从中提取出需要的值或者是缩短序列 解决方案 最简单的过滤数据的方法,就是使用列表推导. 使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集 ...

  4. 5.MySQL必知必会之过滤数据-WHERE

    本章将讲授如何使用SELECT语句的WHERE子句指定搜索条件. 1.使用WHERE子句 数据库表一般包含大量的数据,很少需要检索表中所有行.通常只 会根据特定操作或报告的需要提取表数据的子集.只检索 ...

  5. asp.net过滤数据中有异常数据字符串

    /// <summary> /// 过滤数据 /// </summary> /// <param name="_str"></param& ...

  6. 转:SQL SERVER数据库中实现快速的数据提取和数据分页

    探讨如何在有着1000万条数据的MS SQL SERVER数据库中实现快速的数据提取和数据分页.以下代码说明了我们实例中数据库的“红头文件”一表的部分数据结构: CREATE TABLE [dbo]. ...

  7. 用php自带的filter函数验证、过滤数据 -转载

    PHP过滤器包含两种类型 Validation:用来验证验证项是否合法 Sanitization:用来格式化被验证的项目,因此它可能会修改验证项的值,将不合法的字符删除等. input_filters ...

  8. ADO.NET 快速入门(十):过滤数据

    我们有很多方法来过滤数据.一种是在数据库命令级别,利用 where 子句查询过滤数据.另一种是在数据填充到 DataSet 以后过滤数据.本篇讨论后者.   一旦数据填充到 DataSet,你可以使用 ...

  9. Android利用Filter过滤数据

    MainActivity如下: package cc.testfilterable; import java.util.ArrayList; import java.util.HashMap; imp ...

随机推荐

  1. iOS App 获取从后台返回前台时的页面

    产品美美的给小伙伴提了一个需求,当程序从后台进入前台时,如果是指定的页面,则弹出提示框. 大家首先想到的方法就是通过 AppDelegate.h 进行控制,相对复杂的步骤就是 在程序进入后台时对当前页 ...

  2. Android 中dp和px

    dp是虚拟像素,在不同的像素密度的设备上会自动适配,比如: 在320x480分辨率,像素密度为160,1dp=1px 在480x800分辨率,像素密度为240,1dp=1.5px 计算公式: 1dp* ...

  3. 探索javascript----浅析js模块化

    引言: 鸭子类型: 面向对象的编程思想里,有一个有趣的概念,叫鸭子类型:“一只鸟走起来像鸭子.游起泳来像鸭子.叫起来也像鸭子,那它就可以被当做鸭子.也就是说,它不关注对象的类型,而是关注对象具有的行为 ...

  4. Unity在PC上创建Excel文档

    NPOI下载连接:http://pan.baidu.com/s/1qWoITRI

  5. The next day to learn English

    if you smail when no  one else is around,you really meat it.

  6. Prototype之个人见解

    prototype js 的对象比较 由于 js 是解释执行的语言, 那么再代码中出现函数与对象如果重复执行, 会创建多个副本 在代码中重复执行的代码容易出现重复的对象 创建一个 Person 构造函 ...

  7. C#检测本地网络状态

    using System; using System.Runtime.InteropServices; public static class NetTool { [Flags] private en ...

  8. 爆破一个二元函数加密的cm

    系统 : Windows xp 程序 : cztria~1 程序下载地址 :http://pan.baidu.com/s/1slUwmVr 要求 : 爆破 使用工具 : OD 可在看雪论坛中查找关于此 ...

  9. 黑马----JAVA异常

    黑马程序员:Java培训.Android培训.iOS培训..Net培训 黑马程序员--JAVA异常 一.JAVA异常有三种语句块:try语句块.catch语句块.finally语句块. 1.try语句 ...

  10. Linux chroot 并使用之前系统设备节点

    /********************************************************************************* * Linux chroot 并使 ...