Python正则表达式使用

参考资料:

Python正则表达式| 菜鸟教程

Python正则表达式详解 - 我当道士那儿些年 - 博客园

前言

由于遇到一个提取字符串某个子串的问题,刚开始使用了暴力方法求解,后面在舍友大佬帮助下,使用了正则表达式来提取,质量明显高了一档。详细的方法,以及详细的参数教程里都已叙述的非常详尽,这里主要介绍一下遇到问题以及解决问题的方案。

问题描述

'''Obtaining JSON from switch...
Done
Control utility for runtime P4 table manipulation
RuntimeCmd: dmac [implementation=None, mk=ethernet.dstAddr(exact, 48)]
mcast_src_pruning [implementation=None, mk=standard_metadata.instance_type(exact, 32)]
smac [implementation=None, mk=ethernet.srcAddr(exact, 48)]
sad [implementation=None, mk=ethernet.srcAddr(exact, 48)]
RuntimeCmd: '''

从上述字符串中提取出,dmacmcast_src_pruningsmacsad

问题解决

可以观察到需提取的字符串都有一个特点,都是介于RuntimeCmd,且后面都有跟着一个[xxx],所以我们也从这里入手。

下面给出具体代码以及具体的正则解释

import re

str = '''Obtaining JSON from switch...
Done
Control utility for runtime P4 table manipulation
RuntimeCmd: dmac [implementation=None, mk=ethernet.dstAddr(exact, 48)]
mcast_src_pruning [implementation=None, mk=standard_metadata.instance_type(exact, 32)]
smac [implementation=None, mk=ethernet.srcAddr(exact, 48)]
sad [implementation=None, mk=ethernet.srcAddr(exact, 48)]
RuntimeCmd: ''' # flag = 0
# table_name = []
# name = ''
# for i in str:
# if i == 'R':
# flag = 1
# print flag
# elif i == ' ' and flag == 1:
# flag = 2
# print flag
# elif flag == 2 and i != ' ':
# name = name + i
# print flag
# elif flag == 2 and i == ' ':
# table_name.append(name)
# name = ''
# flag = 3
# print flag
# elif flag == 3 and i == '\n':
# flag = 2
# print i
# print table_name matchObj = re.findall('(\S+)(?=[\s]*\[.*\])', str, re.M | re.I) print matchObj

上面注释掉的代码为暴力解法,下列则为正则表达式求解,具体函数功能可查找参考文献,这里介绍正则表达式,即(\S+)(?=[\s]*\[.*\])这个串。

第一个()内部的数据则是所需提取的数据,\S表示非空字符,+表示非空字符至少出现一次,(?=)表示前向肯定界定符,表示之后所连着的语句是什么,\s表示空字符,[\s]*表示非空字符出现大于等于0次,由于[是特殊字符,所以需要加\进行转义,.表示任意字符,.+则表示任意语句,\]则与前面的[一样,需要进行转义。通过此正则表达式,则可成功提取出我们所需的数据。

['dmac','mcast_src_pruning','smac','sad']

为一个list对象,成功提取。

Python正则表达式使用的更多相关文章

  1. Python 正则表达式入门(中级篇)

    Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...

  2. Python正则表达式中的re.S

    title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...

  3. Python 正则表达式入门(初级篇)

    Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...

  4. python正则表达式re

    Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...

  5. Python正则表达式详解

    我用双手成就你的梦想 python正则表达式 ^ 匹配开始 $ 匹配行尾 . 匹配出换行符以外的任何单个字符,使用-m选项允许其匹配换行符也是如此 [...] 匹配括号内任何当个字符(也有或的意思) ...

  6. 比较详细Python正则表达式操作指南(re使用)

    比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...

  7. Python正则表达式学习摘要及资料

    摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...

  8. python正则表达式 小例几则

    会用到的语法 正则字符 释义 举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...

  9. Python 正则表达式-OK

    Python正则表达式入门 一. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...

  10. Python天天美味(15) - Python正则表达式操作指南(re使用)(转)

    http://www.cnblogs.com/coderzh/archive/2008/05/06/1185755.html 简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格 ...

随机推荐

  1. Vue2.0中v-for迭代语法变化(key、index)【转】

    转自:http://blog.csdn.net/sinat_35512245/article/details/53966788 Vue2.0的代码中发现 $key这个值并不能渲染成功,问题如下:但是v ...

  2. BZOJ 1113 海报 单调栈

    题目链接: https://www.lydsy.com/JudgeOnline/problem.php?id=1113 题目大意: N个矩形,排成一排. 现在希望用尽量少的矩形海报Cover住它们. ...

  3. python第四十五课——继承性之多重继承

    演示多重继承的结构和使用 子类:Dog 直接父类:Animal 间接父类:Creature #生物类 class Creature: def __init__(self,age): print('我是 ...

  4. python第三十九课——面向对象(二)之初始化属性

    设计Car类,初始化属性speed,提供一个run函数 import time class Car: def __init__(self,speed): self.speed=speed #将Road ...

  5. MetaMask/provider-engine-1

    https://github.com/MetaMask/provider-engine 在学习这个之前应该先看一下什么是zero-client,MetaMask/zero-client Web3 Pr ...

  6. Python2.7-内置异常类型

    python内置了许多异常类型,他们的继承关系如下:-----------------------------------------------BaseException +-- SystemExi ...

  7. aips初步设想

    2018年5月10日星期四 目标:设计一个高并发,高性能,可扩展的现代化综合大前置机. 具备以下功能: 协议支持:http.socket.mq 报文支持:xml.json.8583 Tps:500笔/ ...

  8. C++之语言概述

    C++语言是广泛使用的程序设计语言之一,因其特有的优势在计算机应用领域占有重要一席. C语言的发展 20世纪70年代初,贝尔实验室的Dennis Richie 等人在B语言基础上开发出C语言,最初是作 ...

  9. Altium 拼板方法以及 注意的 地方

    1.修改软件设置, 即工具→优先选项→覆铜重建 对号去掉,如下,否则 拼板复制 覆铜 会变形导致拼板错误!!! 2.拼板方法,Ctrl+A全部复制(不要漏掉),选择特殊粘贴的方式,快捷键 E→A  去 ...

  10. excel中散点图和折线图的区别(散点图时间均匀分布)

    折线图可以显示随单位(如:单位时间)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.散点图显示若干数据系列中各数值之间的关系,或者将两组数绘制为 xy 坐标的一个系列.-------- ...