Python妙用re.sub分析正则表达式匹配过程

声明：本文所使用方法为老猿自行研究并编码，相关代码版权为老猿所有，禁止转载文章，代码禁止用于商业用途！

在《第11.23节 Python 中re模块的搜索替换功能：sub及subn函数》介绍了re.sub函数，其中的替换内容可以是一个函数，利用该功能我们可以展示正则表达式匹配过程中匹配到的目标子串的匹配顺序、匹配文本的内容和匹配文本在搜索文本中的位置。具体实现如下：

import re

matchcount = 0

def parsematch(patstr,text):

    global matchcount

    matchcount = 0

    re.sub(patstr,matchrsult,text)

def matchrsult(m):

    global matchcount

    matchcount += 1

    print(f"第{matchcount}次匹配，匹配情况:")

    if(m.lastindex):

        for i in range(0,m.lastindex+1):print(f"    匹配子串group({i}): {m.group(i)},位置为：{m.span(i)}") #正则表达式为{m.re},搜索文本为{m.string},

    else:print(f"    匹配子串group(0): {m.group(0)},位置为：{m.span(0)}")

    return m.group(0)

调用举例：

>>> parsematch(r'(?i)(?P<lab>py\w*)','Python?PYTHON!Learning python with LaoYuan! ')

第1次匹配，匹配情况:

    匹配子串group(0): Python,位置为：(0, 6)

    匹配子串group(1): Python,位置为：(0, 6)

第2次匹配，匹配情况:

    匹配子串group(0): PYTHON,位置为：(7, 13)

    匹配子串group(1): PYTHON,位置为：(7, 13)

第3次匹配，匹配情况:

    匹配子串group(0): python,位置为：(23, 29)

    匹配子串group(1): python,位置为：(23, 29)

>>>

>>> parsematch('(.?)*',"abc")

第1次匹配，匹配情况:

    匹配子串group(0): abc,位置为：(0, 3)

    匹配子串group(1): ,位置为：(3, 3)

第2次匹配，匹配情况:

    匹配子串group(0): ,位置为：(3, 3)

    匹配子串group(1): ,位置为：(3, 3)

>>>

>>> parsematch('(?P<l1>Lao)(?P<l2>\w+)(Python)','LaoYuanPython')

第1次匹配，匹配情况:

    匹配子串group(0): LaoYuanPython,位置为：(0, 13)

    匹配子串group(1): Lao,位置为：(0, 3)

    匹配子串group(2): Yuan,位置为：(3, 7)

    匹配子串group(3): Python,位置为：(7, 13)

>>>

不过上述分析过程仅用于多次搜索到目标串的时候才有作用，如果只是一次匹配到一个目标串，则无需使用该方法，因为使用匹配对象就很方便的查看匹配信息。

老猿Python，跟老猿学Python!

博客地址：https://blog.csdn.net/LaoYuanPython

请大家多多支持，点赞、评论和加关注！谢谢！

Python妙用re.sub分析正则表达式匹配过程的更多相关文章

python 正则表达式匹配过程
[No0000100]正则表达式匹配解析过程分析(正则表达式匹配原理)＆regexbuddy使用＆正则优化
常见正则表达式引擎引擎决定了正则表达式匹配方法及内部搜索过程,了解它至关重要的.目前主要流行引擎有:DFA,NFA两种引擎. 引擎区别点 DFA Deterministic finite autom ...
[转载]Python正则表达式匹配反斜杠'\'问题
转载自csdnblog:Python正则表达式匹配反斜杠'\'问题在学习Python正则式的过程中,有一个问题一直困扰我,如何去匹配一个反斜杠(即“\”)? 一.引入在学习了Python特殊字符和 ...
Python正则表达式书写容易碰到的陷阱：\W*和\W*？匹配过程遇到的问题
老猿在分析<Python正则表达式\W+和\W*匹配过程的深入分析>中的问题时,想到一个问题,如果"re.split('(\W*)','Hello,world')"的处 ...
Python: 正则表达式匹配反斜杠 "\"
Python正则表达式匹配反斜杠 "\" eg: >>>a='w\w\w' 'w\\w\\w' # 打印出来的 "\\" 被转义成一个反斜 ...
正则表达式匹配可以更快更简单 (but is slow in Java, Perl, PHP, Python, Ruby, ...)
source: https://swtch.com/~rsc/regexp/regexp1.html translated by trav, travmymail@gmail.com 引言下图是两种 ...
Python 使用正则表达式匹配IP信息
使用正则表达式匹配IP地址 .MAC地址 .网卡名称: #!/usr/bin/env python #-*- coding:utf-8 -*- import re from subprocess im ...
Python从文件中读取字符串，用正则表达式匹配中文字符的问题
2013-07-27 21:01:37| 在Windows下,用Python从.txt文件中读取字符串,并用正则表达式匹配中文,在网上看了方法,用的时候发现中文没有被匹配. ...
Python用正则表达式匹配汉字
Python用正则表达式匹配汉字匹配多个汉字,不包括空格 import re res = re.match(r'[\u4E00-\u9FA5]+', '我是汉字') print(res) # &l ...

随机推荐

RBAC设计前期设计
//s用户表 create table userinfo( id int(18) primaryk key auto_increment, username varchar(50) not null ...
python爬虫02通过 Fiddler 进行手机抓包
我们要用到一款强大免费的抓包工具 Fiddler你可以到 https://www.telerik.com/download/fiddler去下载一般情况下我们通过浏览器来请求服务器的时候是点对点 ...
layui下拉框实现级联
<!DOCTYPE html><html><head> <meta charset="utf-8" /> <link href ...
Torrent文件的解析与转换
Torrent简介 BitTorrent协议的种子文件(英语:Torrent file)可以保存一组文件的元数据.这种格式的文件被BitTorrent协议所定义.扩展名一般为".torren ...
pandas_知识总结_基础
# Pandas 知识点总结 # Pandas数据结构:Series 和 DataFrame import pandas as pd import numpy as np # 一,Series: # ...
线程队列分享ppt
JUC锁种类总结
在并发编程中有各种各样的锁,有的锁对象一个就身兼多种锁身份,所以初学者常常对这些锁造成混淆,所以这里来总结一下这些锁的特点和实现. 乐观锁.悲观锁悲观锁悲观锁是最常见的锁,我们常说的加锁指的也就是 ...
[LeetCode题解]24. 两两交换链表中的节点 | 递归
方法一:递归解题思路递归法,假设后续链表已经完成交换,此时只需要对前两个节点进行交换,然后再连接上后续已交换的链表即可. 代码 /** * Definition for singly-linked ...
python any，call，init，下划线知识汇总
python补充 any() [来自菜鸟教程] any() 函数用于判断给定的可迭代参数 iterable 是否全部为 False,则返回 False,如果有一个为 True,则返回 True. 元素 ...
UnitTest_墨振文档
目录一.框架介绍 1 二.四大组件 2 三.ddt数据驱动 3 一．框架介绍 unittest框架是python 自带的一个作为单元测试的测试框架,在最初叫pyUnit,相当与Java语言中的Jun ...

Python妙用re.sub分析正则表达式匹配过程

Python妙用re.sub分析正则表达式匹配过程的更多相关文章

随机推荐

热门专题