第11.18节 Python 中re模块的匹配对象

匹配对象是Python中re模块正则表达式匹配处理的返回结果，用于存放匹配的情况。老猿认为匹配对象更多的应该是与组匹配模式的功能对应的，只是没有使用组匹配模式的正则表达式整体作为组0。

为了说明下面的属性和方法，以如下命名组匹配模式串和搜索文本作为例子来介绍：

>>> pattern='<h1 class="name">(?P<name>.*)</h1><h1 class="age">(?P<age>[0-9]{1,3})</h1>'

>>> str='<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>'

>>> m=re.search(pattern,str)

匹配对象有如下重要属性：

re：该匹配对象对应的正则表达式。如：

>>> m.re

re.compile('<h1 class="name">(?P<name>.*)</h1><h1 class="age">(?P<age>[0-9]{1,3})</h1>')

string：该匹配对象对应的搜索字符串。如：

>>> m.string

'<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>'

lastgroup：最后一个匹配组的名字，如果没有匹配到或没有给组命名则为None。如：

>>> m.lastgroup

'age'

lastindex：最后一个匹配组的序号，关于组的序号请参考《第11.16节 Python正则元字符“（）”(小括号)与组（group）匹配模式》的介绍。如：

>>> m.lastindex

2

匹配对象有如下重要方法：

expand(template)：对template的模板字符串的反斜杠进行转义并且返回，数字引用(\1, \2)和命名组(\g<1>, \g) 替换为相应组的内容。

>>> m=re.search('(Lao)(\w+)(Python)','LaoYuanPython')

>>> m

<re.Match object; span=(0, 13), match='LaoYuanPython'>

>>> m.expand(r'\1\g<0>\2\n\r')

'LaoLaoYuanPythonYuan\n\r'

>>>

注意组0不能使用\0来访问，必须使用\g<0>进行访问。

2. start([group])、end([group])：表示匹配到的组对应字符串在搜索串中的起始位置和结束位置，其中group可以是组号或组名，可以不传，则默认为组0。如：

>>> m.start(1),m.end(1)

(17, 30)

group([group1, …])：显示对应组匹配的搜索到的结果子串，参数可以为空，则显示组0的匹配结果串即整个搜索串，也可以为多个组，组可以是组号或组名来表示。如：

>>> m.group(0,1,2)

('<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>', 'LaoYuanPython', '28')

>>> m.group(0,1,'age')

('<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>', 'LaoYuanPython', '28')

groups(default=None)：返回一个元组，包含所有参与匹配的子组（不含组0）。 default 参数用于未参与匹配的子组显示，默认为 None.

>>> m.groups()

('LaoYuanPython', '28')

关于未匹配子组的情况，Python官网的如下例子可以说明：

>>> m = re.match(r"(\d+)\.?(\d+)?", "24")

>>> m.groups()      # Second group defaults to None.

('24', None)

>>> m.groups('0')   # Now, the second group defaults to '0'.

('24', '0')

groupdict(default=None)：返回一个字典，包含了所有的命名子组（关于命名子组请参考《》的介绍）。key就是组名。 default 参数用于不参与匹配的组合；默认为 None。例如：

>>> m.groupdict()

{'name': 'LaoYuanPython', 'age': '28'}

span([group])：返回匹配对象对应组匹配到文本在搜索文本中的起始和终止位置的元组，其结果与(m.start(group), m.end(group))相同。注意如果参数group 没有在这个匹配中，就返回 (-1, -1) 。group 默认为0，就是整个匹配。

>>> m.span(1)

(17, 30)

案例：

>>> pattern='<h1 class="name">(?P<name>.*)</h1><h1 class="age">(?P<age>[0-9]{1,3})</h1>'

>>> str='<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>'

>>> m=re.search(pattern,str)

>>> m.start('name'),m.end('name')

(17, 30)

>>> m.start(1),m.end(1)

(17, 30)

>>> m.string

'<h1 class="name">LaoYuanPython</h1><h1 class="age">28</h1>'

>>> m.re

re.compile('<h1 class="name">(?P<name>.*)</h1><h1 class="age">(?P<age>[0-9]{1,3})</h1>')

>>> m.lastgroup

'age'

>>> m.lastindex

2

老猿Python，跟老猿学Python!

博客地址：https://blog.csdn.net/LaoYuanPython

请大家多多支持，点赞、评论和加关注！谢谢！

第11.18节 Python 中re模块的匹配对象的更多相关文章

第11.23节 Python 中re模块的搜索替换功能：sub及subn函数
一. 引言在<第11.3节 Python正则表达式搜索支持函数search.match.fullmatch.findall.finditer>重点介绍了几个搜索函数,除了搜索,re模块也 ...
第11.22节 Python 中re模块的字符串分割器：split函数
一. 引言在<第11.2节 Python 正则表达式支持函数概览>介绍了re模块的主要函数,在<第11.3节 Python正则表达式搜索支持函数search.match.fullm ...
第11.24节 Python 中re模块的其他函数
一. re.compile函数正则表达式编译函数,在后面章节专门介绍. 二. re.escape(pattern) re.escape是一个工具函数,用于对字符串pattern中所有可能被视为正则表 ...
第11.20节 Python 中正则表达式的扩展功能：后视断言、后视取反
一. 引言在<第11.19节 Python 中正则表达式的扩展功能:前视断言和前视取反>中老猿介绍了前视断言和前视取反,与二者对应的还有后视断言和后视取反. 二. (?<=-)后视 ...
第11.21节 Python 中正则表达式的其他扩展功能
一. 引言在<第11.17节 Python 正则表达式扩展功能:命名组功能及组的反向引用>中老猿介绍了组匹配模式的命名组功能及引用组功能,这两者都是正则表达式的扩展功能,其实在re模块中 ...
第11.19节 Python 中正则表达式的扩展功能：前视断言和前视取反
一. 引言在<第11.16节 Python正则元字符"()"(小括号)与组(group)匹配模式>中老猿介绍了组匹配模式的命名组功能及引用组功能,这两者都是组模式的扩 ...
第11.6节 Python正则表达式的字符串开头匹配模式及元字符“^”（插入符、脱字符）功能介绍
符号"^"为插入符,也称为脱字符,在Python中脱字符表示匹配字符串的开头,即字符串的开头满足匹配模式的要求.这个功能有点类似搜索函数match,只是这是通过搜索模式来指定,而m ...
第11.5节 Python正则表达式搜索任意字符匹配及元字符“.”（点）功能介绍
在re模块中,任意字符匹配使用"."(点)来表示, 在默认模式下,点匹配除了换行的任意字符.如果指定了搜索标记re.DOTALL ,它将匹配包括换行符的任意字符.关于搜索标记的含义 ...
第11.7节 Python正则表达式的字符串结尾匹配模式及元字符“$”功能介绍
符号"$"表示匹配字符串的结尾,即字符串的结尾满足匹配模式的要求. 在 MULTILINE 模式(搜索标记中包含re.MULTILINE,关于搜索标记的含义请见<第11.2节 ...

随机推荐

LDA与PCA
参考: https://www.cnblogs.com/pinard/p/6244265.html https://blog.csdn.net/qq_25680531/article/details/ ...
10before_request钩子函数
1,什么是钩子函数? 就是运行别人前都得先运行他: from flask import Flask app = Flask(__name__) @app.route('/') def hello_wo ...
c++实现扫雷游戏初学
设计思路全局变量定义地图和一些判断信息创建三个地图分别表示源地图显示的效果地图和一个用来判断点位是否被选中的地图功能: 玩家输入要翻开的格子的行数和列数.用一个函数来翻开目标格子,如 ...
vpp dpdk 安装使用笔记
编译安装: make install-dep make build 编译 vpp 查看 pci 网卡 id : lshw -class network -businfo DPDK hugepage ...
centos使用U盘做启动盘
软件下载地址: http://sourceforge.net/projects/iso2usb/files/latest/download?source=dlp 写于: 2014年08月04日更新于 ...
流量控制--5.Classless Queuing Disciplines (qdiscs)
Classless Queuing Disciplines (qdiscs) 本文涉及的队列规则(Qdisc)都可以作为接口上的主qdisc,或作为一个classful qdiscs的叶子类.这些是L ...
sqlilab less32-less37
less-32 过滤了单引号,双引号,斜杠,同时设置数据库为GBK编码,可以考虑宽字节注入, 当设置gbk编码后,遇到连续两个字节,都符合gbk取值范围,会自动解析为一个汉字.用脚本来测试下哪些符合 ...
精尽MyBatis源码分析 - SQL执行过程（二）之 StatementHandler
该系列文档是本人在学习 Mybatis 的源码过程中总结下来的,可能对读者不太友好,请结合我的源码注释(Mybatis源码分析 GitHub 地址.Mybatis-Spring 源码分析 GitHub ...
利用css3和js实现旋转木马图片小demo
先看效果图: 上源码 html代码 <!DOCTYPE html> <html lang="en"> <head> <meta chars ...
Django踩坑记录3
路径如下: admin.py的代码: from django.contrib import admin from sign.models import Event,Guest # Register y ...

第11.18节 Python 中re模块的匹配对象

第11.18节 Python 中re模块的匹配对象的更多相关文章

随机推荐

热门专题