前言

Python 从1.5版本开始使用re模块来处理正则表达式。
我们可以使用“re模块”或“re.compile方法”来创建正则表达式对象（re.RegexObject），然后通过调用相应方法来处理字符数据。（关于正则表达式语法的相关内容，可以参考这篇文章，本文不再赘述）

 1 # 使用re模块直接调用相应方法处理正则表达式

 2 re.match()

 3

 4 # 使用compile方法创建正则表达式对象，调用相应方法处理正则表达式

 5 RegexObject = re.compile()

 6 RegexObject.match()

 7

 8 #当正则表达式成功匹配后，会返回一个MatchObject对象，可以通过调用以下方法获取匹配结果

 9 group()     获得一个或多个分组匹配的字符串

10 groups()    从第1个分组开始，将匹配到的所有字符串以元组的形式返回

11 start()     获取分组匹配的子串在整个字符串中的起始位置（子串第一个字符的索引）

12 end()       获取分组匹配的子串在整个字符串中的结束位置

13 span()      返回 (start(group), end(group))

功能函数

re.compile(pattern, flags)
用于编译正则表达式，生成一个正则表达式对象。

1 #参数：

2 pattern：    一个字符串形式的正则表达式

3 flags：      可选，表示匹配模式，比如忽略大小写，多行模式等

4

5 #示例

6 obj = re.compile("123")

7 strr = obj.match("123a456").group()

8 print(strr)    #123

re.match(pattern, string, flags=0)
从字符串的起始位置开始匹配，如果不是起始位置匹配成功的话，返回none。

1 #参数

2 pattern：   正则表达式

3 string：    要匹配的字符串

4 flags：     可选，表示匹配模式，比如忽略大小写，多行模式等

5

6 #示例

7 strr = re.match("123", "123a456").group()

8 print(strr)    #123 (只能从字符串头部开始匹配，否则返回none)

re.search(pattern, string, flags=0)
从整个字符串开始匹配，返回第一个成功匹配的结果。

1 #参数

2 pattern：   正则表达式

3 string：    要匹配的字符串

4 flags：     可选，表示匹配模式，比如忽略大小写，多行模式等

5

6 #示例

7 strr = re.search("abc", "123abc456abc").group()

8 print(strr)    #abc (有多个符合时，只返回第一个匹配的结果)

re.findall(pattern, string, flags=0)
从整个字符串开始匹配，将成功匹配的所有子串用列表返回，如果匹配失败返回空列表。

 1 #参数

 2 pattern：   正则表达式

 3 string：    要匹配的字符串

 4 pos：       可选参数，指定字符串的起始位置，默认为0

 5 endpos：    可选参数，指定字符串的结束位置，默认为字符串长度

 6

 7 #示例

 8 strr = re.findall("abc", "123abc456abc")

 9 print(strr)    #['abc', 'abc'] (有多个符合时，返回所有匹配的结果)

10

11 obj = re.compile("abc")

12 strr = obj.findall("123abc456abc", 0, 8)

13 print(str2)    #['abc'] (指定起始位置和结束位置后，只有第一个abc能成功匹配)

re.finditer(pattern, string, flags=0)
从整个字符串开始匹配，将成功匹配的所有子串用一个迭代器返回，如果匹配失败返回空迭代器。

1 #参数

2 pattern：   正则表达式

3 string：    要匹配的字符串

4 flags：     可选，表示匹配模式，比如忽略大小写，多行模式等

5

6 #示例

7 it = re.finditer("abc", "123abc456abc")

8 for strr in it:

9 print(strr.group())    #abc abc

re.sub(pattern, repl, string, count=0, flags=0)
从整个字符串开始匹配，并使用指定字符串替换成功匹配的结果。

 1 #参数

 2 pattern：   正则表达式

 3 repl：      用于替换的字符串(也可以是一个函数)

 4 string：    用于查找后被替换的原始字符串

 5 count：     可选，成功匹配后要替换的次数，默认0表示替换所有的匹配结果

 6 flags：     可选，表示匹配模式，比如忽略大小写，多行模式等

 7

 8 #示例

 9 strr = re.sub("abc", "", "123abc456abc")

10 print(strr)    #123456

re.split(pattern, string, maxsplit=0, flags=0)
从整个字符串开始匹配，用成功匹配的子串对整个字符串进行分割，分割结果用列表返回。

 1 #参数

 2 pattern：   正则表达式

 3 string：    要匹配的字符串

 4 maxsplit：  可选，分隔次数，maxsplit=1 分隔一次，默认为0，不限制次数

 5 flags：     可选，表示匹配模式，比如忽略大小写，多行模式等

 6

 7 #示例

 8 strr1 = re.split("abc", "123abc456abc")

 9 strr2 = re.split("abc", "123abc456abc", 1)

10 print(strr1) #['123', '456', '']

11 print(strr2) #['123', '456abc']

参考链接

https://www.runoob.com/python3/python3-reg-expressions.html

【编程】Python3 正则表达式使用笔记的更多相关文章

python3 正则表达式学习笔记
re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none. ~匹配成功re.match方法返回一个匹配的对象,否则返回No ...
Python3正则表达式学习笔记
学习前准备:导入re模块 import re 一.re的核心函数 1 - re.compile(pattern[, flags]) 编译正则表达式,速度快 2 - re.match(pattern, ...
python3.4学习笔记(十二) python正则表达式的使用，使用pyspider匹配输出带.html结尾的URL
python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL实战例子:使用pyspider匹配输出带.html结尾的URL:@config(a ...
python3.4学习笔记(五) IDLE显示行号问题，插件安装和其他开发工具介绍
python3.4学习笔记(五) IDLE显示行号问题,插件安装和其他开发工具介绍 IDLE默认不能显示行号,使用ALT+G 跳到对应行号,在右下角有显示光标所在行.列.pycharm免费社区版.Su ...
python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容
python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖 ...
python3.4学习笔记(十三) 网络爬虫实例代码，使用pyspider抓取多牛投资吧里面的文章信息，抓取政府网新闻内容
python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息PySpider:一个国人编写的强大的网络爬虫系统并带有强大的WebUI,采用Python语言编写 ...
《Java编程思想》读书笔记（二）
三年之前就买了<Java编程思想>这本书,但是到现在为止都还没有好好看过这本书,这次希望能够坚持通读完整本书并整理好自己的读书笔记,上一篇文章是记录的第一章到第十章的内容,这一次记录的是第 ...
python3.4学习笔记(十四) 网络爬虫实例代码，抓取新浪爱彩双色球开奖数据实例
python3.4学习笔记(十四) 网络爬虫实例代码,抓取新浪爱彩双色球开奖数据实例新浪爱彩双色球开奖数据URL:http://zst.aicai.com/ssq/openInfo/ 最终输出结果格 ...
《Linux/Unix系统编程手册》读书笔记目录
<Linux/Unix系统编程手册>读书笔记1 (创建于4月3日,最后更新4月7日) <Linux/Unix系统编程手册>读书笔记2 (创建于4月9日,最后更新4月10日) ...
《Linux/Unix系统编程手册》读书笔记9（文件属性）
<Linux/Unix系统编程手册>读书笔记目录在Linux里,万物皆文件.所以文件系统在Linux系统占有重要的地位.本文主要介绍的是文件的属性,只是稍微提及一下文件系统,日后如果有 ...

随机推荐

File.Exists 判断不了虚拟路径
https://www.shuzhiduo.com/topic/file-exists-%E5%88%A4%E6%96%AD%E4%B8%8D%E4%BA%86%E8%99%9A%E6%8B%9F%E ...
python随机数模拟
`#随机数 import random red = range(1,36,1) red_target_list=[] i=1 while i< 6: red_ran_index=random.r ...
关于htpasswd
什么是 htpasswd htpasswd是一个apache的内置工具,其生成的文件称之为htpasswd文件.htpasswd文件本身一个密码本,或者类似于数据库一样,用来存储一些密码(凭证)信息. ...
linux中大括号、小括号、中括号的区别和用法
大括号 { } 1.用于取多个变量可以进行取变量和字符串拼接,假设:var='1234' echo ${var}abcd 输出为:1234abcd 2.正则表达式,用于大括号内 ...
解决 http://www.diamond-sh.com/favicon.ico 404 (Not Found) 报错问题
html5页面中经常会遇到这个报错,解决方法有以下两种: 1. 根目录下建一个个favicon.ico文件,在head标签引入favicon.ico文件即可 <link href="f ...
UI设计圈年终福利，错过一次等一年！
年底了,小摹发现各种大数据年终报告接踵而至.但真相是,某博不知道和你互动最多的是个机器人,某Q不知道听歌最久那天只是忘了关APP.大数据不懂你,但是摹客懂你! 设计萌新更希望大佬能在线帮忙改稿. 5年 ...
axios进行图片上传
进行图片的上传,一定要注意headers的设置: headers:{"Content-Type":"multipart/form-data&quo ...
解决GitHub网页githubusercontent地址无法访问问题
问题解决GitHub网页githubusercontent地址无法访问问题解决方法: 参考链接:https://zhuanlan.zhihu.com/p/107691233 注意安装有火绒的,可 ...
oracle查看归档信息
1.查看归档信息 show parameter recovery_file_dest #查看归档目录 show parameter recovery_file_dest_size #查看归档可以存储的 ...
mongoengine模型字段非严格校验FieldDoesNotExist
背景最近需要从mongoDB中查询数据用于数据分析,一开始就用了pymongo后来发现使用起来很不方便,后面了解到有类似SQLAlchemy的ORM模块mongoengine能够操mongo 简单看 ...

【编程】Python3 正则表达式使用笔记

前言

功能函数

参考链接

【编程】Python3 正则表达式使用笔记的更多相关文章

随机推荐

热门专题