笔记-python-lib-re
笔记-python-lib-re
1. re模块简介
re模块提供了与perl类似的正则匹配功能。
要搜索的模式和字符串都可以是Unicode字符串(str)以及8位字符串(bytes)。但是,不能混合Unicode字符串和8位字符串:也就是说,不能将Unicode字符串与字节模式匹配,反之亦然。
反斜杠:正则表达式使用了\表示转义,如果要匹配一个反斜杠,需要写成\\\\作为模式字符串。
另一种办法是声明字符串中的\不会以特殊方式处理,在字符串前加r,r’\n’是两个字符,而不是换行;
2. 模块内容
2.1. compile
re.compile(pattern, flags=0)
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
参数:
pattern:一个字符串形式的正则表达式
flags:可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式,影响^和$
re.S 意为' . '包括换行符在内的任意字符(一般' . '不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和' # '后面的注释
example:
pattern = re.compile(r’\d+?’)
2.2. match
re.match(pattern, string, flags=0)
判断RE是否在字符串刚开始的位置匹配,返回match object。
注意:只要字符串开始部分满足匹配即成功,如果想要整串匹配可加$符。
example:
s = re.match('[a-z]+', str1)
2.3. search
re.search(pattern, string, flags=0)
在字符串内查找模式匹配,只要找到第一个匹配然后返回一个match object对象,如果没有则返回None。
<_sre.SRE_Match object; span=(0, 5), match='eoorg'>
2.4. split
split(pattern, string, maxsplit=0, flags=0)
以模式匹配的字符串的为界拆分字符串;
如果使用(),则模式组也包含在结果中;
str1 = 'eoorg943443g382\jgdo 349po\oer g34 345364 sfwe fwegre ewfwe fwef'
s = re.split(r'\d+', str1, 4)
['eoorg', 'g', '\\jgdo ', 'po\\oer g', ' 345364 sfwe fwegre ewfwe fwef']
s = re.split(r'(\d+)', str1, 4)
['eoorg', '943443', 'g', '382', '\\jgdo ', '349', 'po\\oer g', '34', ' 345364 sfwe fwegre ewfwe fwef']
maxsplit指定最大拆分次数,达到次数后,剩余字符串作为列表元素添加到列表尾部。
2.5. findall
findall(pattern, string, flags=0)
遍历匹配,获取字符串中所有匹配的字符串,返回一个列表;如果模式有多个组,返回元组列表。
2.6. sub
sub(pattern, repl, string, count=0, flags=0)
替换匹配的子串,返回替换后的字符串。
str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'
s = re.sub('\s+', '-', str1)
print(s)
参数count指替换个数,默认为0,表示每个匹配项都替换。
2.7. subn
subn(pattern, repl, string, count=0, flags=0)
与sub所做操作一样,但返回一个元组,(new_string, number_of_sub_made)。
2.8. match objects
上面讲过search,match会返回一个match object
str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'
s = re.search('[a-z]+', str1)
print(s)
<_sre.SRE_Match object; span=(6, 8), match='is'>
match objects支持以下方法和属性:
match.group([group1]) 可以不带参数,表示所有匹配项;带参数则表示参数所对应的项;
str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'
pattern = re.compile(r'\s+')
s = re.match('(\w+)\s(\w+)', str1)
print(s)
<_sre.SRE_Match object; span=(0, 8), match='JGOOD is'>
>>> s.group()
'JGOOD is'
>>> s.group(1)
'JGOOD'
>>> s.group(2)
'is'
>>>
match.groups() 返回一个tuple,包含所有子组
match.start()
match.end() 返回匹配结果开始结束字符的下标
match.span() 与上文同义,返回匹配结果开始结束下标,格式是元组;
match.re 以re.compile('(\\w+)\\s(\\w+)')格式返回该对象使用的正则表达式
笔记-python-lib-re的更多相关文章
- 笔记-python -asynio
笔记-python -asynio 1. 简介 asyncio是做什么的? asyncio is a library to write concurrent code using the a ...
- 笔记-python操作mysql
笔记-python操作mysql 1. 开始 1.1. 环境准备-mysql create database db_python; use db_python; create tabl ...
- 笔记-python异常信息输出
笔记-python异常信息输出 1. 异常信息输出 python异常捕获使用try-except-else-finally语句: 在except 语句中可以使用except as e,然后通 ...
- 笔记-python lib-pymongo
笔记-python lib-pymongo 1. 开始 pymongo是python版的连接库,最新版为3.7.2. 文档地址:https://pypi.org/project/pymong ...
- 笔记-python tutorial-9.classes
笔记-python tutorial-9.classes 1. Classes 1.1. scopes and namespaces namespace: A namespace is ...
- MongoDB学习笔记:Python 操作MongoDB
MongoDB学习笔记:Python 操作MongoDB Pymongo 安装 安装pymongopip install pymongoPyMongo是驱动程序,使python程序能够使用Mong ...
- 机器学习实战笔记(Python实现)-08-线性回归
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-05-支持向量机(SVM)
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-04-Logistic回归
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-03-朴素贝叶斯
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
随机推荐
- JAVA基础系列(一) 概述与相关概念
万事开头难,来这个平台上已经有一段时间了,看到了很多高质量的文章,也很喜欢这种简约的风格.一直也想把自己的零散的知识体系组织起来,但苦于自己拙劣的文笔和不成流派的风格让大家笑话,直到现在才开始.可是从 ...
- C# 多线程之线程池
线程池System.Threading.ThreadPool,可用于发送工作项.处理异步I/O.代表其它线程等待以及处理计时器.基本用法: public void Main() { ThreadPoo ...
- enable orgmode latex preview to support retina on mac
Table of Contents 1. enable orgmode latex preview to support retina on mac 1.1. get the proper versi ...
- 程序运行的cpu时间
time.clock() 测量CPU时间,比较精准,通过比较程序运行前后的CPU时间差,得出程序运行的CPU时间.
- TX Text Control X10独家揭秘之使用对象作为数据源
文档处理控件TX Text Control即将发布的X10版本,将升级重点还是放到了其比较优势的流式布局报表设计和生成上.慧都获得了来自其开发商Text Control GmbH公司的一手资料,迫不及 ...
- Android stutdio2.2 启动模拟器出现“/dev/kvm is not found.”解决方法
第一次启动avd,Android stutdio会自动安装Intel HAXM,而且表面看是成功的,再次启动会出现“/dev/kvm is not found.”,这说明Intel HAXM没有安装成 ...
- 两数相除赋值整数变量(T-SQL)
MSSQL: DECLARE @_pagecount INT; ; SELECT @_pagecount; 结果为1 Mysql: BEGIN DECLARE _pagecount INT; ; SE ...
- UVALive 3530 Martian Mining(贪心,dp)
分析: 对于网格grid[i][j]如果放向上的管道,那么grid[i][k], k>j 就只能放向上的管道了. 那么定义dp[i][j]表示第i行,最后一个放向左的管道是j的最大总矿量. j ...
- 2018.10.26 NOIP2018模拟赛 解题报告
得分: \(0+10+10=20\)(\(T1\)死于假题面,\(T3\)死于细节... ...) \(P.S.\)由于原题是图片,所以我没有上传题目描述,只有数据. \(T1\):颜料大乱斗(点此看 ...
- app之间的跳转和传参问题
app 之间跳转和传参: 首先 创建2个app formApp (需要跳转到另外app的项目) toApp(被跳转的项目) 一:在toApp 项目中的操作: 1:创建URLSchemes ...