$python正则表达式系列(2)——re模块常用函数
本文主要介绍正则re模块的常用函数。
1. 编译正则
import re
p = re.compile(r'ab*')
print '【Output】'
print type(p)
print p
print p.findall('abbc')
【Output】
<type '_sre.SRE_Pattern'>
<_sre.SRE_Pattern object at 0x7fe4783c7b58>
['abb']
正则编译的好处:速度更快。
2. re模块常用函数和方法
1. 不区分大小写匹配
p = re.compile(r'ab*',re.I)
print '【Output】'
print p.findall('AbBbc')
【Output】
['AbBb']
2. 字符串前加"r",反斜杠""就不会被作任何特殊处理
即:如果字符串前带"r",表示这是一个正则字符串,字符串里面用到的需要表示转义用途的""不用使用双重转义。
s = 'a+++'
p1 = re.compile('\++')
p2 = re.compile('\\++')
p3 = re.compile(r'\++')
# p4 = re.compile(r'\\++')
print '【Output】'
print p1.findall(s)
print p2.findall(s)
print p3.findall(s)
# print p4.findall(s)
# 用p4来匹配会报错:error: multiple repeat
【Output】
['+++']
['+++']
['+++']
3. 两个匹配函数
match():判断正则是否在字符串开始位置出现。
search():判断正则是否在字符串任何位置出现。
p = re.compile(r'aa')
print '【Output】'
print p.match('aabcd')
print p.match('bcaad')
print p.search('bcaad')
【Output】
<_sre.SRE_Match object at 0x7fe47020a098>
None
<_sre.SRE_Match object at 0x7fe47020a098>
4. 匹配查找函数
findall():找到正则匹配的所有子串,并作为列表返回。
finditer():找到正则匹配的所有子串,并作为迭代器返回。
p = re.compile(r'\d')
s = 'a1b2c3d'
print '【Output】'
print p.findall(s)
print p.finditer(s)
for ss in p.finditer(s):
print ss
print ss.group()
【Output】
['1', '2', '3']
<callable-iterator object at 0x7fe4701ecb90>
<_sre.SRE_Match object at 0x7fe47020a780>
1
<_sre.SRE_Match object at 0x7fe47020a6b0>
2
<_sre.SRE_Match object at 0x7fe47020a780>
3
5. MatchObject实例方法
p = re.compile(r'aa')
m = p.search('1aa2bb3aad')
print '【Output】'
print m.group()
print m.group(0)
#print m.group(1) # IndexError: no such group,因为当前只有一个分组
print m.start()
print m.end()
print m.span()
【Output】
aa
aa
1
3
(1, 3)
p = re.compile(r'age:(\d+),score:(\d+)')
info = 'age:15,score:98;age:20,score:100'
it = p.finditer(info)
print '【Output】'
for x in it:
print 'info=({0}),age={1},score={2}'.format(x.group(0),x.group(1),x.group(2))
【Output】
info=(age:15,score:98),age=15,score=98
info=(age:20,score:100),age=20,score=100
6. 其他re顶级函数
(1) 匹配开头
re.match(pattern,str,flags = 0)
注:这里的pattern既可以直接使用正则字符串(r'...'),又可以使用编译后的正则(p = re.compile(r'...'))
(2) 匹配所有位置
re.search(pattern,str,flags = 0)
re.search()函数和re.match()函数的不同用法举例:
(3) 替换子串
re.sub(pattern,repl,str,count = 0,flags = 0)
print '【Output】'
print re.sub(r'a.b','xxx','acb,ayb,acd,aub,dd',2)
# re.sub()是产生一个新的字符串,使用re.sub()函数替换后,并不会对原字符串产生影响
【Output】
xxx,xxx,acd,aub,dd
替换子串与后项引用的结合使用举例:
可以看出re.sub()函数的第二个参数支持对前面的正则分组的后向引用,值得注意的是,第二个参数如果需要进行后向引用,那么必须写成raw字符串('r'开头的字符串),且字符串中的正则元字符(如'.'、'+'等)会被当成普通字符出现在结果中。
注:正则后向引用相关用法参见博文:python正则表达式系列(4)——分组和后向引用
(4) 替换子串
re.subn(pattern,repl,str,count = 0,flags = 0),作用同re.sub()函数,只不过subn()函数返回一个二元组,包含了替换后的字符串和替换次数。
print '【Output】'
print re.subn(r'a.b','xxx','acb,ayb,acd,aub,dd')
【Output】
('xxx,xxx,acd,xxx,dd', 3)
(5) 字符串分割函数
re.split(pattern, string, maxsplit=0, flags=0)
p = re.compile(r'[+\-*/]')
print '【Output】'
print re.split(p,'1+2-3*4/5')
【Output】
['1', '2', '3', '4', '5']
(6) 子串查找函数
re.findall(pattern, string, flags=0)
print '【Output】'
print re.findall(r'a+','abbaaccaaa')
【Output】
['a', 'aa', 'aaa']
# 分组查找:
print '【Output】'
print re.findall(r'age=(\d+)','age=1,age=21')
【Output】
['1', '21']
随机推荐
- 使用MyBatis_Generator生成Dto、Dao、Mapping
由于MyBatis属于一种半自动的ORM框架,所以主要的工作将是书写Mapping映射文件,但是由于手写映射文件很容易出错,所以查资料发现有现成的工具可以自动生成底层模型类.Dao接口类甚至Mappi ...
- hdu5802 Windows 10 贪心
Windows 10 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total ...
- C# 持续序列化对象追加到文件的方法
最近有个需求,将内存和帧数数据序列化到二进制文件.为了节省内存,采用了100个对象的数组,每次存满就序列化到文件,然后归零继续存,以追加的性式继续序列化到原有文件. 这样相当于多个数组对象存在了同一个 ...
- NDK工具制作
NDK工具制作 - Generate a stand-alone toolchain of the NDK, example: `./android-ndk-r10/build/tools/make- ...
- [Unity热更新]tolua# & LuaFramework(一):基础
一.tolua# c#调用lua:LuaState[变量名/函数名] 1.LuaState a.执行lua代码段 DoString(string) DoFile(.lua文件名) Require(.l ...
- hadoop集群加入新节点hhbase调试
一.改动vi /etc/hosts 添加节点ip.(没个节点都要加入 ) 二.设置hostname vi /etc/sysconfig/network 把hostname改为nod ...
- SSL证书的生成
openssl工具下载路径:链接:https://pan.baidu.com/s/1o0-s8OplHZt55Cio2HmjVA 密码:u759 1.使用openssl工具生成一个RSA秘钥 ...
- hdu5646(数学)
小学数学,脑补 一开始看到这题,猜了个规律想写但是我是拒绝的. 因为我无法证明. 好吧,主要还是小学数学没学好吧. 要理解这题,首先得搞懂一个重要问题.假设C=A+B,怎样选择两个正整数使得A*B最大 ...
- HDU4781(2013成都站A题)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4781 题目大意:给你n个点m条边,要求你构造一个符合条件的有向联通图(若无法构造输出-1,否则输出任意 ...
- 部署vuejs dist文件,通过node.js编译
前期准备: 1. Linux环境,安装配置node.js ① 下载地址:http://nodejs.cn/download/ ,下载linux 64位 ② 已编译好的压缩包,解压到指定目录 cd / ...