re 模块详解

1.re 模块 regex

1.查找 :findall

意思"匹配所有,每一项都是列表的组成元素" 有返回值

 import re

 ret=re.findall("\d+","sdadadj我5454 4445")

 print(ret)#这里输出的是列表,而且使用逗号隔开

 #中间调用re模块 当结果没有匹配时,会显示空列表

2.查找 search

意思:只匹配列表从左到右第一个,得到的不是直接结果,通过变量group()的方法获取结果,没有匹配会报错

 import re

 ret=re.search('\d+','15645646456阿杀手锏1354444jkashasjkd').group()#这里group可以放在ret后

 print(ret)#如果直接输出拿出的是#如果search没有匹配的,会报错,而且只拿第一项

 #

3.查找:match

意思:就是从头开始匹配,相当于search中加入一个^

 import re

 ret=re.match("\d*",'88dasdas小鸡小鸡洗洁精22')

 print(ret.group())#这里match也需要有一个.group()来输出

 match就相当于search前面匹配的加上了^ 要是没有匹配到就会报错

 #

4.替换 sub

意思:找到要替换的一换掉

  5.import re

  ret=re.sub("\d+","Q","assd54544jsdas22",1)#前面的是一个正则表达式

 谁 新的 替换 次数

  print(ret)

  5.1import re

  ret=re.subn("\d+","Q","assd54544jsdas22",1)#前面的是一个正则表达式

 谁 新的 替换 次数

  print(ret)#这里的subn是返回一个元祖,不添加n返回字符串

5.切割 split

意思:这里的切割是将元素切掉,形成一个新的列表

 import re

 ret=re.split("a",'acbcd')#这里的切割是将匹配的元素切割掉,形成一个列表

 print(ret)#

 import re

 ret=re.split("(a)",'acbcd')#在匹配的部分上加上()之后所得出的结果是不同的

  没有()的没有保留用来切割的元素,但是有()可以保留切割下的元素

  这在某些需要保留匹配的十分重要

 print(ret)#

6re模块进阶

compile :声明

意思:这里会提前声明好正则,节省后面时间

  6.import re

  ret=re.compile("\d+")#compile这里进阶的是可以节省时间,提前声明

  匹配的元素后面的都可以调用,省去写"\d+"的时间

 res=ret.search("1拒绝23456")

  ress=ret.search("硕大的5大声道55")

  print(res.group())

  print(ress.group())

7.re模块进阶

finditer:

意思:返回一个迭代器,所有的结果放到迭代器中,要循环+group的形式取值,节省时间

  7.import re

  ret=re.finditer("\d+","alex80taibai40")#优点可以节省内存

  print(ret)#这里返回的是地址,可以把他当成调用迭代器

  print(ret.__next__().group())#输出第一项,注意需要在后面加group

  print(ret.__next__().group())#输出第二项

  for i in ret:#全部输出

      print(i.group())

8.()分组技巧

 import re

  s = '<a>wahaha</a>'  # 标签语言 html 网页

  ret = re.search('<(\w+)>(\w+)</(\w+)>',s)

  print(ret.group())  # 所有的结果

  print(ret.group(1)) # 数字参数代表的是取对应分组中的内容

  print(ret.group(2))

  print(ret.group(3))

  ret=re.findall("(\w+)",s) print(ret)

 ret = re.findall('>\w+<',s)

  print(ret)#['>wahaha<']

  ret = re.findall('>(\w+)<',s)#当在用findall来获取内容时,有的时候你想要获取的并不

 是他所展现出的,这个时候可以用()分组来显示优先级但这个只是显示在模块中,在正则表达式

 在线测试并不适用

  print(ret)#['wahaha']

取消优先级 ?:

 10. import  re

  ret=re.findall("\d+(?:\.\d+)?",'1.222*4')#在取消优先级的时候要在你优先级()里面

  的最前方添加?:可以取消优先级

  print(ret)

取名 ?p

 使用这样的必须前后一致

 s = '<a>wahaha</a>'

 pattern = '<(\w+)>(\w+)</(\w+)>'

 ret = re.search(pattern,s)

 print(ret.group(1) == ret.group(3))

 s="sadsadaa"

 print(s.count("a"))

  12.import re

  s="<a>wahaha</a>"

  ret=re.search(">(?P<zq>\w+)<",s)#分组命名是将(?:<这个组的名字>正则表达式),

 而且这个名字代表这个group的位置

  print(ret.group(1))

  print(ret.group('zq'))

re 模块详解的更多相关文章

Python中操作mysql的pymysql模块详解
Python中操作mysql的pymysql模块详解前言 pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb几乎相同.但目前pymysql支持python3.x而后者不支持 ...
python之OS模块详解
python之OS模块详解 ^_^,步入第二个模块世界----->OS 常见函数列表 os.sep:取代操作系统特定的路径分隔符 os.name:指示你正在使用的工作平台.比如对于Windows ...
python之sys模块详解
python之sys模块详解 sys模块功能多,我们这里介绍一些比较实用的功能,相信你会喜欢的,和我一起走进python的模块吧! sys模块的常见函数列表 sys.argv: 实现从程序外部向程序传 ...
python中threading模块详解（一）
python中threading模块详解(一) 来源 http://blog.chinaunix.net/uid-27571599-id-3484048.html threading提供了一个比thr ...
python time 模块详解
Python中time模块详解发表于2011年5月5日 12:58 a.m. 位于分类我爱Python 在平常的代码中,我们常常需要与时间打交道.在Python中,与时间处理有关的模块就包括: ...
python time模块详解
python time模块详解转自:http://blog.csdn.net/kiki113/article/details/4033017 python 的内嵌time模板翻译及说明一.简介 ...
小白的Python之路 day5 time,datatime模块详解
一.模块的分类可以分成三大类: 1.标准库 2.开源模块 3.自定义模块二.标准库模块详解 1.time与datetime 在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时 ...
小白的Python之路 day5 random模块和string模块详解
random模块详解一.概述首先我们看到这个单词是随机的意思,他在python中的主要用于一些随机数,或者需要写一些随机数的代码,下面我们就来整理他的一些用法二.常用方法 1. random.r ...
Python中time模块详解
Python中time模块详解在平常的代码中,我们常常需要与时间打交道.在Python中,与时间处理有关的模块就包括:time,datetime以及calendar.这篇文章,主要讲解time模块. ...
Ansible安装部署及常用模块详解
Ansible命令使用 Ansible语法使用ansible <pattern_goes_here> -m <module_name> -a <arguments> ...

随机推荐

（转）新建maven项目时报错Error:Maven Resources Compiler: Maven project configuration required for module 'XX'解决方法
转载地址:https://blog.csdn.net/qq784515681/article/details/85070195 在新建maven项目时,Problems中报错: Error:Maven ...
python3.5.3rc1学习三：文件操作
##全局变量与局部变量x = 6 def printFuc(): y = 8 z =9 print(y + z) print(x) printFuc()#print(y)#常见错误##name = & ...
SpringBoot定时器任务
Spring Boot使用@Scheduled定时器任务摘要: Spring Boot之使用@Scheduled定时器任务假设我们已经搭建好了一个基于Spring Boot项目,首先我们要在A ...
jQuery中的文档处理（五）
1. append(content|fn), 向每个匹配的元素内部追加内容在内部结尾添加. 参数说明: content:String, Element, jQuery,要追加到目标中的内容 func ...
洛谷 P4710 「物理」平抛运动
洛谷 P4710 「物理」平抛运动洛谷传送门题目描述小 F 回到班上,面对自己 28 / 110 的物理,感觉非常凉凉.他准备从最基础的力学学起. 如图,一个可以视为质点的小球在点 A(x_0, ...
A1029 Median (25 分)
一.技术总结最开始的想法是直接用一个vector容器,装下所有的元素,然后再使用sort()函数排序一下,再取出中值,岂不完美可是失败了,不知道是容器问题还是什么问题,就是编译没有报错,最后总是感觉 ...
CF 938G Shortest Path Queries
又到了喜闻乐见的写博客清醒时间了233,今天做的依然是线段树分治这题算是经典应用了吧,假的动态图(可离线)问题首先不难想到对于询问的时间进行线段树分治,这样就可以把每一条边出现的时间区间扔进线段树 ...
【转】np.random.random()函数参数用法以及numpy.random系列函数大全
转自:https://www.cnblogs.com/DOMLX/p/9751471.html 1.np.random.random()函数参数 np.random.random((1000, 20) ...
数据仓库006 - MySQL 5.6.x - Linux最佳生产环境离线部署
一.离线安装包文件准备这里以mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz为例,记一次MySQL 5.6.x 的生产环境离线部署过程.使用SecureCRT连接 ...
数据仓库009 - SQL命令实战 - where GROUP BY join 部门综合案例
一.where条件 WHERE 子句中主要的运算符,可以在 WHERE 子句中使用,如下表: 运算符描述 = 等于 <> 不等于.注释:在 SQL 的一些版本中,该操作符可被写成 != ...

re 模块详解

re 模块详解的更多相关文章

随机推荐

热门专题