python——re模块
python——re模块
一 正则表达式的作用
1、给字符串进行模糊匹配,
2、对象就是字符串
二 字符匹配(普通字符、元字符)
普通字符:数字字符和英文字母和自身匹配
2.元字符:. ^ $
* + ? {} [] () | \
re.方法("规则","匹配的字符串")
re.findall() 找到所有的匹配元素,返回一个列表
. 匹配任意一个字符,除了\n换行符
^ 从字符串开始匹配的位置
print(re.findall("a..c","abbc"))
# ['abbc']
$ 从字符串结尾匹配
print(re.findall("alex$","yuanegonalex"))
# ['alex']
* + ? {} :重复
* 匹配所有[0 -00] 0-无穷次
print(re.findall("ale*","yuanalexxxx"))
# ['ale']
+ 匹配范围[1-oo] 1-无穷次
print(re.findall("alex+","yuanegongalex"))
# ['alex']
? 匹配范围[0-1] 0-1次
print(re.findall("alex?","yuanegongalexxxx"))
# ['alex']
{}万能的 范围自己定{0,无穷次}==* {1,无穷次}==+ {0,1次}==?
print(re.findall("alex{1,4}","yuanalexxxxxx"))
# ['alexxxx']
() 分组
print(re.findall("(ad)+yuan","addddyuansdf"))
# 空值[]
print(re.findall("(ad)+yuan","adadyuangfsdui"))#优先匹配(ad)
# ['ad']
?:取消优先级
print(re.findall("(?:ad)+yuan","adadyuangfsdui")) # ?:取消优先级
# ['adadyuan']
print(re.findall("(\d)+yuan","adad678423yuang4234fsdui"))#默认最后一个数字
# ['3']
print(re.findall("(?:\d)+yuan","adad678423yuang4234fsdui")) #取消优先级
# ['678423yuan']
[] 字符集合设定符
1.或的功能 字符集里面特殊意义的 [-] [^] [\]
2.注意:* ,+ ,. 等元字符都是普通符号
print(re.findall('a[bc]d','acdabd')) #或的意思
# ['acd', 'abd']
print(re.findall('[a-z]','acd'))
# ['a', 'c', 'd']
print(re.findall('[.*+]','a.cd+')) #把.和+匹配出来
# ['.', '+']
特殊意义的 [-] [^] [\]
print(re.findall('[1-9]','45dha3')) #取1至9的数字
# ['4', '5', '3']
print(re.findall('[^ab]','45bdha3'))#取ab以外的字母及数字
# ['4', '5', 'd', 'h', '3']
print(re.findall('[\d]','45bdha3'))#取所有的数字
# ['4', '5', '3']
\ 或的意思
print(re.findall("www\.(?:oldboy|baidu)\.com","www.oldboy.com"))
# ['www.oldboy.com']
\ :转义
 1 后面加一个元字符使其变成普通符号
 2 将一些普通符号编程特殊符号 比如 \d \w  
print(re.findall("\d+\*\d+","2*6+7*45+4*3-8/4")) #取出乘法
# ['2*6', '7*45', '4*3']
print(re.findall("\d+\.?\d*\*\d+\.?\d*","2*6+7*45+1.4*3-8/4")) #取出带有小数点的乘法
# ['2*6', '7*45', '1.4*3']
三 元字符之转义符\
反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d
\d  匹配任何十进制数;它相当于类
[0-9]。
\D 匹配任何非数字字符;它相当于类
[^0-9]。
\s  匹配任何空白字符;它相当于类
[ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类
[^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类
[a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类
[^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等
四 正则表达式方法
re.findall() ---->列表 查找
re.finditer 可调用的迭代器 查找
s=re.finditer("\d+","ad324das32")
print(s)
print(next(s).group())
print(next(s).group())
# 324
# 32
search 只匹配第一个结果 查找
ret=re.search("\d+","djksf34asd3")
print(ret.group())
# 34
match: 只在字符串开始的位置匹配 查找
ret=re.match("\d+","423dgssdf34dsfd3")
print(ret.group())
# 423
split 分割
s2=re.split("\d+","fsd3445sdfdss54skf4533sd")
print(s2)
# ['fsd', 'sdfdss', 'skf', 'sd']
s2=re.split("\d+","fsd3445sdfdss54skf4533sd",2) #最大值分割
print(s2)
# ['fsd', 'sdfdss', 'skf4533sd']
ret3=re.split("l","hello yuan")
print(ret3)
# ['he', '', 'o yuan']
sub 替换
ret4=re.sub("\d+","A","hello 234jkhh23")
print(ret4)
# hello AjkhhA
ret4=re.sub("\d+","A","hello 234jkhh23",1)
print(ret4)
# hello Ajkhh23
compile :编译方法
c=re.compile("\d+")
ret5=c.findall("hello32world53")  #查找这些数字
print(ret5)
# ['32', '53']
python——re模块的更多相关文章
- Python标准模块--threading
		1 模块简介 threading模块在Python1.5.2中首次引入,是低级thread模块的一个增强版.threading模块让线程使用起来更加容易,允许程序同一时间运行多个操作. 不过请注意,P ... 
- Python的模块引用和查找路径
		模块间相互独立相互引用是任何一种编程语言的基础能力.对于“模块”这个词在各种编程语言中或许是不同的,但我们可以简单认为一个程序文件是一个模块,文件里包含了类或者方法的定义.对于编译型的语言,比如C#中 ... 
- Python Logging模块的简单使用
		前言 日志是非常重要的,最近有接触到这个,所以系统的看一下Python这个模块的用法.本文即为Logging模块的用法简介,主要参考文章为Python官方文档,链接见参考列表. 另外,Python的H ... 
- Python标准模块--logging
		1 logging模块简介 logging模块是Python内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级.日志保存路径.日志文件回滚等:相比print,具备如下优点: 可以通过设置不同 ... 
- python基础-模块
		一.模块介绍 ... 
- python 安装模块
		python安装模块的方法很多,在此仅介绍一种,不需要安装其他附带的pip等,python安装完之后,配置环境变量,我由于中英文分号原因,环境变量始终没能配置成功汗. 1:下载模块的压缩文件解压到任意 ... 
- python Queue模块
		先看一个很简单的例子 #coding:utf8 import Queue #queue是队列的意思 q=Queue.Queue(maxsize=10) #创建一个queue对象 for i in ra ... 
- python logging模块可能会令人困惑的地方
		python logging模块主要是python提供的通用日志系统,使用的方法其实挺简单的,这块就不多介绍.下面主要会讲到在使用python logging模块的时候,涉及到多个python文件的调 ... 
- Python引用模块和查找模块路径
		模块间相互独立相互引用是任何一种编程语言的基础能力.对于"模块"这个词在各种编程语言中或许是不同的,但我们可以简单认为一个程序文件是一个模块,文件里包含了类或者方法的定义.对于编译 ... 
- Python Paramiko模块与MySQL数据库操作
		Paramiko模块批量管理:通过调用ssh协议进行远程机器的批量命令执行. 要使用paramiko模块那就必须先安装这个第三方模块,仅需要在本地上安装相应的软件(python以及PyCrypto), ... 
随机推荐
- 快速搭建CentOS+ASP.NET Core环境支持WebSocket
			环境:CentOS 7.x,.net core 2 以下.net core 2安装操作为官方方法.如果你使用Docker,那么更简单了,只需要docker pull microsoft/dotnet就 ... 
- Angular组件——父子组件通讯
			Angular组件间通讯 组件树,1号是根组件AppComponent. 组件之间松耦合,组件之间知道的越少越好. 组件4里面点击按钮,触发组件5的初始化逻辑. 传统做法:在按钮4的点击事件里调用组件 ... 
- 17.C++-string字符串类(详解)
			C++字符串string类 在C语言里,字符串是用字符数组来表示的,而对于应用层而言,会经常用到字符串,而继续使用字符数组,就使得效率非常低. 所以在C++标准库里,通过类string从新自定义了字符 ... 
- servlet的执行过程
			第一次访问servlet的过程: 服务器启动:在服务器启动的时候,加载项目,就扫描web.xml文件,获得应用有哪些servlet,url-pattern, 客户端通过URl访问服务器[向服务器发送一 ... 
- 【Python】 xml解析与生成 xml
			xml *之前用的时候也没想到..其实用BeautifulSoup就可以解析xml啊..因为html只是xml的一种实现方式吧.但是很蛋疼的一点就是,bs不提供获取对象的方法,其find大多获取的都是 ... 
- Dynamics 365 for CRM: Sitemap站点图的可视化编辑功能
			Dynamics 365 for CRM 提供了Sitemap站点图的可视化编辑功能 在之前的所有版本中,我们只能通过从系统中导出站点图的XML进行编辑后再导入(容易出错),或使用第三方的Sitema ... 
- [BZOJ 1190][HNOI2007]梦幻岛宝珠
			1190: [HNOI2007]梦幻岛宝珠 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 1057 Solved: 611[Submit][Stat ... 
- Go语言标准库_输入/输出
			Go语言标准库_输入/输出 转载节选自<Go语言标准库> Reader 接口 type Reader interface { Read(p []byte) (n int, err erro ... 
- Maven安装配置【WIN10】
			环境 WIN10 Maven 3.5.3 下载 下载地址:https://maven.apache.org/download.cgi 安装配置 选择好路径后一路 next 默认,安装完成. 环境变量设 ... 
- 第二次作业:软件分析之Steam的前世今生
			摘要:本次作业我将介绍一下Steam的相关内容,以及对Steam的相关调研测评,以及需求分析,最后就是对Steam的建议以及在中国的发展提出相应的建议 一.相关信息 Steam是一个整合游戏 ... 
