正则模块re:

元字符:

字符 描述
. 除换行符外的任意字符
\ 转义字符
[...] 字符集合,匹配任务其中一个
\d 数字:[0-9]
\D 非数字:[^\d]
\w 单词字符[A-Za-z0-9]
\W 非单词字符[^\w]
\s 空白字符[\t\r\n\f 空格]
\S 非空白字符[^\s]

数量词:

* 匹配一个字符0次或多次
+  匹配一个字符1次或多次
? 匹配一个字符0次或1次
{m} 匹配一个字符m次
{m,n} 匹配一个字符m次到n次
? 非贪婪模式
   
   
   
   

边界:

^ 匹配字符串开头和行首
$ 匹配字符串结尾和行尾
\A 匹配字符串开头
\Z 匹配字符串结尾
\b 匹配\w到\W之间
   
   
   
   
   

分组:

| 左右表达式任意匹配一个,先匹配左边,一般成功则跳过匹配右边, 如果没有|则匹配整个表达式
(...) 分组匹配,从左到右,没遇到一个编号就+1, 后面可以根据数量词提取内容
(?P<name>...) 除了分组序号外, 还可以执行一个name的别名

\<number>

引用编号为<number>的分组匹配到的字符串
(?P=name) 引用别名为<name>的分组匹配到的串
   
   
   
   
   

常用函数:

1) compile(pattern)

创建正则匹配规则对象

>>> import re
>>> pat=re.compile('A')
>>> m=pat.search('CBA')
>>> print m
<_sre.SRE_Match object at 0x9d690c8> #匹配到了,返回MatchObject(True) >>> m=pat.search('CBD')
>>> print m
None #没有匹配到,返回None(False) #上面的等价于 >>> re.search('A','CBA')
<_sre.SRE_Match object at 0xb72cd170> #推荐都用第一种方法

2)findall(pattern, string)

在字符串中查询所有匹配项,并以列表的形式返回

>>> re.findall('a','ASDaDFGAa')
['a', 'a'] #列表形式返回匹配到的字符串
>>> pat = re.compile('a')
>>> pat.findall('ASDaDFGAa')
['a', 'a'] #列表形式返回匹配到的字符串 >>> pat = re.compile('[A-Z]+') #正则匹配:'[A-Z]+' 后面有说明
>>> pat.findall('ASDcDFGAa')
['ASD', 'DFGA'] #找到匹配到的字符串
>>> pat = re.compile('[A-Z]')
>>> pat.findall('ASDcDFGAa') #正则匹配:'[A-Z]+' 后面有说明
['A', 'S', 'D', 'D', 'F', 'G', 'A'] #找到匹配到的字符串 >>> pat = re.compile('[A-Za-z]') #正则匹配:'[A-Za-z]+' 匹配所有单词,后面有说明
>>> pat.findall('ASDcDFGAa')
['A', 'S', 'D', 'c', 'D', 'F', 'G', 'A', 'a']

3)search(pattern,string)

在字符串中查询第一个匹配项,并以对象的形式返回

>>> m = re.search('asd','ASDasd')
>>> print m
<_sre.SRE_Match object at 0xb72cd6e8> #匹配到了,返回MatchObject(True)
>>> m = re.search('asd','ASDASD')
>>> print m
None #没有匹配到,返回None(False)

4)match(pattern,string)

在字符串开始位置查询匹配项,并以对象的形式返回

>>> m = re.match('a','Aasd')
>>> print m
None #没有匹配到,返回None(False >>> m = re.match('a','aASD')
>>> print m
<_sre.SRE_Match object at 0xb72cd6e8> #匹配到了,返回MatchObject(True) 可以用第一个方法:compile >>> pat=re.compile('a')
>>> printpat.match('Aasd')
None >>> printpat.match('aASD')
<_sre.SRE_Match object at 0xb72cd6e8>

5)split(pattern,string)

在字符串中根据模式分隔字符串

>>> re.split(',','a,s,d,asd')
['a', 's', 'd', 'asd'] #返回列表
>>> pat = re.compile(',')
>>> pat.split('a,s,d,asd')
['a', 's', 'd', 'asd'] #返回列表 >>> re.split('[, ]+','a , s ,d ,,,,,asd') #正则匹配:[, ]+,后面说明
['a', 's', 'd', 'asd']
>>> re.split('[, ]+','a , s ,d ,,,,,asd',maxsplit=2) # maxsplit 最多分割次数
['a', 's', 'd ,,,,,asd']
>>> pat = re.compile('[, ]+') #正则匹配:[, ]+,后面说明
>>> pat.split('a , s ,d ,,,,,asd',maxsplit=2) # maxsplit 最多分割次数
['a', 's', 'd ,,,,,asd']

6)sub(pattern,repl,string)

在字符串中将匹配项替换成目标,返回字符串

>>> re.sub('a','A','abcasd')   #找到a用A替换,后面见和group的配合使用
'AbcAsd' >>> pat = re.compile('a')
>>> pat.sub('A','abcasd')
'AbcAsd' #通过组进行更新替换:
>>> pat=re.compile(r'www\.(.*)\..{3}') #正则表达式
>>> pat.match('www.dxy.com').group(1)
'dxy'
>>> pat.sub(r'\1','hello,www.dxy.com') #通过正则匹配找到符合规则的”www.dxy.com“ ,取得组1字符串 去替换 整个匹配得到字符串。dxy -> www.dxy.com
'hello,dxy' >>> pat=re.compile(r'(\w+) (\w+)') #正则表达式
>>> s='hello world ! hello hz !'
>>> pat.findall('hello world ! hello hz !')
[('hello', 'world'), ('hello', 'hz')]
>>> pat.sub(r'\2 \1',s) #通过正则得到组1(hello),组2(world),再通过sub去替换。即组1替换组2,组2替换组1,调换位置。
'world hello!hz hello!'

7)escape(string)

特殊字符转移

>>> re.escape('www.dxy.cn')
'www\\.dxy\\.cn' #转义

注意:

a) 以上函数中只有match,search返回的是一个对象, 可以使用span,group方法

>>> pat = re.compile(r'www\.(.*)\.(.*)')       #用()表示一个组,2个组
>>> m = pat.match('www.dxy.com')
>>> m.group() #默认为0,表示匹配整个字符串
'www.dxy.com'
>>> m.group(1) #返回给定组1匹配的子字符串
'dxy'
>>> m.group(2)
'com'
>>> m.start(2) #组2开始的索引
8
>>> m.end(2) #组2结束的索引
11
>>> m.span(2) #组2开始、结束的索引
(8, 11)
>>> m1 = pat.search('www.dxy.com')
>>> m1.group()
'www.dxy.com'
>>> m1.group(1)
'dxy'
>>> m1.group(2)
'com'
>>> m1.start(2)
8

b)正则表达式内容的时候, 尽量前面添加r'表达式', 可以保证内容中的正则不会被python进行转移处理, 保持原始字符给到re引擎

使用示例:

python系统模块之re的更多相关文章

  1. python系统模块

    Python中大多数系统接口都集中在两个模块:sys和os.这么说有点过于简单化 还有一些其他的表转模块也属于这个领域他们包括: glob 用于文件名的扩展 socket 用于网络连接和进程间通信(I ...

  2. Python系统模块os.py和sys.py常用函数

    OS模块 os模块就是对操作系统进行操作,使用该模块必须先导入模块: import os #getcwd() 获取当前工作目录(当前工作目录默认都是当前文件所在的文件夹) result = os.ge ...

  3. Python—系统模块(os和sys)

    os模块 https://www.cnblogs.com/feifeifeisir/p/9519282.html sys模块 获取Python版本信息 import sys a = sys.versi ...

  4. python 系统模块 OS

    os.system("系统命令")  调用系统命令 os.system("task kill /f /im 系统的进程") 关闭系统进程 os.listdir( ...

  5. Python OS模块标准库的系统接口及操作方法

    Python OS模块标准库的系统接口及操作方法 os.name 返回当前操作系统名,定义了'posix','nt','mac','os2','ce','java'(我使用win7/python3.1 ...

  6. python一些模块的exe安装包在windows的64位系统里识别不到已安装Python目录的解决方法

    在windows里安装python一些模块时候,有时候源码安装比较困难,pip install也各种报错,这时候最喜欢用别人编译好的exe或者whl文件来安装,但是在windows的64位系统里,如果 ...

  7. Python—day17时间模块、系统模块、递推遍历、序列化

    一.time'''时间戳(timestamp):time.time()延迟线程的运行:time.sleep(secs)(指定时间戳下的)当前时区时间:time.localtime([secs])(指定 ...

  8. Python 常用系统模块整理

    Python中的常用的系统模块中部分函数等的整理 random: 随机数 sys: 系统相关 os: 系统相关的 subprocess: 执行新的进程 multiprocessing: 进程相关 th ...

  9. python模块知识二 random -- 随机模块、序列化 、os模块、sys -- 系统模块

    4.random -- 随机模块 a-z:97 ~ 122 A-Z :65 ~ 90 import random #浮点数 print(random.random())#0~1,不可指定 print( ...

  10. python常用标准库(os系统模块、shutil文件操作模块)

    常用的标准库 系统模块 import os 系统模块用于对系统进行操作. 常用方法 os模块的常用方法有数十种之多,本文中只选出最常用的几种,其余的还有权限操作.文件的删除创建等详细资料可以参考官方文 ...

随机推荐

  1. 神奇的C语言输出12天圣诞节歌词代码

    12天圣诞节程序怎样运行?1988 年,一个令人印象深刻且令人敬畏的 C 代码,代号为 xmas.c,在国际混淆 C 代码竞赛中获胜.该程序甚至比其输出的"压缩"类型还要小,代表了 ...

  2. windows server 2019 IIS网站属性上没有asp.net标签 ,aspnet_regiis -i 不能安装

    在新的服务器版本已经不能通过 aspnet_regiis -i安装了,可以通过以下语句完成: dism /online /enable-feature /featurename:IIS-ASPNET4 ...

  3. .NET 7+Angular 4 轻量级新零售进销存系统

    前言 给大家推荐一个专为新零售快消行业打造了一套高效的进销存管理系统. 系统不仅具备强大的库存管理功能,还集成了高性能的轻量级 POS 解决方案,确保页面加载速度极快,提供良好的用户体验. 项目介绍 ...

  4. dfs 【XR-2】奇迹——洛谷5440

    问题描述: 现有一个八位数,从左往右分别代表年月日,例如20240919,代表2024年9月19日,现将该八位数蒙住几位数,问填入数字之后有几种情况是的日为质数,月+日为质数,年+月+日为质数 输入: ...

  5. 解锁Java线程池:实战技巧与陷阱规避

    专业在线打字练习网站-巧手打字通,只输出有价值的知识. 一 前言 线程池作为初学者常感困惑的一个领域,本次"巧手打字通课堂"将深入剖析其中几个最为普遍的误区.为了更清晰地阐述这些知 ...

  6. volatile关键字最全原理剖析

    介绍 volatile是轻量级的同步机制,volatile可以用来解决可见性和有序性问题,但不保证原子性. volatile的作用: 保证了不同线程对共享变量进行操作时的可见性,即一个线程修改了某个变 ...

  7. ServiceMesh 2:控制面和数据面的职责(图文总结)

    ★ ServiceMesh系列 1 Service Mesh介绍 之前的章节我们详细介绍了ServiceMesh的基础知识. ServiceMesh 是最新一代的微服务架构,作为一个基础设施层,能够与 ...

  8. constexpr声明 常量表达式

      constexpr 是 C++ 中用于声明 常量表达式 的关键字,表示一个变量或函数的值在编译时就可以确定,而不是在运行时计算. 这对优化非常有用,因为编译器可以直接将结果嵌入到程序中,减少运行时 ...

  9. JDBC连接数据库(mysql)基本实现-七步

    // 包名 package com.zhulx; import java.sql.DriverAction; import java.sql.DriverManager; import java.sq ...

  10. 云原生周刊:K8s 上的 gRPC 名称解析和负载平衡

    开源项目推荐 Kraken Kraken 是一个基于 P2P 的 Docker 注册表,专注于可扩展性和可用性.它专为混合云环境中的 Docker 镜像管理.复制和分发而设计.借助可插拔的后端支持,K ...