分组在re模块中的使用以及使用正则表达式的技巧

1.split:切割

使用split不会返回被切割的字符

 import re

 ret = re.split("\d+","5as46asf46asf46a")

 print(ret)

结果为:['', 'as', 'asf', 'asf', 'a']

要想返回被切割的数字,需要在正则表达式前后加( )

 import re

 ret1 = re.split("(\d+)","5as46asf46asf46a")

 print(ret1)

结果为:['', '5', 'as', '46', 'asf', '46', 'asf', '46', 'a']

2.分组命名:(?P<这个组的名字>正则表达式)

 import re

 s = "<a>wahaha</a>"

 ret = re.search("<\w+>(?P<abc>\w+)</\w+>",s)

 print(ret.group())#结果为<a>wahaha</a>

 print(ret.group("abc"))#结果为wahaha

3.使用findall可以取到分组中的内容,在表达式中加( )可以优先显示分组中的内容

 import re

 s = "<a>wahaha</a>"

 ret = re.findall("<\w+>(\w+)</\w+>",s)

 print(ret)#结果为["wahaha"]

如果要取消分组优先,使用(?:正则表达式)

 import re

 s = "<a>wahaha</a>"

 ret = re.findall("<\w+>(\w+)</\w+>",s)

 ret1 = re.findall("<\w+>(?:\w+)</\w+>",s)

 print(ret)#结果为["wahaha"]

 print(ret1)#结果为["<a>wahaha</a>"]

在网页html中,如果使用分组,要求使用这个名字的分组和前面的同名分组中的内容匹配的必须一致

前一个标签可以用?P<tab>,后一个标签可以用?P=tab

import re
1 pattern = "<(?P<tab>\w+)>(\w+)</(?P=tab)>"

 ret = re.search(pattern,s)

 print(ret.group())#结果为:<a>wahaha</a>

 import re

 ret1 = re.findall(r"\d+\.\d+|\d+","1-2*(60+(-40.35/5)-(-4*3))")

 print(ret1)结果为:['1', '2', '60', '40.35', '5', '4', '3']

如果要过滤掉小数:

 import re

 ret2 = re.findall(r"\d+\.\d+|(\d+)","1-2*(60+(-40.35/5)-(-4*3))")

 print(ret2)结果为:['1', '2', '60', '', '5', '4', '3']

分组在re模块中的使用以及使用正则表达式的技巧的更多相关文章

分组在re模块中的使用
import re #search s = "<a>wahaha</a>" #标签语言 html 和 web相关 ret= re.search(" ...
python基础:os模块中关于文件/目录常用的函数使用方法
Python是跨平台的语言,也即是说同样的源代码在不同的操作系统不需要修改就可以同样实现因此Python的作者就倒腾了OS模块这么一个玩意儿出来,有了OS模块,我们不需要关心什么操作系统下使用什么模 ...
os模块中关于文件/目录常用的函数使用方法
os模块中关于文件/目录常用的函数使用方法函数名使用方法 getcwd() 返回当前工作目录 chdir(path) 改变工作目录 listdir(path='.') 列举指定目录中的文件名('. ...
18 os/os.path模块中关于文件/目录常用的函数使用方法（转）
os模块中关于文件/目录常用的函数使用方法函数名使用方法 getcwd() 返回当前工作目录 chdir(path) 改变工作目录 listdir(path='.') 列举指定目录中的文件名('. ...
os、os.path模块中关于文件、目录常用的函数使用方法
os模块中关于文件/目录常用的函数使用方法函数名使用方法 getcwd() 返回当前工作目录 chdir(path) 改变工作目录 listdir(path='.') 列举 ...
python编程os、os.path 模块中关于文件、目录常用的函数使用方法
os模块中关于文件/目录常用的函数使用方法函数名使用方法 getcwd() 返回当前工作目录 chdir(path) 改变工作目录 listdir(path='.') 列举指定目录中的文件名( ...
re模块中的非贪婪匹配
python的re模块中有贪婪匹配和非贪婪匹配之分,当使用*时会匹配零个或多个,使用+时会匹配一个或多个.当使用?在前边特殊符号前时会进行非贪婪匹配,匹配零个或者一个,今天主要讨论非贪婪匹配中存在的坑 ...
0802_转载-nn模块中的网络层介绍
0802_转载-nn 模块中的网络层介绍目录一.写在前面二.卷积运算与卷积层 2.1 1d 2d 3d 卷积示意 2.2 nn.Conv2d 2.3 转置卷积三.池化层四.线性层五.激活函 ...
Nginx基础知识之————RTMP模块中的中HLS专题（翻译文档）
一.在Nginx配置文件的RTMP模块中配置hls hls_key_path /tmp/hlskeys; 提示错误信息: nginx: [emerg] the same path name " ...

随机推荐

编译Qt5.0连接MySql5.5数据库的驱动（5.0版本的编译，我记得5.2开始自带了）
第一步 1.准备好Mysql数据库安装文件,Qt5.0完整的离线安装包,以及Qt5.0的完整的源代码.安装好程序,假设Mysql的安装路径为:C:\MySQL5.5,Qt5.0的安装路径:C:\Qt\ ...
Qt信号量QSemaphore（在线程里使用，结合生产者消费者的问题）
Qt中的信号量是由QSemaphore类提供的,信号量可以理解为对互斥量功能的扩展,互斥量只能锁定一次而信号量可以获取多次,它可以用来保护一定数量的同种资源.acquire()函数用于获取n个资源,当 ...
这里有123个黑客必备的Python工具！
123个Python渗透测试工具,当然不仅于渗透~ 如果你想参与漏洞研究.逆向工程和渗透,我建议你时候用Python语言.Python已经有很多完善可用的库,我将在这里把他们列出来. 这个清单里的工具 ...
ansible(三)
一.setup模块(收集信息 ) 1.ansible中的setup模块可以收集到的信息 ansible web -m setup ansible_all_ipv4_addresses # ipv4的所 ...
Python基础(六) 函数
.函数函数是对动作的封装 2.1函数的基本结构 #函数的定义 def 函数名(): #函数提 pass #函数的执行函数名() 2.2参数初识 #形参 def hanshu(aaa): #参数相当 ...
dedecms自学
[dedecms笔记] index.htm 主页模板head.htm 列表头部模板footer.htm ...
深入理解Java虚拟机（字节码执行引擎）
深入理解Java虚拟机(字节码执行引擎) 本文首发于微信公众号:BaronTalk 执行引擎是 Java 虚拟机最核心的组成部分之一.「虚拟机」是相对于「物理机」的概念,这两种机器都有代码执行的能力, ...
不用 qlv 格式转换成 mp4 - 优雅的下载腾讯视频（mp4 格式）
不用 qlv 格式转换成 mp4 - 优雅的下载腾讯视频(mp4 格式) 问题描述: 朋友说离线腾讯视频是 qlv 格式的,只能使用腾讯视频软件打开.让我帮忙想想办法,能不能将 qlv 格式转换成 m ...
vue数据加载等待组件
关于loading组件的. loading.vue <template> <div class="loading"> <div class=" ...
Java学习笔记——I/O流常用类之间的继承关系及构造方法
朝辞白帝彩云间,千里江陵一日还. 两岸猿声啼不住,轻舟已过万重山. ——早发白帝城总结一下有哪些I/O流: 输入流方法主要是read()和close(),输出流方法主要是write().flush( ...

分组在re模块中的使用以及使用正则表达式的技巧

分组在re模块中的使用以及使用正则表达式的技巧的更多相关文章

随机推荐

热门专题