Python正则表达式re.findall一个有趣的现象
下面通过几个案例来分析一下,
注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程》
案例一:
>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']
>>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
匹配子串group(1): 断魔归本合元神,位置为:(12, 19)
>>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
['断魔归本合元神']
案例二:
>>> re.findall("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
['神', '']
>>> parsematch("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
匹配子串group(1): 神,位置为:(18, 19)
第2次匹配,匹配情况:
匹配子串group(0): ,位置为:(19, 19)
案例三:
>>> re.findall(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
['第二回 悟彻菩提真妙理\u3000断魔归本合元神', '']
>>> parsematch(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
第1次匹配,匹配情况:
匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
第2次匹配,匹配情况:
匹配子串group(0): ,位置为:(19, 19)
>>>
案例四:
>>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
[('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
>>>
上述4个案例的前2个案例,在第一次匹配存在group(1)的情况下,findall中返回的第一个元素为group(1)的匹配子串,而group(0)的数据没有在findall中返回,而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group(0),此时findall返回的就是group(0)的整体搜索串,第4个案例返回的是group(1,2,3)。
从这几个案例的情况来看,findall在匹配后,如果匹配的子串只有一个组,则返回组0,否则返回组0后面的组,而组0不再返回。
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
请大家多多支持,点赞、评论和加关注!谢谢!
Python正则表达式re.findall一个有趣的现象的更多相关文章
- Python正则表达式re.findall("[A-Za-z]([A-Za-z0-9])*[.]txt",'Abc2019.txt')的结果为什么是['9']
在<Python妙用re.sub分析正则表达式匹配过程>中老猿分析了findall函数的返回情况,老猿前一阵子在执行这个语句时: >>> re.findall(" ...
- python正则表达式(5)--findall、finditer方法
findall方法 相比其他方法,findall方法有些特殊.它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 finda ...
- python 正则表达式 re.findall &re.finditer
语法: findall 搜索string,以列表形式返回全部能匹配的子串 re.findall(pattern, string[, flags]) finditer 搜索string,返回一个顺序访问 ...
- setInterval()与clearInterval()的一个有趣小现象
今天在使用setInterval()时,发现了一个有意思的事情 代码如下: var box=document.getElementById("box");//获取id为“box”的 ...
- java中使用split分割字符串一个有趣的现象
最近在项目中,发现了一个bug,充分了展示了自己对java底层的认知有很多的不足和欠缺. 下面有段代码: String str="1#2#3"; String[] strs=str ...
- Python正则表达式之findall疑点
在findall中使用()进行分组时,得出的结果会优先提取分组的,比如下面这个例子 In [46]: re.findall(r"www.(baidu|163).com", &quo ...
- python正则表达式应用 定义一个函数,求字符串中出现的所有整数之和
- C++语法小记---一个有趣的现象
下面的代码会飞吗? #include <iostream> #include <string> using namespace std; class Test { public ...
- Python正则表达式re模块学习遇到的问题
Python正则表达式处理的组是什么? Python正则表达式处理中的匹配对象是什么? Python匹配对象的groups.groupdict和group之间的关系 Python正则表达式re.mat ...
随机推荐
- 微信小程序获取请求数据
<%@ WebHandler Language="C#" Class="CodeTest" %> using System; using Syste ...
- Shell脚本常用命令整理
该笔记主要整理了一些常见的脚本操作命令,大致如下(持续补充中): 1. while.for循环 1. while.for循环 #!/bin/bash # while循环 v_start_date=${ ...
- Mockserver之Moco框架搭建使用
客户要求进行完整的产品展示,人员和时间都有限,来不及开发后端服务... 工期比较紧的项目,前端已开发完成,需要调试,后端接口还未开发完成... 公司某个项目依赖于第三方服务,但是第三方服务不方便频繁调 ...
- Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 前言 耗子喂汁是什么意思什么梗呢?可能很多人不知道,这个梗是出自马保国,经常上网的人可能听说过这个 ...
- 某C++神作,就100句话而已
假设p是指针,当delete p;时,后面一定要p=NULL将p指向空 cin cout cerr 都是iostream类型的对象.cout<<"hello world" ...
- TCP中RTT的测量和RTO的计算 以及 接收缓存大小的动态调整
RTT测量 在发送端有两种RTT的测量方法,但是因为TCP流控制是在接收端进行的,所以接收端也需要 有测量RTT的方法. /* Receiver "autotuning" code ...
- read/write系统调用
/*拷贝文件内容实例read系统调用.write系统调用ssize_t read(int fd, void *buf, size_t count);ssize_t write(int fd, cons ...
- centos下多网卡做bond脚本
多网卡或者单网卡形式下的网卡bonding #! /bin/sh #获取当前网卡数 ethnum=`lspci | grep Ethernet | wc -l` echo $ethnum #如果网卡数 ...
- eclipse 和 myeclipse 字符编码设置
需要设置的几处地方为: Window->Preferences->General ->Content Type 所有 Default encoding 设置为UTF-8 Window ...
- Android开发-AlertDialog,Progress,ProgressDialog,自定义layout
AlertDialog 默认样式 单选样式 多选样式 自定义样式 效果图 AlertDialog效果图 class OnClick implements View.OnClickListener ...