re模块下的常用方法
一 : re模块的查找
findall 优先级查找 返回列表 找所有的匹配项(从大段的内容中找匹配到的项目)
import re
str = "qwer asdf zxcv qwerasd"
ret =re.compile("\w+\s\w+") #第一种没有括号的
print(ret.findall(str)) # 结果 : ['qwer asdf', 'zxcv qwerassd'] str = "qwer asdf zxcv qwerasd"
ret =re.compile("(\w+)\s\w+") #第二种有一个括号的
print(ret.findall(str)) #结果 : ['qwer', 'zxcv'] str = "qwer asdf zxcv qwerasd"
ret =re.compile("((\w+)\s\w+)") #第三种有两个括号的
print(ret.findall(str)) #结果 : [('qwer asdf', 'qwer'), ('zxcv qwerassd', 'zxcv')]
search: 只匹配从左到右的第一个,得到的不是直接结果,得到的是一个变量,通过这个变量的group方法来获取结果,如果没有匹配到返回None,group会报错.
import re
ret = re.research('\d+',"sjkhk172按实际花费928")
print (ret) #内存地址,这是一个正则匹配的结果
print(ret.group()) #通过ret.group()获取真正的结果 #<_sre.SRE_Match object; span=(5, 8), match='172'> #
ret = re.search('\d','owghabDJLBNdgv')
print(ret) #None
print(ret.group()) #会报错
match:相当于search的正则表达式中加个" ^ "
import re
ret = re.match('\d+',"172sjkhk按实际花费928") #match相当于在\d前加' ^'
print(ret) #地址
print(ret.group()) #匹配到的内容 #<_sre.SRE_Match object; span=(0, 3), match='172'>
#
spile:字符串扩展的处理 替换 切割
s = 'alex|taibai|egon|'
print(s.split('|')) #结果 :['alex', 'taibai', 'egon', ''] import re
s = 'alex83taibai40egon25'
ret = re.split('\d+',s)
print(ret) #['alex', 'taibai', 'egon', '']
sub/subn :替换,按照正则规则取寻找要被替换的内容,subn返回被替换的元组,第二个值是被替换的次数
ret = re.sub('\d+','H','alex83taibai40egon25')
print(ret) ret = re.sub('\d+','H','alex83taibai40egon25',1) #这里的1是替换一次
print(ret) subn 返回一个元组#,第二个元素是替换的次数
# ret = re.subn('\d+','H','alex83taibai40egon25')
# print(ret) #alexHtaibaiHegonH #alexHtaibai40egon25 #('alexHtaibaiHegonH', 3) #这里的3是指替换了3次
compile 编译一个正则表达式用这个结果取search , match , findall , finditer 能够节省时间
ret = re.compile('\d+') #已经完成编译 res = ret.findall('alex83taibai40egon25')
print(res) #['83', '40', '25'] res = re.search('sjkhk172按实际花费928')
print(res) #
finditer 节省你使用正则表达式解决问题的空间/内存
返回一个迭代器,所有的结果都在这个迭代器中,需要
ret = re.finditer('\d+','alex83taibai40egon25')
for i in ret:
print(i.group()) #
#
#
总结:
#findall 返回列表 找所有的匹配项
# search 匹配就 返回一个变量,通过group取匹配到的第一个值,不匹配就返#回None,group会报错
# match 相当于search的正则表达式中加了一个'^' # spilt 返回列表,按照正则规则切割,默认匹配到的内容会被切掉
# sub/subn 替换,按照正则规则去寻找要被替换掉的内容,subn返回元组,第二#个值是替换的次数 # compile 编译一个正则表达式,用这个结果去search match findall #finditer 能够节省时间
# finditer 返回一个迭代器,所有的结果都在这个迭代器中,需要通过循环#+group的形式取值 能够节省内存
re模块下的常用方法的更多相关文章
- re模块下的的常用方法
引入模块: import re 1.查找findall 匹配所有,每一项都是列表中的一个元素 ret=re.findall("\d+","sjkhk172按实际花费9 ...
- Flex4分模块下样式动态加载步骤及相关问题的解决
1. 给应用程序编写CSS文件 (1)在项目下创建CSS文件(任意路径,可以多个).本例在src下创建了5个样式文件 (2)Flex支持的CSS文件定义如下: a) type selector(类 ...
- thinkphp6.0 多应用模块下提示控制器不存在
thinkphp6.0 多应用模块下提示控制器不存在 在项目根目录下使用Composer composer require topthink/think-multi-app 参考链接
- python学习笔记五 模块下(基础篇)
shevle 模块 扩展pickle模块... 1.潜在的陷进 >>> import shelve>>> s = shelve.open("nb" ...
- phpcms v9 源码解析(4)content模块下的index.php文件的init()方法解析
在了解index.php中的init函数的时候,让我们先看看最开始的几行代码 1-5 第二行, defined('IN_PHPCMS') or exit('Nopermission resource ...
- “死锁” 与 python多线程之threading模块下的锁机制
一:死锁 在死锁之前需要先了解的概念是“可抢占资源”与“不可抢占资源”[此处的资源可以是硬件设备也可以是一组信息],因为死锁是与不可抢占资源有关的. 可抢占资源:可以从拥有他的进程中抢占而不会发生副作 ...
- 摘要算法---hashlib模块下MD5和SHA的使用
作用: 任意长度的字符串内容通过摘要算法都可以生成唯一序列摘要值,通过摘要算法,可以校验某个文档或者某组字符串是否被修改. 应用: 1.文件内容一致性校验 2.用户登录验证 常用方法 update() ...
- Yii2访问自定义模块下的controller
之前,由于所要访问的controller都是位于根目录下的controllers目录下,就像下面这样: 此时,我们可以直接通过 localhost/basic/web/index.php?r=dao/ ...
- SpringBoot(九):多模块下mapper分散后无法启动SpringBoot解决方法
问题描述: SpringBoot项目之前是一个项目*-web,运行没问题,后来将项目拆分为多个项目,就出现启动失败问题. SpringBoot项目结构: 项目被分为多块:*-mapper(mybati ...
随机推荐
- macbook双网卡路由
用route命令可以解决,步骤如下:1)确定你内网的网段,如果有多个都一一列出来,例如:192.168.1.0/24,10.20.0.0/16等 2)确定你内网网卡的网关IP,通过netstat -r ...
- Java问题解读系列之IO相关---Java深拷贝和浅拷贝
前几天和棒棒童鞋讨论Java(TA学的是C++)的时候,他提到一个浅拷贝和深拷贝的问题,当时的我一脸懵圈,感觉自己学Java居然不知道这个知识点,于是今天研究了一番Java中的浅拷贝和深拷贝,下面来做 ...
- [jnhs]未完待续HttpServletRequest示例
uri: /kaihu/showip.html method: GET QueryString: null Parameters: Headers: Name: host Value: localho ...
- linux查看现在在运行的进程 $ pstree -a$ ps aux
这都是查看现有进程的. ps aux 的结果比较杂乱 pstree -a 的结果比较简单明了,可以看到正在运行的进程及相关用户.
- 开发者必看!探秘阿里云Hi购季开发者分会场:海量学习资源0元起!
摘要: 开发者分会场致力于帮助开发者学习了解阿里云最新技术,为开发者设计全方位的技术成长与进阶之路. 2019阿里云云上Hi购季活动已经于2月25日正式开启,从已开放的活动页面来看,活动分为三个阶段: ...
- Vue--findIndex方法的使用原理
原理: // 根据id得到下标 // 默认去遍历list集合,将集合中的每个元素传入到function的item里, var index = this.list.findIndex(function( ...
- hack 记录
0.寻找信号强的wifi,对于隐藏ssid 的可通过嗅探 1.wifi密码:wifi万能钥匙.minidwep-gtk.aircrack-ng 2.对于绑定mac地址的安全设置,可通过对活动的客户端网 ...
- 多线程 多进程 协程 Queue(爬虫代码)
快速理解多进程与多线程以及协程的使用场合和特点 首先我们来了解下python中的进程,线程以及协程! 从计算机硬件角度: 计算机的核心是CPU,承担了所有的计算任务.一个CPU,在一个时间切片里只能运 ...
- 笔试面试记录-字符串转换成整型数等(aatoi,itoa)
C语言中经常用到字符串与数字之间的相互转换,常见的此类库函数有atof(字符串转换成浮点数).atoi(字符串转换成整型数).atol(字符串转换成长整形).itoa(整型数转换成字符串).ltoa( ...
- web服务器与tomcat
web服务器与tomcat 服务器分类: 硬件服务器和软件服务器 web服务器: 提供资源供别人访问 web: 网页的意思,资源. web资源分类: 动态的web资源:内容有可能发生改变的 静态的we ...