玩弄 python 正则表达式
这里记录一个我常用的模型,每次久了不使用正则就会忘记。
记得最好玩的一句关于正则表达式的话就是 当你想到一件事情可以用正则表达式解决的时候 现在你就面临了两个问题了。
python里面使用了re模块对正则表达式进行了集成。
下面来匹配这样一段话作为例子
"JD请求异常返回: 商品列表中含有不能购买的商品[1322410]" 注意这个括号里面的数字是随机的
匹配方法1.
使用re.match方法这个方法如果匹配成功将返回一个匹配成功的对象可以使用对象的相关方法提取内容,如果没有匹配到将会返回None.
如我使用下面代码:
import re
haha = re.match("JD请求异常返回: 商品列表中含有不能购买的商品\[(\d+)\]", "JD请求异常返回: 商品列表中含有不能购买的商品[1322410]", )
print haha.group(0) 打印:
JD请求异常返回: 商品列表中含有不能购买的商品[1322410]
匹配方法2.
使用re.compile先创建一个partten,之后方便直接使用相关方法例如:
import re
group_by_regex = re.compile("JD请求异常返回: 商品列表中含有不能购买的商品\[(\d+)\]")
text = "JD请求异常返回: 商品列表中含有不能购买的商品[1322410]"
m = group_by_regex.search(text)
result = m.group(1)
这里必须多阐述一下,其实在上面匹配方法一中的第一个入参就是一个pattern,一个匹配模式。这里匹配方法二中我们首先创建了一个正则表达式的匹配模式group_by_regex。然后使用这个匹配模式的方法的search查找到第一个符合的对象就返回。
这里还有个需要注意的地方上面的match 和 这里的search有什么区别呢。
match是必须从开始就匹配上才算,而search不管这么多,他会扫描整个处理串里面有没有这个匹配对象而不必担心他是不是从头开始的。
那么如果想匹配对象中所有符合条件的呢?可以使用findall方法。
下面我们来看一些python里面特有的正则表现,比如说命名正则。
r'^actions/rate/(?P<model>\w+)/(?P<pk>[\w|\d]+)/-/(?P<location>\w+)/$
这里先重点来看这一句
/?P<model>\w+/
?P开头是一个python里独有的扩展语法,是python的命名组语法。有点像()捕捉器,但是是可以从model这个名字里面读取的。这句话就是<model> 是 w(类似但不等价于“[A-Za-z0-9_])类型的字符,捕捉1个或者多个。
知道了这个我来一并解释整句正则想要匹配什么。
/(?P<pk>[\w|\d]+)/-/(?P<location>\w+)/$
后面继续使用python命名组语法匹配pk,[\w|\d]+ 是匹配 [A-Za-z0-9_]其中的数字一个或者多个。其实这里写得应该有点问题,\w是包含\d的应该不用选择直接使用\w+就可以了。后面的/-/直接匹配“-”,然后后面又是一个命名组匹配location。这种语法在django的url模版的里面应该经常能见到。
更多处理方法可以参考python文档,最常用的就上面两种方法。
更加复杂和全面的用法可以参考引用2.
Reference:
http://www.cnblogs.com/sevenyuan/archive/2010/12/06/1898075.html
http://www.jb51.net/article/50511.htm python正则表达式re模块详细介绍
玩弄 python 正则表达式的更多相关文章
- Python 正则表达式入门(中级篇)
Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...
- Python正则表达式中的re.S
title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...
- Python 正则表达式入门(初级篇)
Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...
- python正则表达式re
Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...
- Python正则表达式详解
我用双手成就你的梦想 python正则表达式 ^ 匹配开始 $ 匹配行尾 . 匹配出换行符以外的任何单个字符,使用-m选项允许其匹配换行符也是如此 [...] 匹配括号内任何当个字符(也有或的意思) ...
- 比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
- Python正则表达式学习摘要及资料
摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...
- python正则表达式 小例几则
会用到的语法 正则字符 释义 举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...
- Python 正则表达式-OK
Python正则表达式入门 一. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...
随机推荐
- 流程控制之for
for循环是 迭代式循环,其强大之处在于循环取值 用法一: l = [1, 2, 3, 4, 5, 5, 6, 5, 4, 3] for x in l: print(x) info = {'} for ...
- Git使用—第一讲:初识版本控制工具
几乎所有出色的项目都不是一个人完成的,而是由一个团队共同合作开发完成的,这个时候多人之间的代码同步问题就显得异常重要了,因此版本控制工具也就应运而生了.常见的版本控制工具主要有SVN和Git,接下来要 ...
- C语言程序设计II—第四周教学
第四周教学总结(18/3-24/3) 教学内容 本周的教学内容为:第七章 数组 7.2 二维数组 课前准备 在博客园发布作业:2019春第四周作业 第三周作业讲解视频:A Programing Vid ...
- springMVC中上传图片
上传图片,很常见的问题,基本每个人都会遇到,但是个人认为在springMVC中上传图片相对来说是比较简单的,因为框架已经帮我们做好了许多事情. 这篇文章所用的环境:spring4.3.3 .jdk1. ...
- this computer meets the requirements for HAXM,but intel Virtualization Technology (VT-x) is not turned on
this computer meets the requirements for HAXM,but intel Virtualization Technology (VT-x) is not turn ...
- statefulSet 原理理解
1. svc(vip) -- deployment 2.headless(none) -- ...
- C#以管理员用户打开某个程序
static void Main(string[] args) { string path = @"C:\Windows\AppPatch\AppLoc.exe"; Process ...
- React-使用styled-components
1.安装 npm install --save styled-components 2.简单使用 style.js: import styled from 'styled-components'; i ...
- 重装系统之无法在驱动器0的分区1上安装windows
在通过U盘或光盘安装win8/win8.1/win10 时,遇到无法安装的问题,提示“无法在驱动器0的分区1上安装windows”,格式化分区也不能解决,进而提示Windows无法安装到这个磁盘,选中 ...
- [Spark][python]从 web log 中提取出 UserID 作为key 值,形成新的 RDD
针对RDD, 使用 keyBy 来构筑 key-line 对: [training@localhost ~]$ cat webs.log 56.31.230.188 - 90700 "GET ...