玩弄 python 正则表达式
这里记录一个我常用的模型,每次久了不使用正则就会忘记。
记得最好玩的一句关于正则表达式的话就是 当你想到一件事情可以用正则表达式解决的时候 现在你就面临了两个问题了。
python里面使用了re模块对正则表达式进行了集成。
下面来匹配这样一段话作为例子
"JD请求异常返回: 商品列表中含有不能购买的商品[1322410]" 注意这个括号里面的数字是随机的
匹配方法1.
使用re.match方法这个方法如果匹配成功将返回一个匹配成功的对象可以使用对象的相关方法提取内容,如果没有匹配到将会返回None.
如我使用下面代码:
import re
haha = re.match("JD请求异常返回: 商品列表中含有不能购买的商品\[(\d+)\]", "JD请求异常返回: 商品列表中含有不能购买的商品[1322410]", )
print haha.group(0) 打印:
JD请求异常返回: 商品列表中含有不能购买的商品[1322410]
匹配方法2.
使用re.compile先创建一个partten,之后方便直接使用相关方法例如:
import re
group_by_regex = re.compile("JD请求异常返回: 商品列表中含有不能购买的商品\[(\d+)\]")
text = "JD请求异常返回: 商品列表中含有不能购买的商品[1322410]"
m = group_by_regex.search(text)
result = m.group(1)
这里必须多阐述一下,其实在上面匹配方法一中的第一个入参就是一个pattern,一个匹配模式。这里匹配方法二中我们首先创建了一个正则表达式的匹配模式group_by_regex。然后使用这个匹配模式的方法的search查找到第一个符合的对象就返回。
这里还有个需要注意的地方上面的match 和 这里的search有什么区别呢。
match是必须从开始就匹配上才算,而search不管这么多,他会扫描整个处理串里面有没有这个匹配对象而不必担心他是不是从头开始的。
那么如果想匹配对象中所有符合条件的呢?可以使用findall方法。
下面我们来看一些python里面特有的正则表现,比如说命名正则。
r'^actions/rate/(?P<model>\w+)/(?P<pk>[\w|\d]+)/-/(?P<location>\w+)/$
这里先重点来看这一句
/?P<model>\w+/
?P开头是一个python里独有的扩展语法,是python的命名组语法。有点像()捕捉器,但是是可以从model这个名字里面读取的。这句话就是<model> 是 w(类似但不等价于“[A-Za-z0-9_])类型的字符,捕捉1个或者多个。
知道了这个我来一并解释整句正则想要匹配什么。
/(?P<pk>[\w|\d]+)/-/(?P<location>\w+)/$
后面继续使用python命名组语法匹配pk,[\w|\d]+ 是匹配 [A-Za-z0-9_]其中的数字一个或者多个。其实这里写得应该有点问题,\w是包含\d的应该不用选择直接使用\w+就可以了。后面的/-/直接匹配“-”,然后后面又是一个命名组匹配location。这种语法在django的url模版的里面应该经常能见到。
更多处理方法可以参考python文档,最常用的就上面两种方法。
更加复杂和全面的用法可以参考引用2.
Reference:
http://www.cnblogs.com/sevenyuan/archive/2010/12/06/1898075.html
http://www.jb51.net/article/50511.htm python正则表达式re模块详细介绍
玩弄 python 正则表达式的更多相关文章
- Python 正则表达式入门(中级篇)
Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...
- Python正则表达式中的re.S
title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...
- Python 正则表达式入门(初级篇)
Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...
- python正则表达式re
Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...
- Python正则表达式详解
我用双手成就你的梦想 python正则表达式 ^ 匹配开始 $ 匹配行尾 . 匹配出换行符以外的任何单个字符,使用-m选项允许其匹配换行符也是如此 [...] 匹配括号内任何当个字符(也有或的意思) ...
- 比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
- Python正则表达式学习摘要及资料
摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...
- python正则表达式 小例几则
会用到的语法 正则字符 释义 举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...
- Python 正则表达式-OK
Python正则表达式入门 一. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...
随机推荐
- 编写简单Linux内核模块
模块代码如下 //main.c #include <linux/kernel.h> #include <linux/module.h> #include <linux/i ...
- MySQL(八)子查询和分组查询
一.子查询 1.子查询(subquery):嵌套在其他查询中的查询. 例如:select user_id from usertable where mobile_no in (select mobil ...
- wifidog源码分析 - 认证服务器心跳检测线程
引言 但wifidog启动时,会自动启动认证服务器心跳检测线程,此线程默认每隔60s与认证服务器交互一次,会将路由器的信息(系统启动时长,内存使用情况和系统平均负载)告知认证服务器,并通过一个&quo ...
- SkylineGlobe 如何二次开发获取三维模型的BBOX和设置Tint属性
测试模型类型选择TerrainModel和Feature两种,测试代码如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transiti ...
- [01-01] 示例:用Java爬取新闻
1.分析url <空港双流>数字报刊,访问地址为:http://epaper.slnews.net.cn,现在为了抓取每篇新闻的网页内容. 在浏览器访问该链接后,发现链接出现了变化,看样子 ...
- 如何让.NET Core支持GB2312和GBK
在.NET Core中,默认是不支持GB2312和GBK编码的. 例如我们如果新建一个.NET Core控制台项目,然后在其Main方法中使用如下代码: using System; using Sys ...
- Struts学习总结-02 上传文件
Struts 2框架提供了内置支持处理文件上传使用基于HTML表单的文件上传.上传一个文件时,它通常会被存储在一个临时目录中,他们应该由Action类进行处理或移动到一个永久的目录,以确保数据不丢失. ...
- Scala学习(七)---包和引入
包和引入 摘要: 在本篇中,你将会了解到Scala中的包和引入语句是如何工作的.相比Java不论是包还是引入都更加符合常规,也更灵活一些.本篇的要点包括: 1. 包也可以像内部类那样嵌套 2. 包路径 ...
- RHEL7基本命令
Terminal TTY TTY是TeleTYpe的一个老缩写. Teletypes,或者teletypewriters,原来指的是电传打字机,是通过串行线用打印机键盘通过阅读和发送信息的东西,和古老 ...
- pandas:解决groupby().apply()方法打印两次
对于以下dataframe执行dataframe.groupby(['name', 'course']).apply(lambda x: test(x)) 操作 其中test(x)函数为: def t ...