1)

用管道符号(|)匹配多个正则表达式

举例

at | home     匹配 at, home

2)

匹配任意一个单个的字符(.)

举例

f.o  匹配在“f”和"o"中间的任何字符,如fao, f9o, f#o等

3)

从字符穿的开头或结尾或单词边界开始匹配(^/$/\b\B)

\b匹配的模式是一个单词边界,与之对应的模式一定在一个单词的开头;

\B只匹配出现在一个单词中间的模式,即不在单词边界上的字符。

举例

^From  匹配任何以From开始的字符串

/bin/tcsh$ 匹配任何以/bin/tcsh结束的字符串

^subject: hi$ 匹配仅由subject: hi组成的字符串

the   任何包含有“the”的字符串

\bthe 任何以“the”开始的字符串

\bthe\b 仅匹配单词“the”

4)创建字符类([])

使用方括号的正则表达式会匹配方括号里的任何一个字符。

方括号只有逻辑或的功能。

举例:

b[aeiu]t  匹配字符串 bat, bet, bit, but

[cr][23][dp][o2] 匹配字符串有16个组合,先[cr]选一个,接着[23]选一个,......,最后[o2]选一个。

5)指定范围(-)和否定(^)

方括号里一对符号中间的连字符(-)用来表示一个字符的范围。如[0-9],匹配十进制数

左方括号后第一个字符是上箭头符号(^),表示不匹配制定字符集里的任意字符。如[^aeiou],匹配一个非元音字符

6)使用闭包操作符(*, +, ? {})实现多次出现/重复匹配

*:  匹配它左边那个正则表达式出现0次或0次以上的情况;

+: 匹配它左边那个正则表达式至少出现一次的情况;

?:   匹配它左边那个正则表达式模式出现0次或一次的情况。

{}: 如{M}表示匹配M次出现的情况,{M,N}表示匹配M次到N次出现的情况。

[dn]ot? 匹配最多有一个字符“t”,即 do, no, dot, not.

[0-9]{15, 16} 匹配15或者16位数字,例如信用卡号码

</?[^>]+> 匹配所有合法的HTML标签的字符串,即<...>、</...>。

7)特殊字符

一些特殊字符可以用来代表字符集合。

\d:  表示[0-9]

\w: 表示[A-Za-z0-9]

\s:  表示空白字符

\D:  表示非十进制数字的字符,即[^0-9]

举例:

\w+-\d+ 表示一个字母和数字组成的字符串和至少一个数字,例如:ABCD-9

\d{3}-\d{3}-\d{4} 例如 800-555-1212

\w+@\w+\.com 例如xxxx@yyyy.com

8)用圆括号(())组建组

我们不仅想知道是否整个字符串匹配正则表达式,还想在匹配成功时取出某个特定的字符串或子字符串。

()的功能:

对正则表达式进行分组

匹配子组

举例:

m = re.match('(a(b))', 'ab') 两个子组

m.group() 所有匹配部分

m.group(1) 匹配的子组1 输出‘ab’

m.group(2) 匹配的子组2 输出'b'

m.groups() 所有匹配的子组的元组 输出 ('ab', 'b')

re模块:核心函数和方法

complie(pattern, flags=0)

对正则表达式模式pattern进行编译,flags是可选标识符,并返回一个regex对象

re模块的函数和regex对象的方法

match(pattern, string, flags=0)

尝试用正则表达式模式pattern匹配字符串string,flags是可选标识符,如果匹配成功,则返回一个匹配对象;否则返回None

search(pattern, string, flags=0)

在字符串string中搜索正则表达式模式pattern的第一次出现,如果匹配成功,则返回一个匹配对象;否则返回None

findall(pattern, string[,flags])

在字符串中搜索正则表达式模式pattern的所有出现(非重复),返回一个匹配对象的列表

finditer(pattern, string[,flags])

和findall()相同,但返回的不是列表而是迭代器;对于每个匹配,该迭代器返回一个匹配对象

split(pattern, string, max=0)

根据正则表达式pattern中的分隔符把字符string分割为一个列表,返回成功匹配的列表,最多分割max次

sub(pattern, repl, string, max=0)

把字符串string中所有匹配正则表达式pattern的地方替换成字符串repl,如果max的值没有给出,则对所有匹配的地方进行替换

匹配对象的方法

group(num=0) 返回全部匹配对象

groups()  返回一个包含全部匹配的子组的元组

匹配多个字符串( | )

bt = 'bat|bet|bit'

m = re.match(bt, 'bat')

重复、特殊字符和子组

patt = '\w+@(\w+\.)?\w+\.com'

m = re.match(patt, 'nobody@xxx.com').group()

if m is not None: m.group()

输出: 'nobody@xxx.com'

m = re.match('(\w\w\w)-(\d\d\d)', 'abc-123')

m.group()  输出 'abc-123'

m.group(1) 输出'abc'

m.group(2) 输出‘123’

m.groups() 输出(‘abc’, '123')

python之正则表达式的更多相关文章

  1. [python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】

    [python] 常用正则表达式爬取网页信息及分析HTML标签总结 转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...

  2. Python 进阶 - 正则表达式

    1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...

  3. python study - 正则表达式

    第 7 章 正则表达式 7.1. 概览 7.2. 个案研究:街道地址 7.3. 个案研究:罗马字母 7.3.1. 校验千位数 7.3.2. 校验百位数 7.4. 使用 {n,m} 语法 7.4.1. ...

  4. python使用正则表达式文本替换

    2D客户端编程从某种意义上来讲就是素材组织,所以,图片素材组织经常需要批量处理,python一定是最佳选择,不管是win/linux/mac都有一个简单的运行环境 举两个应用场景: 如果不是在某个文件 ...

  5. python的正则表达式 re

    python的正则表达式 re 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一 ...

  6. Python之正则表达式(re模块)

    本节内容 re模块介绍 使用re模块的步骤 re模块简单应用示例 关于匹配对象的说明 说说正则表达式字符串前的r前缀 re模块综合应用实例 正则表达式(Regluar Expressions)又称规则 ...

  7. Python:正则表达式详解

    正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能 ...

  8. 【Python】正则表达式纯代码极简教程

    <Python3正则表达式>文字版详细教程链接:https://www.cnblogs.com/leejack/p/9189796.html ''' 内容:Python3正则表达式 日期: ...

  9. 【Python】正则表达式简单教程

    说明:本文主要是根据廖雪峰网站的正则表达式教程学习,并根据需要做了少许修改,此处记录下来以备后续查看. <Python正则表达式纯代码极简教程>链接:https://www.cnblogs ...

  10. 【转】Python之正则表达式(re模块)

    [转]Python之正则表达式(re模块) 本节内容 re模块介绍 使用re模块的步骤 re模块简单应用示例 关于匹配对象的说明 说说正则表达式字符串前的r前缀 re模块综合应用实例 参考文档 提示: ...

随机推荐

  1. css 笔记

    外边距合并 当一个元素出现在另一个元素的上面时,第一个元素的下外边距和第二个元素的上外边距会产生合并,两个盒子之间的上下间距为大的数值. 当一个子元素包含在另外一个父元素(假设没有内边距 没有边框), ...

  2. ad画fpc

    得到新技能 后记: 实际情况,复杂很多pin的fpc 都是用cad画的.我明天学...

  3. (转)整体把握jQuery -jQuery 的原型关系图

    整体把握jQuery -jQuery 的原型关系图 (原)http://www.html5cn.org/article-6529-1.html 2014-7-2 17:12| 发布者: html5cn ...

  4. 基于css3实现手风琴效果

    终于在凌晨一点钟逼迫自己写博客.一直想记录自己的前端工程师之路,但毕竟拖延症晚期.因为第一篇随笔,所以多写一点废话吧.刚刚从学校毕业,放弃了一直学习的java,而想从事前端的工作.第一是觉得osgi这 ...

  5. [Python学习笔记1]Python语言基础 数学运算符 字符串 列表

    这个系列是我在学习Python语言的过程中记录的笔记,主要是一些知识点汇总,而非学习教程,可供有一定编程基础者参考.文中偏见和不足难以避免,仅供参考,欢迎批评指正. 本系列笔记主要参考文献是官网文档: ...

  6. bookstore网上书店测试缺陷报告2

    Bookstore网上书店系统测试缺陷报告   缺陷编号 01.01.0002 发现人 吴赵昕 记录日期 2016-06-10 所属模块 购物车 确认人 吴赵昕 确认日期 2016-06-10 当前状 ...

  7. unity文件解析以及版本控制

    刚开始使用unity做开发时,拿到一个范例工程先上传SVN,之后再自己做一些修改后,发现有非常多文件都有变化,这才知道有很多本地生成的文件,是不用上传的,但是不知道哪些才是需要共用的.之后又困扰于修改 ...

  8. Data Big Bang

    在过去的五十多年中,我们可以较为直观地看到IT行业正以蓬勃发展之势渗入到我们生活的方方面面.虽经历过几轮新兴和重叠的技术浪潮,但每一波浪潮都伴随着新兴技术的革新.IT供应商主导着互联网的走向,网络秩序 ...

  9. iOS信号量的使用

    Core Audio render thread and thread signalling up vote2down votefavorite   Does iOS have any kind of ...

  10. Html.RenderPartial与Html.RenderAction

    Html.RenderPartial与Html.RenderAction的区别     Html.RenderPartial与Html.RenderAction这两个方法都是用来在界面上嵌入用户控件的 ...