re 模块

参考:Python3 如何优雅地使用正则表达式(详解系列)  

   Python3 正则表达式特殊符号及用法(详细列表)    (出处: 鱼C论坛)

正则表达式

常用元字符:
. ^ $ * + ?  {  } [  ] \ | (  )         

* 表示匹配0次或多次
+ 表示匹配1次或多次
? 表示匹配0次或1次
{m,n} 表示匹配m到n次(前四个加'?'实现非贪婪匹配)
| 表示或操作
^ 匹配字符串的起始位置
$ 匹配字符串的结束位置

\(元字符)    ---去除元字符的特殊功能,表示匹配正常字符

\(普通字符)    ----实现特殊功能

         (普通字符小写,表示肯定,普通字符大写,表示非    e.g. \d相当于[0-9]   \D相当于[^0-9])

\d 相当于[0-9]
\s 匹配任何空白字符,相当于[\t\n\r\f\v]
\w 匹配任何单词字符
\b 匹配单词的开始或结束,表示单词边界
\Z 只匹配字符串的结束位置

python字符串与正则表示字符串有冲突,如\b(python字符串表示ASCII码8制表符,而正则表达式则表示匹配单词的开始或结束),在python中书写正则表示式时,要使用python的原始字符串,即添加'r'前缀。 

Python 中正则表达式的扩展语法('...'表示正常的正则表达式):

  (?:...)      表示非捕获组,非捕获组不会影响其他组的序号

  (?P<name>...)  表示命名组,反向引用(?P=name)

  前向断言(零宽,即断言不会被匹配到结果字符串中,也不会消耗字符串):即断言在此位置的后面匹配的是...的内容(在断言字符串的前面,故称前向断言)

    (?=...)    表示肯定,匹配成功表示成功,否则失败。

    (?!...)    表示否定, 匹配失败表示成功,否则失败

      e.g.  .*[.](?!bat$).*$  匹配文件扩展名不为'bat'的文件

  后向断言(零宽,即断言不会被匹配到结果字符串中,也不会消耗字符串):即断言在此位置的前面匹配的是...的内容(在断言字符串的后面,故称后向断言)

    (?<=...)   表示肯定,匹配成功表示成功,否则失败。

    (?<!...)   表示否定, 匹配失败表示成功,否则失败

  条件匹配:  

    (?(id/name)Y|N)       ,如果id 或者name匹配,则匹配'Y',否则,匹配'N'

  字符串替换的引用:

    \g序号  或  \g<序号>    推荐用第二种方法,防止歧义

    \g<name>         用命名组的方式引用

      

python中使用正则表达式:(re module)

1.调用全局函数:

match(), search(), findall()

参数:(正则表达式, 匹配字符串[,匹配标志])

ASCII, A 使得转义符号如\w, \b, \s, \d只能匹配ASCII字符
DOTALL, S 使得. 匹配任何符号,包括换行符
IGNORECASE, I 匹配不区分大小写
LOCALE, L 支持当前的语言设置
MULTILINE, M   多行匹配
VERBOSE, X 启用详细的正则表达式(增加正则表达式的可读性,匹配时忽略' '和'\n' )

2.创建模式对象:

p = re.compile(正则表达式[,匹配标志])

然后调用对象的方法。

详见python标准文档。

python全局函数和对象方法中返回的match对象,设为m:

m.group(0)    查看整个正则表达式的匹配字符串

m.group(1)    查看第一个分组的匹配结果(分组在python中用小括号表示),其他分组依此类推

m.group('name')     同上,用分组的名字索引

m.groups()             返回所有分组的匹配结果,用元组表示

m.groupdict()    同上,用字典表示

m.start([group])      返回匹配的起始位置

m.end([group])    返回匹配的终止位置

m.span()     查看匹配的首尾位置的元组

详见python标准文档。

python3+ 模块学习 之 re的更多相关文章

  1. python3+ 模块学习 之 subprocess

    subprocess 模块方法: call() check_call() check_output() 以上三个方法用于创建一个子进程,父进程等待子进程结束.若shell = true, 则shell ...

  2. 吴裕雄--天生自然python学习笔记:Python3 模块

    Python3 模块 在前面的几个章节中我们脚本上是用 python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了. 为此 Python 提供了一个办 ...

  3. python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容

    python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖 ...

  4. (转)Python3 模块3之 Urllib之 urllib.parse、urllib.robotparser

    原文:https://blog.csdn.net/qq_36148847/article/details/79153738 https://blog.csdn.net/zly412934578/art ...

  5. python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法

    python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法window安装redis,下载Redis的压缩包https://git ...

  6. python3.4学习笔记(二十三) Python调用淘宝IP库获取IP归属地返回省市运营商实例代码

    python3.4学习笔记(二十三) Python调用淘宝IP库获取IP归属地返回省市运营商实例代码 淘宝IP地址库 http://ip.taobao.com/目前提供的服务包括:1. 根据用户提供的 ...

  7. python3.4学习笔记(十六) windows下面安装easy_install和pip教程

    python3.4学习笔记(十六) windows下面安装easy_install和pip教程 easy_install和pip都是用来下载安装Python一个公共资源库PyPI的相关资源包的 首先安 ...

  8. python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL

    python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL实战例子:使用pyspider匹配输出带.html结尾的URL:@config(a ...

  9. python3.4学习笔记(八) Python第三方库安装与使用,包管理工具解惑

    python3.4学习笔记(八) Python第三方库安装与使用,包管理工具解惑 许多人在安装Python第三方库的时候, 经常会为一个问题困扰:到底应该下载什么格式的文件?当我们点开下载页时, 一般 ...

随机推荐

  1. js将金额专成每隔3位数加逗号

    js将金额专成每隔3位数加逗号,比如 12345.00 转成 12,345.00; 懒得解释具体代码如下 //分割 String.prototype.joinByNum = function(num, ...

  2. 让xterm更舒服的设置

    转自:http://codespider.is-programmer.com/posts/25247.html X11相关的配置位于/etc/X11下. xterm的配置是/etc/X11/app-d ...

  3. 解决嵌入式linux系统下iconv库的移植问题

    一.解决问题    在arm开发板上使用framebuff,在汉字显示时,因为只有gb2312的16*16的汉字字库,而ubuntu16.04默认    的编码方式时utf-8,因此需要进行转码(ut ...

  4. 【python】PIL 批量绘制图片矩形框工具

    工具采用PIL:Python Imaging Library,图像处理标准库.PIL功能非常强大,但API却非常简单易用. 安装PIL 在Debian/Ubuntu Linux下直接通过apt安装 $ ...

  5. 【NOIP2009 T3】 最佳贸易 (双向SPFA)

    C 国有 n 个大城市和 m 条道路,每条道路连接这 n 个城市中的某两个城市.任意两个城市之间最多只有一条道路直接相连.这 m 条道路中有一部分为单向通行的道路,一部分为双向通行的道路,双向通行的道 ...

  6. Linux上搭建Elasticsearch服务器并同步数据库

    1.准备工作         下载Elasticsearch版本号2.3.4 https://www.elastic.co/downloads/past-releases/elasticsearch- ...

  7. canvas 动态画线

    <!--实现鼠标按下的时候,移动进行绘制,鼠标抬起结束绘图,用到的事件有mousedown mousemove mouseup用的的canvas api 有 beginPath moveTo l ...

  8. 强制span不换行

    对于上一篇提到的overflow的问题我好像搞懂一些了.事情大概是这个样子的:如果用了float属性,那么元素就会脱离文本的束缚,无法无天起来,这肯定是猿类无法忍受的.要想让他们乖乖就范,要么用清除浮 ...

  9. unity行为树制作AI简单例子(1)

    用行为树来制作AI是非常方便的,今天就给大家简单介绍一下行为树的强大之处. 所用插件 Behavior Designer v1.421 最开始 我使用过Rain插件,不过用过Behavior Desi ...

  10. windosw应用提示内存不足

    找到如下注册表分支: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\ CurrentVersion\Windows 在右侧窗口中可以看到名为&quo ...