Python正则表达式语法

单个字符匹配

字符	匹配
.	匹配任意字符（除了\n）
[...]	匹配字符集
\d/\D	匹配数字/非数字
\s/\S	匹配空白/非空白字符
\w/\W	匹配单词字符[a-zA-A0-9]

In [8]: ma = re.match(r'.','b')

In [9]: ma.gro

ma.group      ma.groupdict  ma.groups     

In [9]: ma.group()

Out[9]: 'b'

In [10]: ma = re.match(r'.','')

In [11]: ma.grou

ma.group      ma.groupdict  ma.groups     

In [11]: ma.group()

Out[11]: ''

In [12]: clear

In [13]: ma = re.match(r'{.}','{a}')

In [14]: ma.group()

Out[14]: '{a}'

In [15]: ma = re.match(r'{.}','{0}')

In [16]: ma.grou

ma.group      ma.groupdict  ma.groups     

In [16]: ma.group()

Out[16]: '{0}'

In [17]: ma = re.match(r'{..}','{01}')

In [18]: ma.group()

Out[18]: '{01}'

In [19]: ma = re.match(r'{[abc]}','{a}')

In [20]: ma.group()

Out[20]: '{a}'

In [21]: ma = re.match(r'{[a-z]}','{d}')

In [22]: ma.group()

Out[22]: '{d}'

In [23]: ma = re.match(r'{[a-zA-Z]}','{A}')

In [24]: ma.group()

Out[24]: '{A}'

In [25]: ma = re.match(r'{[a-zA-Z0-9]}','{0}')

In [26]: ma.group()

Out[26]: '{0}'

In [27]: ma = re.match(r'{[\w]}','{ }')

In [28]: ma

In [29]: ma = re.match(r'{[\W]}','{ }')

In [30]: ma

Out[30]: <_sre.SRE_Match object; span=(0, 3), match='{ }'>

In [31]: ma.group()

Out[31]: '{ }'

In [32]: ma = re.match(r'{[\W]}','{9}')

In [33]: ma.group()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-33-7c62fc675aee> in <module>()

----> 1 ma.group()

AttributeError: 'NoneType' object has no attribute 'group'

In [34]: ma

In [35]: ma = re.match(r'[[\w]]','[a]')

In [36]: ma

In [37]: ma = re.match(r'\[[\w]\]','[a]')

In [38]: ma.group()

Out[38]: '[a]'

In [39]: ma = re.match(r'\[[\w]\]','[0]')

In [40]: ma.group()

Out[40]: '[0]'

In [41]:

多个字符匹配

字符	匹配
*	匹配前一个字符0次或者无限次
+	匹配前一个字符1次或者无限次
?	匹配前一个字符0次或者1次
{m}/{m,n}	匹配前一个字符m次或者n次
*?/+?/??	匹配模式变为非贪婪（尽可能少匹配字符）

In [1]: import re

In [2]: ma = re.match(r'[A-Z][a-z]','Aa')

In [3]: ma.grou

ma.group      ma.groupdict  ma.groups     

In [3]: ma.group()

Out[3]: 'Aa'

In [4]: ma = re.match(r'[A-Z][a-z]','A')

In [6]: ma

In [8]: 

In [8]: ma = re.match(r'[A-Z][a-z]*','A')

In [9]: ma

Out[9]: <_sre.SRE_Match object; span=(0, 1), match='A'>

In [10]: ma.group()

Out[10]: 'A'

In [12]: ma = re.match(r'[A-Z][a-z]*','Asdsdwqass')

In [14]: ma.

ma.end        ma.group      ma.lastgroup  ma.re         ma.start

ma.endpos     ma.groupdict  ma.lastindex  ma.regs       ma.string

ma.expand     ma.groups     ma.pos        ma.span       

In [14]: ma.group()

Out[14]: 'Asdsdwqass'

In [15]: ma = re.match(r'[A-Z][a-z]*','1Asdsdwqass')

In [16]: ma

In [17]: ma = re.match(r'[A-Z][a-z]*','Asd1sdwqass')

In [18]: ma.group()

Out[18]: 'Asd'

In [19]: ma = re.match(r'[_a-zA-Z]+[_\w]*','')

In [20]: ma

In [21]: ma = re.match(r'[_a-zA-Z]+[_\w]*','_ht11')

In [22]: ma.group()

Out[22]: '_ht11'

In [23]: ma = re.match(r'[1-9]?[0-9]','')

In [24]: ma.group()

Out[24]: ''

In [25]: ma = re.match(r'[1-9]?[0-9]','')

In [26]: ma.group()

Out[26]: ''

In [27]: ma = re.match(r'[1-9]?[0-9]','')

In [28]: ma.group()

Out[28]: ''

In [29]: ma = re.match(r'[1-9]?[0-9]','')

In [30]: ma.group()

Out[30]: ''

In [31]: ma = re.match(r'[1-9]?[0-9]','')

In [32]: ma.group()

Out[32]: ''

In [33]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc123')

In [34]: ma.group()

Out[34]: 'abc123'

In [35]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc1234')

In [36]: ma.group()

Out[36]: 'abc123'

In [37]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc1__')

In [38]: ma

In [39]: ma = re.match(r'[[a-zA-Z0-9]{6}@163.com','abc123@163.com')

In [40]: ma.group()

Out[40]: 'abc123@163.com'

In [41]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com','abc1234@163.com')

In [42]: ma.grou

ma.group      ma.groupdict  ma.groups     

In [42]: ma.group()

Out[42]: 'abc1234@163.com'

In [43]: ma = re.match(r'[0-9][a-z]*?','1bc')

In [44]: ma.group()

Out[44]: ''

In [45]: ma = re.match(r'[0-9][a-z]*','1bc')

In [46]: ma.group()

Out[46]: '1bc'

边界匹配

字符	匹配
^	匹配字符串开头
$	匹配字符串结尾
\A/\Z	指定的字符串匹必须出现在开头/结尾

In [48]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com','abc1234@163.comabc') 

In [49]: ma.group()

Out[49]: 'abc1234@163.com'

In [50]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com$','abc1234@163.comabc')

In [51]: ma

In [52]: ma = re.match(r'^[[a-zA-Z0-9]{6,10}@163.com$','abc1234@163.com')

In [53]: ma.group()

Out[53]: 'abc1234@163.com'

In [54]: ma = re.match(r'\Aimooc[\w]*','imoocpython')

In [55]: ma.group()

Out[55]: 'imoocpython'

In [56]: ma = re.match(r'\Aimooc[\w]*','iimooc')

In [57]: ma.group()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-57-7c62fc675aee> in <module>()

----> 1 ma.group()

AttributeError: 'NoneType' object has no attribute 'group'

分组匹配

字符	匹配
\|	匹配左右任意一个表达式
(a,b)	括号中表达式作为一个分组
\<number>	引用编号为num的分组匹配到的字符串
(?P<name>)	分组起一个别名
(?P=name)	引用别名为name的分组匹配字符串

In [59]: ma = re.match(r'abc|d','abc')

In [60]: ma.group()

Out[60]: 'abc'

In [61]: ma = re.match(r'abc|d','d')

In [62]: ma.group()

Out[62]: 'd'

In [63]: ma = re.match(r'[1-9]?\d$','')

In [64]: ma.group()

Out[64]: ''

In [65]: ma = re.match(r'[1-9]?\d$','')

In [66]: ma.group()

Out[66]: ''

In [67]: ma = re.match(r'[1-9]?\d$','')

In [68]: ma

In [69]: ma = re.match(r'[1-9]?\d$','')

In [70]: ma.group()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-70-7c62fc675aee> in <module>()

----> 1 ma.group()

AttributeError: 'NoneType' object has no attribute 'group'

In [71]: ma = re.match(r'[1-9]?\d$|100','')

In [72]: ma.group()

Out[72]: ''

In [73]: ma = re.match(r'[1-9]?\d$|100','')

In [74]: ma.group()

Out[74]: ''

In [75]: ma = re.match(r'[\w]{4,6}@163.com','imooc@163.com')

In [76]: ma.group()

Out[76]: 'imooc@163.com'

In [77]: ma = re.match(r'[\w]{4,6}@(163,123).com','imooc@163.com')

In [78]: ma = re.match(r'[\w]{4,6}@(163,123).com','imooc@123.com')

In [79]: ma.group()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-79-7c62fc675aee> in <module>()

----> 1 ma.group()

AttributeError: 'NoneType' object has no attribute 'group'

In [80]: ma = re.match(r'[\w]{4,6}@(163|123).com','imooc@123.com')

In [81]: ma.group()

Out[81]: 'imooc@123.com'

In [82]: ma = re.match(r'<[\w]+>','<book>')

In [83]: ma.group()

Out[83]: '<book>'

In [84]: ma = re.match(r'<([\w]+>)','<book>')

In [85]: ma.group()

Out[85]: '<book>'

In [86]: ma = re.match(r'<([\w]+>)\1','<book>')

In [87]: ma.groups()

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-87-f4e4ca66607d> in <module>()

----> 1 ma.groups()

AttributeError: 'NoneType' object has no attribute 'groups'

In [88]: ma = re.match(r'<([\w]+>)\1','<book>book>')

In [89]: ma.groups()

Out[89]: ('book>',)

In [90]: ma.group()

Out[90]: '<book>book>'

In [91]: ma = re.match(r'<([\w]+>\1','<book>book>')

In [3]: ma = re.match(r'<([\w]+>)[\w]+</\1','<book>python</book>')

In [4]: ma.group()

Out[4]: '<book>python</book>'

In [5]: ma = re.match(r'<([\w]+>)[\w]+</\1','<book>python</book1>')

In [6]: ma

In [9]: ma = re.match(r'<(?P<mark>[\w]+>)[\w]+</(?P=mark)','<book>python</book>')

In [10]: ma.group()

Out[10]: '<book>python</book>'

Python正则表达式语法的更多相关文章

Python 正则表达式语法实例
python 正则表达式语法
Python 正则表达式模块 (re) 简介
Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用这一内嵌于 Python 的语言工具,尽管不能 ...
Python正则表达式学习笔记
python第一个正则表达式 1. import re : python正则表达式模块 2. 第一个正则表达式 re.compile(r'imooc') pattern.match('imooc py ...
Python基础语法07--面向对象+正则表达式
Python 面向对象 Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的.本章节我们将详细介绍Python的面向对象编程. 如果你以前没有接触过 ...
python正则表达式re
Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( )．表示任意字符［］用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...
比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
python正则表达式小例几则
会用到的语法正则字符释义举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...
Python基本语法初试
编程环境: win7旗舰版 Python 3.2.2(default, Sep 4 2011,09:51:08) 代码来源:(Python菜鸟) 代码内容: Python基本的输出语句print(& ...

随机推荐

RDD(七)——依赖
概述 RDD只支持粗粒度转换,即在大量记录上执行的单个操作.将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区.RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD ...
Uber退出东南亚留下烂摊子，给“中国式并购”带来哪些启示
当下,从全球范围内来看很多互联网企业都采用了"复制+粘贴"的疯狂推进模式.它们往往在某一个国家或地区取得领先优势后,就快速将相同模式在全球推进去占领当地市场.无论结果是一家独大占据 ...
django框架进阶-中间件-长期维护
################## 为什么使用中间件? ####################### 先说几个需求, 1,url的白名单,url=[ "XX"] ...
cs231n spring 2017 lecture14 Reinforcement Learning
(没太听明白,下次重新听) 1. 增强学习有一个 Agent 和 Environment 交互.在 t 时刻,Agent 获知状态是 st,做出动作是 at:Environment 一方面给出 Re ...
13.1 CentOS系统启动流程介绍
CentOS系统启动流程介绍本章我们将学习 Linux 启动流程和内核模块管理相关的内容.通过本章我们将学习如下内容: Linux 系统的组成及特点 CentOS 系统的启动流程开机启动成 gru ...
c socket 开发测试
c语言异常参照他人代码写一个tcp的 socket 开发测试异常A,在mac osx系统下编译失败,缺库转到debian下. 异常B,include引用文件顺序不对,编译大遍异常异常C,/usr ...
HDU-1040-As Easy As A+B(各种排序)
希尔排序 Accepted 1040 0MS 1224K 564 B G++ #include "cstdio" using namespace std; ]; int main( ...
博客已搬迁到 blog.vivym.xyz
博客已搬迁到 blog.vivym.xyz
MyBatis基本使用步骤
MyBatis是一个数据持久层(ORM)框架.把实体类和SQL语句之间建立了映射关系,是一种半自动化的ORM实现.MyBATIS需要开发人员自己来写sql语句,这可以增加了程序的灵活性,在一定程度 ...
对H5新增多线程的理解与简单使用
由于JavaScript的特性决定了JavaScript语言是一种单线程语言,但是有时候我们需要使用多线程比如进行大量的计算时.H5为此新增了多线程的方法. 在这里我是用JavaScript来实现著名 ...

Python正则表达式语法

Python正则表达式语法的更多相关文章

随机推荐

热门专题