Python正则表达式语法
单个字符匹配
| 字符 | 匹配 |
| . | 匹配任意字符(除了\n) |
| [...] | 匹配字符集 |
| \d/\D | 匹配数字/非数字 |
| \s/\S | 匹配空白/非空白字符 |
| \w/\W | 匹配单词字符[a-zA-A0-9] |
In [8]: ma = re.match(r'.','b') In [9]: ma.gro
ma.group ma.groupdict ma.groups In [9]: ma.group()
Out[9]: 'b' In [10]: ma = re.match(r'.','') In [11]: ma.grou
ma.group ma.groupdict ma.groups In [11]: ma.group()
Out[11]: '' In [12]: clear In [13]: ma = re.match(r'{.}','{a}') In [14]: ma.group()
Out[14]: '{a}' In [15]: ma = re.match(r'{.}','{0}') In [16]: ma.grou
ma.group ma.groupdict ma.groups In [16]: ma.group()
Out[16]: '{0}' In [17]: ma = re.match(r'{..}','{01}') In [18]: ma.group()
Out[18]: '{01}' In [19]: ma = re.match(r'{[abc]}','{a}') In [20]: ma.group()
Out[20]: '{a}' In [21]: ma = re.match(r'{[a-z]}','{d}') In [22]: ma.group()
Out[22]: '{d}' In [23]: ma = re.match(r'{[a-zA-Z]}','{A}') In [24]: ma.group()
Out[24]: '{A}' In [25]: ma = re.match(r'{[a-zA-Z0-9]}','{0}') In [26]: ma.group()
Out[26]: '{0}' In [27]: ma = re.match(r'{[\w]}','{ }') In [28]: ma In [29]: ma = re.match(r'{[\W]}','{ }') In [30]: ma
Out[30]: <_sre.SRE_Match object; span=(0, 3), match='{ }'> In [31]: ma.group()
Out[31]: '{ }' In [32]: ma = re.match(r'{[\W]}','{9}') In [33]: ma.group()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-33-7c62fc675aee> in <module>()
----> 1 ma.group() AttributeError: 'NoneType' object has no attribute 'group' In [34]: ma In [35]: ma = re.match(r'[[\w]]','[a]') In [36]: ma In [37]: ma = re.match(r'\[[\w]\]','[a]') In [38]: ma.group()
Out[38]: '[a]' In [39]: ma = re.match(r'\[[\w]\]','[0]') In [40]: ma.group()
Out[40]: '[0]' In [41]:
多个字符匹配
| 字符 | 匹配 |
| * | 匹配前一个字符0次或者无限次 |
| + | 匹配前一个字符1次或者无限次 |
| ? | 匹配前一个字符0次或者1次 |
| {m}/{m,n} | 匹配前一个字符m次或者n次 |
| *?/+?/?? | 匹配模式变为非贪婪(尽可能少匹配字符) |
In [1]: import re In [2]: ma = re.match(r'[A-Z][a-z]','Aa') In [3]: ma.grou
ma.group ma.groupdict ma.groups In [3]: ma.group()
Out[3]: 'Aa' In [4]: ma = re.match(r'[A-Z][a-z]','A') In [6]: ma In [8]: In [8]: ma = re.match(r'[A-Z][a-z]*','A') In [9]: ma
Out[9]: <_sre.SRE_Match object; span=(0, 1), match='A'> In [10]: ma.group()
Out[10]: 'A'
In [12]: ma = re.match(r'[A-Z][a-z]*','Asdsdwqass') In [14]: ma.
ma.end ma.group ma.lastgroup ma.re ma.start
ma.endpos ma.groupdict ma.lastindex ma.regs ma.string
ma.expand ma.groups ma.pos ma.span In [14]: ma.group()
Out[14]: 'Asdsdwqass' In [15]: ma = re.match(r'[A-Z][a-z]*','1Asdsdwqass') In [16]: ma In [17]: ma = re.match(r'[A-Z][a-z]*','Asd1sdwqass') In [18]: ma.group()
Out[18]: 'Asd' In [19]: ma = re.match(r'[_a-zA-Z]+[_\w]*','') In [20]: ma In [21]: ma = re.match(r'[_a-zA-Z]+[_\w]*','_ht11') In [22]: ma.group()
Out[22]: '_ht11' In [23]: ma = re.match(r'[1-9]?[0-9]','') In [24]: ma.group()
Out[24]: '' In [25]: ma = re.match(r'[1-9]?[0-9]','') In [26]: ma.group()
Out[26]: '' In [27]: ma = re.match(r'[1-9]?[0-9]','') In [28]: ma.group()
Out[28]: '' In [29]: ma = re.match(r'[1-9]?[0-9]','') In [30]: ma.group()
Out[30]: '' In [31]: ma = re.match(r'[1-9]?[0-9]','') In [32]: ma.group()
Out[32]: '' In [33]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc123') In [34]: ma.group()
Out[34]: 'abc123' In [35]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc1234') In [36]: ma.group()
Out[36]: 'abc123' In [37]: ma = re.match(r'[[a-zA-Z0-9]{6}','abc1__') In [38]: ma In [39]: ma = re.match(r'[[a-zA-Z0-9]{6}@163.com','abc123@163.com') In [40]: ma.group()
Out[40]: 'abc123@163.com' In [41]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com','abc1234@163.com') In [42]: ma.grou
ma.group ma.groupdict ma.groups In [42]: ma.group()
Out[42]: 'abc1234@163.com' In [43]: ma = re.match(r'[0-9][a-z]*?','1bc') In [44]: ma.group()
Out[44]: '' In [45]: ma = re.match(r'[0-9][a-z]*','1bc') In [46]: ma.group()
Out[46]: '1bc'
边界匹配
| 字符 | 匹配 |
| ^ | 匹配字符串开头 |
| $ | 匹配字符串结尾 |
| \A/\Z | 指定的字符串匹必须出现在开头/结尾 |
In [48]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com','abc1234@163.comabc')
In [49]: ma.group()
Out[49]: 'abc1234@163.com'
In [50]: ma = re.match(r'[[a-zA-Z0-9]{6,10}@163.com$','abc1234@163.comabc')
In [51]: ma
In [52]: ma = re.match(r'^[[a-zA-Z0-9]{6,10}@163.com$','abc1234@163.com')
In [53]: ma.group()
Out[53]: 'abc1234@163.com'
In [54]: ma = re.match(r'\Aimooc[\w]*','imoocpython')
In [55]: ma.group()
Out[55]: 'imoocpython'
In [56]: ma = re.match(r'\Aimooc[\w]*','iimooc')
In [57]: ma.group()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-57-7c62fc675aee> in <module>()
----> 1 ma.group()
AttributeError: 'NoneType' object has no attribute 'group'
分组匹配
| 字符 | 匹配 |
| | | 匹配左右任意一个表达式 |
| (a,b) | 括号中表达式作为一个分组 |
| \<number> | 引用编号为num的分组匹配到的字符串 |
| (?P<name>) | 分组起一个别名 |
| (?P=name) | 引用别名为name的分组匹配字符串 |
In [59]: ma = re.match(r'abc|d','abc') In [60]: ma.group()
Out[60]: 'abc' In [61]: ma = re.match(r'abc|d','d') In [62]: ma.group()
Out[62]: 'd' In [63]: ma = re.match(r'[1-9]?\d$','') In [64]: ma.group()
Out[64]: '' In [65]: ma = re.match(r'[1-9]?\d$','') In [66]: ma.group()
Out[66]: '' In [67]: ma = re.match(r'[1-9]?\d$','') In [68]: ma In [69]: ma = re.match(r'[1-9]?\d$','') In [70]: ma.group()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-70-7c62fc675aee> in <module>()
----> 1 ma.group() AttributeError: 'NoneType' object has no attribute 'group' In [71]: ma = re.match(r'[1-9]?\d$|100','') In [72]: ma.group()
Out[72]: '' In [73]: ma = re.match(r'[1-9]?\d$|100','') In [74]: ma.group()
Out[74]: '' In [75]: ma = re.match(r'[\w]{4,6}@163.com','imooc@163.com') In [76]: ma.group()
Out[76]: 'imooc@163.com' In [77]: ma = re.match(r'[\w]{4,6}@(163,123).com','imooc@163.com') In [78]: ma = re.match(r'[\w]{4,6}@(163,123).com','imooc@123.com') In [79]: ma.group()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-79-7c62fc675aee> in <module>()
----> 1 ma.group() AttributeError: 'NoneType' object has no attribute 'group' In [80]: ma = re.match(r'[\w]{4,6}@(163|123).com','imooc@123.com') In [81]: ma.group()
Out[81]: 'imooc@123.com' In [82]: ma = re.match(r'<[\w]+>','<book>') In [83]: ma.group()
Out[83]: '<book>' In [84]: ma = re.match(r'<([\w]+>)','<book>') In [85]: ma.group()
Out[85]: '<book>' In [86]: ma = re.match(r'<([\w]+>)\1','<book>') In [87]: ma.groups()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-87-f4e4ca66607d> in <module>()
----> 1 ma.groups() AttributeError: 'NoneType' object has no attribute 'groups' In [88]: ma = re.match(r'<([\w]+>)\1','<book>book>') In [89]: ma.groups()
Out[89]: ('book>',) In [90]: ma.group()
Out[90]: '<book>book>' In [91]: ma = re.match(r'<([\w]+>\1','<book>book>') In [3]: ma = re.match(r'<([\w]+>)[\w]+</\1','<book>python</book>') In [4]: ma.group()
Out[4]: '<book>python</book>' In [5]: ma = re.match(r'<([\w]+>)[\w]+</\1','<book>python</book1>') In [6]: ma In [9]: ma = re.match(r'<(?P<mark>[\w]+>)[\w]+</(?P=mark)','<book>python</book>') In [10]: ma.group()
Out[10]: '<book>python</book>'
Python正则表达式语法的更多相关文章
- Python 正则表达式语法实例
- python 正则表达式语法
- Python 正则表达式模块 (re) 简介
Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用这一内嵌于 Python 的语言工具,尽管不能 ...
- Python正则表达式 学习笔记
python第一个正则表达式 1. import re : python正则表达式模块 2. 第一个正则表达式 re.compile(r'imooc') pattern.match('imooc py ...
- Python基础语法07--面向对象+正则表达式
Python 面向对象 Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的.本章节我们将详细介绍Python的面向对象编程. 如果你以前没有接触过 ...
- python正则表达式re
Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...
- 比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
- python正则表达式 小例几则
会用到的语法 正则字符 释义 举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...
- Python基本语法初试
编程环境: win7旗舰版 Python 3.2.2(default, Sep 4 2011,09:51:08) 代码来源:(Python菜鸟) 代码内容: Python基本的输出语句print(& ...
随机推荐
- logstash nested内嵌字段 field protobuf解码 codec 的解决办法
logstash nested内嵌字段 field protobuf解码 codec 的解决办法 主要需求 logstash-codec 下https://www.elastic.co/guide/e ...
- 1059 C语言竞赛 (20 分)
题目:1059 C语言竞赛 (20 分) C 语言竞赛是浙江大学计算机学院主持的一个欢乐的竞赛.既然竞赛主旨是为了好玩,颁奖规则也就制定得很滑稽: 0.冠军将赢得一份“神秘大奖”(比如很巨大的一本学生 ...
- operator和if结构
1.比较运算符:>,<,==,!=,>=,<= 注意:所有比较运算符的结果都是布尔值举例: 123456789 print(100>10) print(100<10 ...
- php的header方法
http://www.cnblogs.com/fengzheng126/archive/2012/04/21/2461475.html
- 4)date中的Ymd格式问题
以下是详细的参数: format 字符 说明 返回值例子日 --- ---d 月份中的第几天,有前导零的 2 位数字 01 到 31D 星期中的第几天,文本表示,3 个字母 Mon 到 Sunj 月份 ...
- python语法基础-函数-迭代器和生成器-长期维护
############### 迭代器 ############## """ 迭代器 这是一个新的知识点 我们学习过的可以迭代的对象有哪些? list str ...
- js手机浏览器video标签会一直置顶,遮盖住弹出层问题
<video x5-playsinline="" playsinline="" webkit-playsinline="">&l ...
- highcharts 柱状图在柱子顶部显示y轴数据
var plotOptions={ column:{ //borderColor: "#CCCC66",//边框 shadow: true, //阴影 dataLabels:{ / ...
- win10安装revit失败,怎么强力卸载删除注册表并重新安装
一些搞设计的朋友在win10系统下安装revit失败或提示已安装,也有时候想重新安装revit的时候会出现本电脑windows系统已安装revit,你要是不留意直接安装revit,只会安装revit的 ...
- 使用 ActiveMQ 示例
« Lighttpd(fastcgi) + web.py + MySQLdb 无法正常运行关于 Jms Topic 持久订阅 » 使用 ActiveMQ 示例 企业中各项目中相互协作的时候可能用得到消 ...