python正则表达式中的分组 group

维基百科:http://wiki.ubuntu.org.cn/Python正则表达式操作指南

组是通过 "(" 和 ")" 元字符来标识的。 "(" 和 ")" 有很多在数学表达式中相同的意思；它们一起把在它们里面的表达式组成一组。举个例子，你可以用重复限制符，象 *, +, ?, 和 {m,n}，来重复组里的内容，比如说(ab)* 将匹配零或更多个重复的 "ab"。

例子：如果不引入括号，整个表达式作为一个组，是group(0)

>>> import re

>>> p=re.compile('\d-\d-\d')

>>> m=p.match('2-3-1')

>>> m.groups()

()

>>> m.group()

'2-3-1'

>>> m.group(1)

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

IndexError: no such group

如果引入括号，可以将上面的表达式分成3组，如下

>>> p=re.compile('(\d)-(\d)-(\d)')

>>> m=p.match('1-2-3')

>>> m.group()

'1-2-3'

>>> m.group(1)

'1'

>>> m.group(0,2,1)

('2-3-1', '2', '1')

也可以给各个组取名字，例如，给第一个数组取名叫first

>>> p=re.compile('(?P<first>\d)-(\d)-(\d)')

>>> m=p.match('1-2-3')

>>> m.group(1)

'1'

>>> m.group('first')

'1'

更多更全的功能，可以参见维基百科

正则表达式中，group（）用来提出分组截获的字符串，（）用来分组

import re

a = "123abc456"

print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0)   #123abc456,返回整体

print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)   #123

print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)   #abc

print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3)   #456

1. 正则表达式中的三组括号把匹配结果分成三组

 group() 同group（0）就是匹配正则表达式整体结果

 group(1) 列出第一个括号匹配部分，group(2) 列出第二个括号匹配部分，group(3) 列出第三个括号匹配部分。

2. 没有匹配成功的，re.search（）返回None

3. 当然郑则表达式中没有括号，group(1)肯定不对了。

组是通过 "(" 和 ")" 元字符来标识的！！！！！

\num  : 引用分组num匹配到的字符串

import  re

s = "<html><h1>正则表达式</h1></html>"

re.match(r"<(.+)><(.+)>.+</\2></\1>",s)   #</\2>表示引用第二组匹配到的字符串，同理</\1>表示引用第一组匹配到的字符串。

Out[13]: <_sre.SRE_Match object; span=(0, 27), match='<html><h1>正则表达式</h1></html>'>

f = re.match(r"<(.+)><(.+)>.+</\2></\1>",s)

f.group(1)

'html'

f.group(2)

'h1'

f.group()

'<html><h1>正则表达式</h1></html>'

python正则表达式中的分组 group的更多相关文章

Python 正则表达式利用括号分组
如果想把区号从匹配的电话号码中分离,可以添加括号在正则表达式中创建分组,再使用group()方法,从一个分组中获取匹配的文本正则表达式字符串中,第一个括号是第一组,第二个括号是第二组.向group( ...
Python正则表达式中的re.S
title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...
Python: 正则表达式中的group()
正则表达式中,group()用来提出分组截获的字符串,()用来分组 eg:
python 正则表达式中反斜杠(\)的麻烦和陷阱
这里是一点小心得:由于下面两个原因,在正则表达式中使用反斜杠就会产生了一个双重转换的问题. (1).python自身处理字符串时,反斜杠是用于转义字符 (2).正则表达式也使用反斜杠来转义字符 ...
Python正则表达式中的re.S的作用
在Python的正则表达式中,有一个参数为re.S.它表示“.”(不包含外侧双引号,下同)的作用扩展到整个字符串,包括“\n”.看如下代码: import re a = '''asdfhellopas ...
Python正则表达式中的re.S，re.M，re.I的作用
正则表达式可以包含一些可选标志修饰符来控制匹配的模式.修饰符被指定为一个可选的标志.多个标志可以通过按位 OR(|) 它们来指定.如 re.I | re.M 被设置成 I 和 M 标志: 修饰符描述 ...
Python正则表达式中re.S作用
re.S的作用: 不使用re.S时,则只在每一行内进行匹配,如果存在一行没有,就换下一行重新开始,使用re.S参数以后,正则表达式会将这个字符串看做整体,在整体中进行匹配对比输出结果: import ...
python正则表达式中含有变量的写法
使用格式化字符串的方式实现举例: re.findall("(this,%s,'(.*?)'"%str(i),"abcd(this,1,'123123)')这里i为变量
Python字符串和正则表达式中的反斜杠('\')问题
在Python普通字符串中在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如 In [1]: print('abc\ndef') # '\n'具有换行的作用 abc defg ...

随机推荐

完美解决小米pro风扇乱转的问题
新买的小米Pro顶配,发现CPU高于20%的时候就开始狂响,最后找到了解决的方法,但是不知道会有什么影响.方法如下: 在平衡模式下更改高级电源设置--->处理器电源管理--->最大出来状态 ...
【Luogu】P3930 SAC E#1 - 一道大水题 Knight
[题目]洛谷10月月赛R1 提高组 [题意]给定n*n棋盘和<=16个棋子,给几个棋子种类和攻击范围,现我方只有一马,求能否吃王. [算法]状压+BFS [题解]16种棋子中,马不能吃马,直接处 ...
【Luogu】 P3928 SAC E#1 - 一道简单题 Sequence2
[题目]洛谷10月月赛R1 提高组 [算法]递推DP+树状数组 [题解]列出DP递推方程,然后用树状数组维护前后缀和. #include<cstdio> #include<cstri ...
Optimal Milking（POJ2112+二分+Dinic）
题目链接:http://poj.org/problem?id=2112 题目: 题意:有k台挤奶机,c头奶牛,每台挤奶机每天最多生产m的奶,给你每个物品到其他物品的距离(除了物品到自己本省的距离为0外 ...
urllib3使用指南
对比urllib,用urllib3处理http请求十分方便,可以嵌入web服务后端用于访问其它web实例提供的接口一.安装 pip install urllib3 二.初始化导入urllib3 i ...
VPS性能综合测试（7）：服务器压力测试，VPS系统负载测试
1.可能有的VPS主机使用性能测评工具得出的结果很优秀,但是最终运用到实际生产时却发现VPS主机根本无法承受理论上应该达到的流量压力,这时我们就不得不要怀疑VPS商是不是对VPS主机的参数进行了“篡改 ...
linux sort排序命令
1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出. 2 sort的-u选项在输出行中去除重复行. $ ...
[New learn]响应者链机制介绍
1.简介测试代码库:https://github.com/xufeng79x/EventHandler 响应者链是系统寻找事件相应者的一个路径,他是同touch事件的Hit-testing过程具有 ...
puppet安装和配置
一.安装puppet准备 //安装准备 ,两台机器都要操作 . 两台机器 172.7.15.106 (server) 172.7.15.111 (client) . 关闭防火墙 setenforce ...
div左右自适应高度一致
<div style="width:300px;"> <div id="Left" style="float:left;" ...

python正则表达式中的分组 group

python正则表达式中的分组 group的更多相关文章

随机推荐

热门专题