python之(re)正则表达式下

知识储备：

\w 匹配任何字母/数字，下划线

正则表达式进阶：

re.match('com', 'comwww.runcomoob')

re.search('\dcom', 'www.4comrunoob.5com')

一旦匹配成功，就返回一个match object 对象，对象拥有下列方法；

group()  返回被re 匹配的字符串

start()  返回匹配开始的位置

end()    返回匹配结束的位置(返回结果是索引加1，和分片一样，不包括组的结束位置)

span() 返回一个元组包含匹配（开始，结束）的位置

match() 只匹配起始位置

s = re.match('com', 'www.runcoomoob')

print(s)   #None

print(s.span())   #注意位置，不是0－3

Traceback (most recent call last):

  File "C:/Users/Administrator/PycharmProjects/laonanhai/day6_test/s9.py", line 15, in <module>

    print(s.span())   #注意位置，不是0－3

AttributeError: 'NoneType' object has no attribute 'span'

search() 注意前面的找到则不再往后找

s2 = re.search('com', 'www.runcomoocomb')

print(s2)

#<_sre.SRE_Match object; span=(7, 10), match='com'>  注意前面的找到则不再往后找

sub/subn 替换 re.sub(pattern, repl, string, max) max 最大替换次数

s3 = re.sub("g.t", "have", "I get A, I got B, I gut C", 2)

print(s3)    #I have A, I have B, I gut C

s4 = re.subn("g.t", "have", "I get A, I got B, I gut C")

print(s4)    #('I have A, I have B, I gut C', 2)   多了替换次数

　re.split() 分割

s5 = re.split('\d+', 'one1two2three3four4')

print(s5)   #['one', 'two', 'three', 'four', '']    注意最后是''

把那些经常使用的正则表达式编译成正则表达式对象，可以提高一定的效率！

text = 'JGood is a handsome boy, he is cool, clever, and so on...'

regex = re.compile(r'\w*oo\w*')    #regex 是对象

print(regex.findall(text))         #['JGood', 'cool']

正则分组

正则分组：去已经匹配到的数据中再匹配数据（这句话超超重要！！）
举例：

# 无分组

origin = "has fkdghggfhh"

r = re.match("h\w+", origin)

print(r.group())      # 获取匹配到的所有结果

print(r.groups())     # 获取模型中匹配到的分组结果

print(r.groupdict())  # 获取模型中匹配到的分组结果

# has

# ()

# {}

import re

m = re.search("(?P<year>[0-9]{4})", "test 2017abc")

print(m)

print(m.group())

print(m.groups())

print(m.group("year"))

输出:

<_sre.SRE_Match object; span=(5, 9), match=''>

2017

('',)

2017

search()  分组和match()一样，只是找的方式不同

# search()  分组也一样，只是找的方式不同

origin = "has fkdghggfhh"

r = re.match("h(?P<name>\w+)", origin)   #给字典添加key,注意括号！！

print(r.group())      # 获取匹配到的所有结果

print(r.groups())     # 获取模型中匹配到的分组结果

print(r.groupdict())  # 获取模型中匹配到的分组中所有执行了key的组

# has

# ('as',)

# {'name': 'as'}

下面是示例，自己看看肯定看得懂的啦

origin = "has fkdghggfhh hal"

#r = re.findall("(h\w+)", origin)    #无用分组   ['has', 'hggfhh', 'hal']

#r = re.findall("h(\w+)", origin)    #只拿分组里面的东西  ['as', 'ggfhh', 'al']

origin = "hasbbcc fkdghggbbccfhhbbcc halbbcc"

r = re.findall("h(\w+)bbc", origin)  #['as', 'ggbbcfhh', 'al']

r = re.findall("h(\w+)b(bc)c", origin)

print(r)    #[('as', 'bc'), ('ggbbccfhh', 'bc'), ('al', 'bc')]

接下来讲一个蛮重要的点

split() 与正则分组

# 无分组

origin = "hello alex bcd alex lge alex acd 19"

r = re.split("alex", origin, 1)

print(r)        #['hello ', ' bcd alex lge alex acd 19']

# 有分组

origin = "hello alex bcd alex lge alex acd 19"

r1 = re.split("(alex)", origin, 1)

print(r1)   #['hello ', 'alex', ' bcd alex lge alex acd 19']

r2 = re.split("al(ex)", origin, 1)   #重要

print(r2)   #['hello ', 'ex', ' bcd alex lge alex acd 19']

欢迎转发！
This is zcl‘s article! Thanks for your support!
文章出处：http://www.cnblogs.com/0zcl
作者：zcl

python之(re)正则表达式下的更多相关文章

python基础之正则表达式
正则表达式语法正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则 ...
python之(re)正则表达式上
python正则表达式知识预备正则表达式使用反斜杠" \ "来代表特殊形式或用作转义字符,这里跟Python的语法冲突,因此,Python用" \\\\ "表 ...
Python::re 模块 -- 在Python中使用正则表达式
前言这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细 ...
python的re正则表达式模块学习
python中re模块的用法 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析.复杂字符串分析和信息提取时是一个非常有用的工 ...
Python基础之正则表达式指南
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程 ...
Python系列之正则表达式详解
Python 正则表达式模块 (re) 简介 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用 ...
【转载】Python中的正则表达式教程
本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...
Python中的正则表达式教程
本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...
[Python]网络爬虫（七）：Python中的正则表达式教程
转自:http://blog.csdn.net/pleasecallmewhy/article/details/8929576#t4 接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一 ...

随机推荐

android 布局使用 viewPager 时，如何解决和子页面长按滑动冲突问题
使用 viewPager 时,如何解决和子页面长按滑动冲突问题. 我的问题原型: 这个问题,我相信遇到的人会比较少,我是在一个 viewPager 中,其中一个 fragment 中实现了 ...
【iOS】NSNumberFormatter
介绍 NSNumberFormatter 应该可以满足你对数据形式的一般需求,值得了解一下. NSNumber *num1 = [NSNumber numberWithDouble:1234567.8 ...
JavaScrict中的断言调试
今天在看忍者秘籍的时候,看到一个断言方法.查阅了一下资料,原来javascript中的console也包含这个方法.具体用法如下: <script type="text/javascr ...
Windows 下noinstall方式安装 mysql-5.7.5-m15-winx64
下载解压不说我解压在:E:\DBFiles\mysql-5.7.15-winx64\mysql-5.7.15-winx64 添加配置文件E:\DBFiles\mysql-5.7.15-winx64\ ...
PHP配置限制文件大小上传
修改PHP上传文件大小限制的方法1. 一般的文件上传,除非文件很小.就像一个5M的文件,很可能要超过一分钟才能上传完.但在php中,默认的该页最久执行时间为 30 秒.就是说超过30秒,该脚本就停止执 ...
ThinkPHP学习（二）
开发规范 1.命名规范使用ThinkPHP开发的过程中应该尽量遵循下列命名规范: 特例:在ThinkPHP里面,有一个函数命名的特例,就是单字母大写函数,这类函数通常是某些操作的快捷定义,或者有特 ...
Sql Server函数全解(五)之系统函数
系统信息包括当前使用的数据库名称,主机名,系统错误消息以及用户名称等内容.使用SQL SERVER中的系统函数可以在需要的时候获取这些信息.下面介绍系统函数的作用和使用方法. 1.返回表中指定字段的 ...
【十大经典数据挖掘算法】k-means
[十大经典数据挖掘算法]系列 C4.5 K-Means SVM Apriori EM PageRank AdaBoost kNN Naïve Bayes CART 1. 引言 k-means与kNN虽 ...
tomcat源码剖析系列
一个简单的web服务器一个简单的servlet容器连接器创建httpRequest 创建HttpResponse 容器生命周期日志记录器载入器 Session管理关闭钩子启动tomca ...
4.DB Initialization（数据库初始化）[EF Code-First系列]
前面的例子中,我们已经看到了Code-First自动为我们创建数据库的例子. 这里我们将要学习的是,当初始化的时候,Code-First是怎么决定数据库的名字和服务的呢??? 下面的图,解释了这一切! ...