正则表达式和re模块

re的元字符
字符集[ ]
转义符
分组 ( )
|符号
re下的常用方法
分组

re的元字符

import re

ret = re.findall("e..a", "Hermaeus") #"."是模糊表示一个字符

print(ret)

['erma']

ret = re.findall("^H..m", "Hermaeus") #"^"表示开头必须是某个字符

print(ret)

['Herm']

ret = re.findall("a..s$", "Hermaeus") #"$"表示结尾必须是某个字符

print(ret)

['aeus']

ret = re.findall("abc*", "abccccc")  #贪婪匹配[0,+∞]

print(ret)

['abccccc']

ret = re.findall("abc+", "abccccc")  #贪婪匹配[1,+∞]

print(ret)

['abccccc']

ret = re.findall("abc?", "abccccc")  #惰性匹配[0,1]

print(ret)

['abc']

ret = re.findall("abc{1,3}", "abccccc")   #贪婪匹配[1,3]

print(ret)

['abccc']

ret = re.findall("abc*?", "abccccc")  #这样会让其变成惰性匹配

print(ret)

['ab']

字符集`[ ]`

即在字符集中任意匹配一个

import re

ret = re.findall("a[bc]", "abc")

print(ret)

['ab']

ret = re.findall("[a-z]", "ahfao")

print(ret)

['a', 'h', 'f', 'a', 'o']

ret = re.findall("[%$]", "ada%jf$")  #在字符集里面除了：- ^ \以外都是普通字符

print(ret)

['%', '$']

##" - " 取在这之间的

ret = re.findall("[1-9]", "1jkah1k2k3j")

print(ret)

['1', '1', '2', '3']

##" ^ " 取反，即在这字符集里面没有的

ret = re.findall("[^ab]", "7ajkf2bfjab")

print(ret)

['7', 'j', 'k', 'f', '2', 'f', 'j']

##" \ " 转义符

ret = re.findall("[\d]", "45dhaf2")

print(ret)

['4', '5', '2']

转义符

反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d
\d匹配任何十进制数；它相当于类 [0-9]。
\D匹配任何非数字字符；它相当于类 [^0-9]。
\s匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。
\S匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。
\w匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。
\W匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]
\b匹配一个特殊字符边界，比如空格，&，＃等

import re

ret = re.findall(r"I\b", "I am LIST") ##添加"r"，就变成了原生字符串，它表示把需要匹配的字符集直接交给模块处理

print(ret)

分组 `( )`

import re

ret = re.search("(?P<id>\d{2})/(?P<name>\w{3})", "23/com") #"?P<id> 取名

print(ret)

<_sre.SRE_Match object; span=(0, 6), match='23/com'> #返回一个对象

print(ret.group())

23/com

print(ret.group("id"))

23

`|`符号

import re

ret = re.search("(ab)|\d", "rabjk4fk") #二选一

print(ret)

print(ret.group())

re下的常用方法

import re

#findall()方法

#返回所有满足匹配条件的结果,放在列表里

re.findall('a','alvin yuan')

#search()方法

#函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以;通过调用group()方法得到匹配的字符串,如果字符串没有匹配，则返回None。

re.search('a','alvin yuan').group()

#match()方法

#同search,不过尽在字符串开始处进行匹配

re.match('a','abc').group()

#split()方法

#先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割

ret=re.split('[ab]','abcd')

print(ret)#['', '', 'cd']

#sub()和subn()方法

#替代

ret=re.sub('\d','abc','alvin5yuan6',1)

print(ret)#alvinabcyuan6

#替代，且可以选择次数

ret=re.subn('\d','abc','alvin5yuan6')

print(ret)#('alvinabcyuanabc', 2)

#compile()方法

#对象赋予

obj=re.compile('\d{3}')

ret=obj.search('abc123eeee')

print(ret.group())#123

#finditer()方法

ret=re.finditer('\d','ds3sy4784a')

print(ret)        #<callable_iterator object at 0x10195f940>

                  #返回迭代器

print(next(ret).group())

print(next(ret).group())

注意：

import re

ret=re.findall('www.(baidu|oldboy).com','www.oldboy.com')

print(ret)['oldboy']     #这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可

['oldboy']

ret=re.findall('www.(?:baidu|oldboy).com','www.oldboy.com')

print(ret)

['www.oldboy.com']

分组

在正则表达式中，可以对过滤到的字符串进行分组，分组使用圆括号的方式:

group：和group(0)等价，返回的是整个满足条件的字符串
groups：返回的是里面的子组，索引从1开始
group(1)：返回的是第一个子组，可以传入多个

代码实例：

import re

text = "apple price is $99,orange price is $10"

ret = re.search(r".*(\$\d+).*(\$\d+)",text)

print(ret.group())

print(ret.group(0))

print(ret.group(1))

print(ret.group(2))

print(ret.groups())

'''

result:

apple price is $99,orange price is $10

apple price is $99,orange price is $10

$99

$10

('$99', '$10')

'''

正则表达式和re模块的更多相关文章

Python之正则表达式（re模块）
本节内容 re模块介绍使用re模块的步骤 re模块简单应用示例关于匹配对象的说明说说正则表达式字符串前的r前缀 re模块综合应用实例正则表达式(Regluar Expressions)又称规则 ...
【转】Python之正则表达式（re模块）
[转]Python之正则表达式(re模块) 本节内容 re模块介绍使用re模块的步骤 re模块简单应用示例关于匹配对象的说明说说正则表达式字符串前的r前缀 re模块综合应用实例参考文档提示: ...
【Python爬虫】正则表达式与re模块
正则表达式与re模块阅读目录在线正则表达式测试常见匹配模式 re.match re.search re.findall re.compile 实战练习在线正则表达式测试 http://tool ...
Python与正则表达式[0] -> re 模块的正则表达式匹配
正则表达式 / Regular Expression 目录正则表达式模式 re 模块简介使用正则表达式进行匹配正则表达式RE(Regular Expression, Regexp, Regex) ...
python 正则表达式re使用模块（match()、search()和compile()）
摘录 python核心编程 python的re模块允许多线程共享一个已编译的正则表达式对象,也支持命名子组.下表是常见的正则表达式属性: 函数/方法描述仅仅是re模块函数 compile(patt ...
正则表达式之re模块
re模块一.什么是正则表达式与re模块?1.1 字符组1.2 元字符1.2.1 单个使用1.2.2 组合使用二.为什么要使用正则三.如何使用3.1 re模块的三种比较重要的方法3.1.1 findal ...
python学习笔记（十）——正则表达式和re模块
#正则表达式和re模块 # match(pattern, string,[flag]) #在字符串开始时进行匹配 # pattern 正则表达式 # string 要匹配的字符串 # [flag] 可 ...
python正则表达式之re模块方法介绍
python正则表达式之re模块其他方法 1:search(pattern,string,flags=0) 在一个字符串中查找匹配 2:findall(pattern,string,flags=0) ...
python中的正则表达式（re模块）
一.简介正则表达式本身是一种小型的.高度专业化的编程语言,而在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎 ...
pytho day6 <正则表达式、常用模块、反射>
本节介绍: 一:正则表达式: 正则表达并不是python 独有的.在各个语言里都有该语法的介绍.正则表达是处理字符串的强大的处理工具.拥有自己的独特的处理方法.和处理引擎.虽然性能没有python ...

随机推荐

合肥.NET技术社区首次线下聚会全程回顾【多图】
2019年3月16日对于合肥.NET来说是一个特别的日子,因为这是合肥.NET技术社区首次非正式线下聚会!这次聚会受场地限制(毕竟是聚餐的形式),即使换成了小椅子后,最多也只能容纳24个人,所以还有一 ...
Linux性能评估工具
目录介绍负载:uptime 查看内核的信息: dmesg 查看内存状态: free.vmstat free: 查看内存,已用内存,剩余内存.交换分区等 vmstat:显示虚拟内存状况的信息. 查看 ...
qml demo分析(threading-线程任务)
一.关键类说明 qml内置了WorkerScript组件,该组件有一个source属性,可以加载js文件,含有一个名为message的信号,意味着他有一个默认的onMessage槽函数,除此之外他还有 ...
机器学习之KNN原理与代码实现
KNN原理与代码实现本文系作者原创,转载请注明出处:https://www.cnblogs.com/further-further-further/p/9670187.html 1. KNN原理 K ...
python3打开winodows文件问题
1,解决办法 "C:\\Users\\Darkness-02\\Desktop\\test.txt" 多加一个反斜杠就行了 2,解决办法r"C:\Users\Darkne ...
SLAM+语音机器人DIY系列：（八）高阶拓展——2.centos7下部署Django（nginx+uwsgi+django+python3)
0.安装步骤预览(1)系统默认自带python2.x,所以需要先安装python3.x(2)python2对应pip,python3对应pip3,用源码安装python3后pip3也自动安装了(3)用 ...
【译】.NET Core 3.0 Preview 3中关于ASP.NET Core的更新内容
.NET Core 3.0 Preview 3已经推出,它包含了一系列关于ASP.NET Core的新的更新. 下面是该预览版的更新列表: Razor组件改进: 单项目模板新的Razer扩展 E ...
网站集群架构（LVS负载均衡、Nginx代理缓存、Nginx动静分离、Rsync+Inotify全网备份、Zabbix自动注册全网监控）--技术流ken
前言最近做了一个不大不小的项目,现就删繁就简单独拿出来web集群这一块写一篇博客.数据库集群请参考<MySQL集群架构篇:MHA+MySQL-PROXY+LVS实现MySQL集群架构高可用/高 ...
cocos creator主程入门教程（十一）—— 有限状态机和行为树
五邑隐侠,本名关健昌,10年游戏生涯,现隐居五邑.本系列文章以TypeScript为介绍语言. 本篇介绍有限状态机和行为树.有限状态机用于有限的状态下的AI,由于同时只能处于一个状态,多个状态需要多个 ...
iview起步
ivew是一套基于vue的高质量的ui组件库.使用它我们可以非常简单的得到非常美观的页面和非常棒的用户体验. 1. 获取源码前往github下载源码,下载地址:https://github.com/ ...

正则表达式和re模块

re的元字符

字符集[ ]

转义符

分组 ( )

|符号

re下的常用方法

分组

正则表达式和re模块的更多相关文章

随机推荐

热门专题

字符集`[ ]`

分组 `( )`

`|`符号