python(33)——【re模块】
re模块(正则表达式)
- 就其本质而言,正则表达式是一种小型的、高度专业化的编程语言
- 在Python中(它内嵌在python中),并通过re模块来实现,正则表达式被编译成一系列的字节码,然后由C编写的匹配引擎执行
正则:模糊匹配(针对字符串的一些操作),匹配的是这些元素的共性
字符匹配(普通字符,元字符)
1.普通字符:大多数字符和字母都会和自身匹配
import re
print(re.findall('alex', 'aabuscdalexduye')) #执行结果:
['alex']
2.元字符: . ^ * + ? {} [] | () \
. 通配符(除了换行符\n),一个点代表一个字符
import re
print(re.findall('a.x', 'a0xuscdaexduayx'))
print(re.findall('a..x', 'a01xuscdabexduayx'))
print(re.findall('a...x', 'a01xuscdabexduayx')) #执行结果:
['a0x', 'aex', 'ayx']
['a01x', 'abex']
[]
^ 在字符串的开头进行内容匹配
import re
print(re.findall('a.x', 'awxuscdaexduayx'))
print(re.findall('^a.x', 'awxuscdaexduayx'))
print(re.findall('^a.x', 'axuscdaexduayx')) #执行结果:
['awx', 'aex', 'ayx']
['awx']
[]
$ 在字符串的结尾进行内容匹配
import re
print(re.findall('a.x', 'awxuscdaexduayx'))
print(re.findall('a.x$', 'awxuscdaexduayx'))
print(re.findall('a.x$', 'axuscdaexduax')) #执行结果:
['awx', 'aex', 'ayx']
['ayx']
[]
重复符号:* + ? {}
* 代表 [0,∞)
+ 代表 [1, ∞]
import re
print(re.findall('alex*', 'aledhabeafaalexxg')) #x的个数大于等于0便可以进行匹配
print(re.findall('alex+', 'aledhabeafaalexxg')) #x的个数大于等于1便可以进行匹配 #执行结果:
['ale', 'alexx']
['alexx']
? 代表 [0, 1]
import re
print(re.findall('alex?', 'aledhabeafaalexxg')) #x的个数等于0或者1便可以进行匹配 #执行结果:
['ale', 'alex']
{} 可以表示任何范围
{0,} ==> *
{1,} ==> +
{0,1} ==> ?
import re
print(re.findall('alex{0,}', 'aledhabeafaalexxg'))
print(re.findall('alex{1,}', 'aledhabeafaalexxg'))
print(re.findall('alex{0,1}', 'aledhabeafaalexxg')) #执行结果:
['ale', 'alexx']
['alexx']
['ale', 'alex']
#注意:* + ?等是贪婪匹配,也就是尽可能匹配,后面加?使其变成惰性匹配(所谓惰性匹配,是指最少匹配)
import re
print(re.findall('alex*', 'aledhabeafaalexxg')) #x大于等于0便可以匹配
print(re.findall('alex*?', 'aledhabeafaalexxg')) #x等于0匹配
print(re.findall('alex+', 'alexxxdhalebeafaalexxg')) #x大于等于1便可以匹配
print(re.findall('alex+?', 'alexxxdhalebeafaalexxg')) #x等于1匹配
print(re.findall('alex?', 'aledhabeafalexaalexxg')) #x等于0或者1可以匹配
print(re.findall('alex??', 'aledhabeafalexaalexxg')) #x等于0匹配 #执行结果:
['ale', 'alexx']
['ale', 'ale']
['alexxx', 'alexx']
['alex', 'alex']
['ale', 'alex', 'alex']
['ale', 'ale', 'ale']
[] 字符集:在字符集中,没有特殊符号(在字符集里有功能的符号:- ^ \)
import re
print(re.findall('x[yz]c', 'xycssxcxzc')) #出现在字符集中的字符是或的关系 #执行结果:
['xyc', 'xzc']
import re
print(re.findall('x[z*]c', 'x*cssxcxzzc')) #在字符集中,*没有特殊含义,只代表一个字符而已 #执行结果:
['x*c']
在字符集里有功能的符号:- 代表的意思是范围
import re
import re
print(re.findall('x[abcdef]x','bamxadxbxaaxcxmm'))
print(re.findall('x[a-f]x','bamxadxbxaaxcxmm'))
print(re.findall('x[a-f]*x','xbamxadxbxaaxcxmmx')) #执行结果:
['xbx', 'xcx']
['xbx', 'xcx']
['xadx', 'xaax']
在字符集里有功能的符号:^ 代表的意思是非
import re
print(re.findall('x[a-z]x','bamxaxbx1xcxmm'))
print(re.findall('x[^a-z]x','bamxaxbx1xcxmm')) #执行结果:
['xax', 'xcx']
['x1x']
在字符集里有功能的符号: \
- \后边跟元字符为去除特殊功能,比如\.
- \后边跟普通字符为实现特殊功能,比如\d
- \d 匹配任何十进制数,它相当于类[0-9]
- \D 匹配任何非数字字符,它相当于类[^0-9]
- \s 匹配任何空白字符,它相当于类[\t\n\r\f\v]
- \S 匹配任何非空白字符,它相当于类[^\t\n\r\f\v]
- \w 匹配任何字母数字字符,它相当于类[a-zA-Z0-9]
- \W 匹配任何非字母数字字符,它相当于类[a-zA-Z0-9]
- \b 匹配一个特殊字符边界,比如空格,&,#等
python(33)——【re模块】的更多相关文章
- python使用xlrd模块读写Excel文件的方法
本文实例讲述了python使用xlrd模块读写Excel文件的方法.分享给大家供大家参考.具体如下: 一.安装xlrd模块 到python官网下载http://pypi.python.org/pypi ...
- python解析xml模块封装代码
在python中解析xml文件的模块用法,以及对模块封装的方法.原文转自:http://www.jbxue.com/article/16586.html 有如下的xml文件:<?xml vers ...
- python中string模块各属性以及函数的用法
任何语言都离不开字符,那就会涉及对字符的操作,尤其是脚本语言更是频繁,不管是生产环境还是面试考验都要面对字符串的操作. python的字符串操作通过2部分的方法函数基本上就可以解决所有的字符串 ...
- 【Python之路】第六篇--Python基础之模块
模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才 ...
- Python中re模块的使用
#table-1 thead,#table-1 tr { border-top-width: 1px; border-top-style: solid; border-top-color: rgb(2 ...
- Python 中包/模块的 `import` 操作
版权声明:博客为作者原创,允许转载,但必须注明原文地址: https://www.cnblogs.com/byronxie/p/10745292.html 用实例来说明 import 的作用吧. 创建 ...
- 周末班:Python基础之模块
什么是模块 什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1 使用python编写 ...
- 正则表达式与Python中re模块的使用
正则表达式与Python中re模块的使用 最近做了点爬虫,正则表达式使用的非常多,用Python做的话会用到re模块. 本文总结一下正则表达式与re模块的基础与使用. 另外,给大家介绍一个在线测试正则 ...
- python的定时任务模块--schedule
首先先安装一下模块 下面我们简单的学习一下schedule模块 先简单的看个示例 import schedule def test(*args,**kwargs): print("hello ...
- Python远程连接模块-Telnet
Python远程连接模块-Telnet 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 虽然现在主流的python版本还是2.7,相信2020年python程序员都会偏向Python ...
随机推荐
- 最新WordConut
一.代码地址:https://gitee.com/cainiaoY/WordCount 二.项目分析:代码根据实现的功能不同分为两个模块,一个wcFuctiong类,一个wcTest类,其中wcFuc ...
- 【Django】HTTP status code must be an integer.
刚刚出现这个问题,还以为是表单提交或者什么网络错误 结果发现是自己的低级错误写了 HttpResponse(request,'sigin_result2.html',context)这个根本不能渲染模 ...
- Python设计模式 - UML - 用例图(Use Case Diagram)
简介 用例图主要是从用户的角度出发对软件产品的功能及执行者进行描述的. 用例图是从需求分析到软件交付的第一步,图示化展示参与者与参与者之间.参与者与用例之间.用例与用例之间的关系,帮助开发人员更好的理 ...
- as3.0 当fla里面有TLF文本的时候,加载声音会出现错误
问题描述 1.现有制作好的mp3加载包,这个包是相对路径 2.如果fla里面没有TLF文本,可以正常运行 解题思路 1.音频的相对路径和加载TLF文本的路径不一样,fla会优先选择TLF文件,这样mp ...
- 394. Decode String 解码icc字符串3[i2[c]]
[抄题]: Given an encoded string, return it's decoded string. The encoding rule is: k[encoded_string], ...
- Retrofit 2.0基于OKHttp更高效更快的网络框架 以及自定义转换器
时间关系,本文就 Retrofit 2.0的简单使用 做讲解 至于原理以后有空再去分析 项目全面.简单.易懂 地址: 关于Retrofit 2.0的简单使用如下: https://gitee.c ...
- linux svnserver的安装使用备用
先说一下初弄者的误区,svn上传到svnserver的文件是变化了的,会被打包加入svn的版本库里边一般存在db 文件下 每次提交会生成0,1,2 这样排序的文件,在 /var/svn/apple/ ...
- springmvc为什么是线程不安全的
1.因为springmvc默认是单例的,所以会有线程安全的问题,如果存在全局变量,因为全局变量是存在方法区的,而局部变量是放在栈中的,方法区是所有线程公用的,而每个线程都有属于自己的栈.所以如果使用单 ...
- python_paramiko
目录: paramiko模块介绍 paramiko模块安装 paramiko模块使用 一.paramiko模块介绍 paramiko是一个用于做远程控制的模块,使用该模块可以对远程服务器进行命令或文件 ...
- Android 简单布局、控件
布局 线性布局 LinearLayout <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android ...