python进阶之正则表达式
概念
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
目的
符号
正则 |
待匹配字符 |
匹配 |
说明 |
[0123456789] |
8 |
True |
在一个字符组里枚举合法的所有字符,字符组里的任意一个字符 |
[0123456789] |
a |
False |
由于字符组中没有"a"字符,所以不能匹配 |
[0-9] |
7 |
True |
也可以用-表示范围,[0-9]就和[0123456789]是一个意思 |
[a-z] |
s |
True |
同样的如果要匹配所有的小写字母,直接用[a-z]就可以表示 |
[A-Z] |
B |
True |
[A-Z]就表示所有的大写字母 |
[0-9a-fA-F] |
e |
True |
可以匹配数字,大小写形式的a~f,用来验证十六进制字符 |
字符
元字符 |
匹配内容 |
| . | 匹配除换行符以外的任意字符 |
| \w | 匹配字母或数字或下划线 |
| \s | 匹配任意的空白符 |
| \d | 匹配数字 |
| \n | 匹配一个换行符 |
| \t | 匹配一个制表符 |
| \b | 匹配一个单词的结尾 |
| ^ | 匹配字符串的开始 |
| $ | 匹配字符串的结尾 |
| \W |
匹配非字母或数字或下划线 |
| \D |
匹配非数字 |
| \S |
匹配非空白符 |
| a|b |
匹配字符a或字符b |
| () |
匹配括号内的表达式,也表示一个组 |
| [...] |
匹配字符组中的字符 |
| [^...] |
匹配除了字符组中字符的所有字符 |
量词
量词 |
用法说明 |
| * | 重复零次或更多次(贪婪匹配) |
| + | 重复一次或更多次(贪婪匹配) |
| ? | 重复零次或一次 |
| {n} | 重复n次 |
| {n,} | 重复n次或更多次 |
| {n,m} | 重复n到m次 |
实例
匹配任意数字
匹配任意小写字母
匹配任意大写字母
[A-Z] ----ABC123DEF456只要字符串中包含任意大写字符,都会被匹配
匹配数字+小写字母+大写字母
\w与\W与[\w\W](匹配所有字符)


\s与\S与[\s\S](匹配所有字符)



\d与\D与[\d\D](匹配所有字符)



\n与\t(tab制表符与\b



^(匹配一个字符串的开头) 与$

(匹配以[a-z]开头,以[a-z]结尾的字符串,这里只能匹配2个字符的字符串,因为[]代表一个字符组)
a|b(从左向右匹配,优先匹配a)


(左边匹配了,右边不会再匹配)
[^...]


组合练习
*+?{}
| 待匹配字符串 | 正则表达式 | 匹配结果 | 说明 |
|
小李和小王和小亮 小李和小王王和小亮亮亮 |
[^和]+ |
小李 小李 |
匹配非'和'的所有字符串多次 |
| 小李和小王王和小亮亮亮 | [^和]{2,4} | 小李 小王王 小亮亮亮 |
匹配非‘和’的所有字符串2到4次 |
| 小李和小王王和小亮亮亮 | [^和]{2,4}? | 小李 小王 小亮 亮亮 |
匹配非‘和’的所有字符串2次 |
| 小李和小王王和小亮亮亮 | 小.? | 小李 小王 小亮 |
匹配小后面任意字符0次或1次 |
| 小李和小王王和小亮亮亮 | 小.* | 小李和小王王和小亮亮亮 | 匹配小后面任意字符0次或多次 |
| 小李和小王王和小亮亮亮 | 小.+ | 小李和小王王和小亮亮亮 | 匹配小后面任意字符一次或多次 |
| 小李和小王王和小亮亮亮 | 小.{1,2} | 小李和 小王王 小亮亮 |
匹配小后面任意字符一次到2次 |
| 小李和小王王和小亮亮亮 | 小.*? | 小 小 小 |
匹配小后面任意字符0次(因为有?限制,表示匹配最少的页就是0次即什么都不匹配) |
字符集[] [^]
| 待匹配字符串 | 正则表达式 | 匹配结果 | 说明 |
| 小李和小王王和小亮亮亮 | 小[李王王亮亮亮]* | 小李 小王王 小亮亮亮 |
匹配小后面字符组里面任意字符0次或多次 |
| 小李和小王王和小亮亮亮 | 小[^和]* | 小李 小王王 小亮亮亮 |
匹配小后面非和子的任意字符0次或多次 |
| 123abc345 | [\d] |
1 2 3 3 4 5 |
匹配任意一个数字 |
| 123abc345 | [\d]* |
123 345 |
匹配任意多个数字 |
| 123abc345 | [\d]+ |
123 345 |
匹配任意多个数字 |
分组()与或 | [^]
匹配15位或18位身份证,15位需都是数字组成,18位可以是数字或x结尾,首位都不能为0
| 待匹配字符串 | 正则表达式 | 匹配结果 | 说明 |
| 110621199012014599 | ^[1-9]\d{13,16}[0-9x]$ | 110621199012014599 | 可以匹配到一个正确的身份证,但是如果是16位1106211990120145也同样能匹配到,但是这并不是身份证 |
| ^[1-9]\d{14}(\d{2}[0-9x])?$ | 不会再匹配错误的身份证(你可以试试的) | ||
| 110621199012014599 | ^([1-9]\d{16}[0-9x]|[1-9]\d{14})$ | 110621199012014599 | 这个是比较好的表达式,先匹配18位,再匹配15位 |
总结
要想熟练的使用正则表达式,还是要多练多写吧! 希望大家能像计算1+1=2这么简单的使用正则表达式
python进阶之正则表达式的更多相关文章
- python进阶11 正则表达式
python进阶11 正则表达式 一.概念 #正则表达式主要解决什么问题? #1.判断一个字符串是否匹配给定的格式,判断用户提交的又想的格式是否正确 #2.从一个字符串中按指定格式提取信息,抓取页面中 ...
- python进阶(20) 正则表达式的超详细使用
正则表达式 正则表达式(Regular Expression,在代码中常简写为regex. regexp.RE 或re)是预先定义好的一个"规则字符率",通过这个"规 ...
- Python 进阶 - 正则表达式
1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...
- [.net 面向对象程序设计进阶] (2) 正则表达式 (一) 快速入门
[.net 面向对象程序设计进阶] (2) 正则表达式 (一) 快速入门 1. 什么是正则表达式? 1.1 正则表达式概念 正则表达式,又称正则表示法,英文名:Regular Expression(简 ...
- python模块 re模块与python中运用正则表达式的特点 模块知识详解
1.re模块和基础方法 2.在python中使用正则表达式的特点和问题 3.使用正则表达式的技巧 4.简单爬虫例子 一.re模块 模块引入; import re 相关知识: 1.查找: (1)find ...
- Python进阶(十二)----re模块
Python进阶(十二)----re模块 一丶re模块 re模块是python将正则表达式封装之后的一个模块.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行. #正则表达式: ...
- 尚学python课程---15、python进阶语法
尚学python课程---15.python进阶语法 一.总结 一句话总结: python使用东西要引入库,比如 json 1.python如何创建类? class ClassName: :以冒号结尾 ...
- Python高手之路【五】python基础之正则表达式
下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print( ...
- python基础之正则表达式
正则表达式语法 正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则 ...
随机推荐
- Python时间和时间戳互相转换
# 将时间变成时间戳 def tranftimestamp(stringtime): try: return time.mktime(time.strptime(stringtime, "% ...
- python安装whl文件
在命令指示符下(cmd)的Python3安装命令为: pip3 install 文件名.whl 安装出错: matplotlib-2.0.0-cp34-cp34m-win_amd64.whl is n ...
- qt cef嵌入web(二)
在qt cef嵌入web文章中已经讲述了怎么把cef页面嵌入到qt程序中,但是这样并不完美,因为如果需要在多个窗口上创建cef浏览器部件的话,在 消息监听部分没有办法做区分多个浏览器事件,在这篇文章中 ...
- 浅谈Web开发中的定时任务
曾经做过Windows server下的定时任务的业务,最近又做了一些Linux下使用Crontab做的定时任务的业务,觉得有必要进行一次小结,于是有了如下这篇文章. Windows Server下 ...
- 设计模式java实现合集
http://www.cnblogs.com/maowang1991/archive/2013/04/15/3023236.html 桥接模式:http://blog.csdn.net/jason05 ...
- EF架构~migration对mysql数据库的迁移
回到目录 ef这个orm工具确实强大,无论在实体建模还是在实体关系上,都发挥的很出色,而最近的code first针对数据库变更的使用更让我眼前一亮,先不说对sqlserver的支持,因为mssql本 ...
- spring cloud 配置zuul实用
在线演示 演示地址:http://139.196.87.48:9002/kitty 用户名:admin 密码:admin 技术背景 前面我们通过Ribbon或Feign实现了微服务之间的调用和负载均衡 ...
- shell初识
今天写blog才发现以前还有没写起的,我的天,我是睡着了么... 1,什么是shell? shell是unix/Linux系统的一个用充当内核与用户之间的接口的软件,它读取用户的输入命令,发送给内核让 ...
- hadoop 1.0.1集群安装及配置
1.hadoop下载地址:http://www.apache.org/dyn/closer.cgi/hadoop/core/ 2.下载java6软件包,分别在三台安装 3.三台虚拟机,一台作为mast ...
- kubernetes系列06—kubernetes资源清单定义入门
本文收录在容器技术学习系列文章总目录 1.认识kubernetes资源 1.1 常用资源/对象 workload工作负载型资源:pod,ReplicaSet,Deployment,StatefulSe ...