• 什么是正则表达式:

正则表达式是一个特殊的字符序列,能帮助我们方便的检查一个字符串是否与某种模式匹配(定义往往都很枯燥)

也称之为”模式“,即可用于检查一个给定的字符串是否符合某种模式

举例:

我们定义一个模式,平常经常用到的日期模式:XXXX-XX-XX,2018-03-10

在正则表达式的模式定义语法里:\d用来指定一个数字,因此我们将日期的正则表达式的模式定义成:”\d\d\d\d-\d\d-\d\d"

  • 什么是元字符:

元字符是一些在正则表达式中有特殊用途、不代表它本身字符意义的一组字符

利用元字符,我们可以控制字符串匹配的方式

比如上例中的\d,用来指定一个数字,"相当于[0-9],匹配任何单个的数字字符",而非d字母本身

  • 元字符各自含义

    正则表达式的完整元字符及各自的含义(主要有11个):

.   ^   $  *  +  ?  \   |   { }    []    ()

我们选挑重要的依次进行解释

1.[ ] 方括号

(1) 常用来指定一个字符集,如[abcd]匹配:a或b或c或d

(2) 元字符在”[]”中不起所用,比如:[a+]匹配:a或+

(3) 补集匹配:[^a],匹配非a的一个字符

(4) 匹配连续字符:[a-zA-Z0-9],匹配大小写英文字母和数字

2.^

匹配行首,直接匹配字符串中的每一个换行

3.$

匹配行尾,行尾是指:字符串尾,或一个换行字符后的任何位置

4.\

转义字符,如果要匹配”\”本身,需要使用再次转义:”\\”

一些特殊字符:

\d:匹配:[0-9]

\D:匹配:[^0-9],与 \d 相反,匹配任何非十进制数字的字符

\s:匹配:任何空白符,即:[\t\n\r\f\v]

\S:匹配:任何非空白符,即:[^\t\n\r\f\v]

\w:匹配:[a-zA-Z0-9_ ],即匹配任何字符

\W:匹配:[^a-zA-Z0-9_ ],与\w相反

5. *

匹配前一个字符或子表达式出现0次或多次

例如:ca*t 将匹配 ct(0 个字符 a),cat(1 个字符 a),caaat(3 个字符 a)

6. +

匹配前一个字符或子表达式出现1次或多次

例如: ca+t 会匹配 cat 和 caaat,但不会匹配 ct。

7.?

匹配前一个字符或子表达式出现1次或0次

例如 :大?帅哥 可以匹配 大帅哥,也可以匹配 帅哥。

8.{ }

匹配前一个字符或子表达式出现指定次数(即代表重复)

{0,}:0次或多次,相当于”*”

{1,}:1次或多次,相当于”+”

{0,1}:0次或1次,相当于”?”

{m,n}:m次到n次(m <= n),m是最少重复的次数,n是最多重复的次数

9.  .

匹配除换行符以外的任意一个字符

10. |

每一种条件匹配一次,且"|"和"[]"效果是相同的,返回形式一样

例如:

>>> print (re.findall(r"[abc]","abc"))

['a','b','c']

>>> print (re.findall(r"[a|b|c]","abc"))

['a','b','c']

11. ( )

圆括号分组匹配使得匹配返回元组

例如:

>>> print (re.findall(r"one two three four five six",a))

['one two three four five six']

>>> print (re.findall(r"(one) (two) (three) (four) (five) (six)",a))

[ ]返回空

  • python语言中的re模块

在python语言中,re模块用于提供正则表达式的全部功能,而re模块中最重要的两个函数是match()和re.search()

re.match()简介

格式:re.match(pattern,string,flag=0),

第一个参数pattern用于传入需要匹配的模式定义字符串

第二个参数string用于传入被匹配和检查的字符串内容

第三个flag用于传入标识,如是否区分大小写

例1:

import re

print(re.match("\d\d\d\d-\d\d-\d\d","2018-03-09"))

运行结果:<_sre.SRE_Match object; span=(0, 10), match='2018-03-09'>

代表2018-03-09符合我们定义的日期模式

例2:

import re

print(re.match("\d\d\d\d-\d\d-\d\d","2018-3-9"))

运行结果:NONE

代表不符合

思考一下,如何既满足符合一个数字的月份和日又符合两个数字的月份和日(见例3)

例3:

import re

print(re.match("\d\d\d\d-\d{1,2}-\d{1,2}","2018-3-9"))

如果看不懂,请返回到上节8.{}介绍部分

例4:

再思考一下,下面的代码

import re

print(re.match("\d{4}-\d{1,2}-\d{1,2}","2018-3-9"))

例5:

思考一下,下面的代码(可先看一下上一节\s和*的含义)

imprt re

print(re.match("\s*\d{4}-\d{1,2}-\d{1,2}","   2017-05-08")

代码是为了兼容日期前面如果出现多个空格的情况使用 \s*

例6:

import re

print(re.match("Dehom","Dehom Wang"))

回归最简单模式就是字符串本身,这很重要

补充知识:

Python中字符串前面加上 r 表示原生字符串,(r=raw)

Python里的原生字符串很好地解决了需要\转义字符这个问题,例如匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串,不用担心是不是漏写了反斜杠,写出来的表达式也更直观

python笔记-正则表达式的更多相关文章

  1. python笔记-正则表达式常用函数

    1.re.findall()函数 语法:re.findall(pattern,string,flags=0) --> list(列表) 列出字符串中模式的所有匹配项,并作为一个列表返回.如果无匹 ...

  2. s21day25 python笔记

    s21day25 python笔记 正则表达式 1.定义 定义:正则表达式是一种规则匹配字符串的规则 re模块本身只是用来操作正则表达式的,和正则本身没关系 为什么要有正则表达式? 匹配字符串 一个人 ...

  3. Python:笔记(6)——正则表达式

    Python:笔记(6)——正则表达式 re模块 re模块用于在字符串中执行基于正则表达式模式的匹配和替换. 使用原始字符串 正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串 ‘pytho ...

  4. [Python学习笔记]正则表达式总结

    常用缩写字符及其含义表格查询 缩写字符分类 含义 \d 0-9的任意数字 \D 除0-9的数字以外的任何字符 \w 任何字母.数字或下划线字符(可以认为是匹配"单词"字符) \W ...

  5. Python笔记之不可不练

    如果您已经有了一定的Python编程基础,那么本文就是为您的编程能力锦上添花,如果您刚刚开始对Python有一点点兴趣,不怕,Python的重点基础知识已经总结在博文<Python笔记之不可不知 ...

  6. python笔记 - day6

    python笔记 - day6 参考: http://www.cnblogs.com/wupeiqi/articles/5501365.html 大纲: 利用递归,实现阶乘: Python反射 pyt ...

  7. python笔记之常用模块用法分析

    python笔记之常用模块用法分析 内置模块(不用import就可以直接使用) 常用内置函数 help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像 ...

  8. Python:正则表达式详解

    正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能 ...

  9. python 笔记2016

    列表,元组(不可添加和修改),字典 3种集合模式 模块----类---函数 要把文件变成双击运行,要把文件的属性选择python安装目录下的python.exe 1,查看数据类型 print(type ...

随机推荐

  1. RxJS 中的观察者和迭代器模式

    目录 前言 观察者模式 迭代器模式 RxJS 中两种模式的结合和实现 小结 参考 1. 前言 RxJS 是一个库,它通过使用observable(可观察对象)序列来编写异步和基于事件的程序.其结合了观 ...

  2. python2.3嵌套if结构:

    #案例:存款100万的请款下,买宝马:老爸资助大于50万买宝马740:大于30万买宝马520:小于20万宝马320.存款大于50万小于100万买丰田:大于20万小于50万买二手车:小于20万自行车! ...

  3. django python manage.py runserver 流程

    python manage.py runserver 流程分析 版本 python27 django 1.0 搭建可运行的环境 创建python27 虚拟环境 github 下载 django-1.0 ...

  4. idea只导入部分依赖

    首先为啥会导入部分依赖的呢? 可能是网络问题下载不下来,可以排除这一个,因为刚换的merrio阿里的源,而且之前都能下载 也可能是maven的设置问题,上网上搜了一些设置之后,还是不管用 然后怀疑是不 ...

  5. 分享:C语言大礼包(PDF)

    链接:https://pan.baidu.com/s/1xpOcT1gRhdumV5MlkC4AFQ 提取码:4kh6

  6. python_appium使用原理

    一. appium介绍 Appium是一个开源测试自动化框架,可用于原生,混合和移动Web应用程序测试. 它使用WebDriver协议驱动iOS,Android和Windows应用程序. 多平台支持: ...

  7. 极简 Node.js 入门 - 2.1 Path

    极简 Node.js 入门系列教程:https://www.yuque.com/sunluyong/node 本文更佳阅读体验:https://www.yuque.com/sunluyong/node ...

  8. Android 开发学习进程0.16 layout_weight属性 R文件关联XML Module

    layout_weight属性 layout_weight属性我们常常用到,但有时候会发现它还有一些奇怪的属性,比如大多数使用时会把宽度设置成0,但要是宽度不设置成0会有什么效果? layout_we ...

  9. 洛谷P1308.统计单词数(字符串匹配)

    题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给 ...

  10. HahMap(jdk=1.8)源码解读

    简介:岁月磨平了人的棱角,让我们不敢轻易的去放手,即使它在你心中并不那么重要,你依旧害怕失去它,不是舍不得,是内心的迷茫. 一 : 创建HashMap HashMap<Object, Objec ...