re正则模块

本节内容:

  • 正则介绍
  • 元字符及元字符集
  • 元字符转义符
  • re模块下的常用方法
正则介绍(re)

正则表达式(或 RE)是一种小型的、高度专业化的编程语言.

在Python中,它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

元字符及元字符集

1、元字符之. ^ $ * + ? { }

 import re

 ret = re.findall('o...n', 'oksdaoceanaaaddf')

 print(ret)  # ['ocean']

 ret = re.findall('^o...n', 'oceanhelloowwwn') #以o开头的才能匹配上,这里的头是整个字符串的开头

 print(ret)  # ['ocean']

 ret = re.findall('o...n', 'ooceanhelloowwwn')

 print(ret)  # ['ocean','owwwn']

 ret = re.findall('o...n$', 'oceanhelloowwwn') #以n为结尾的匹配,整个字符串的结尾

 print(ret)  # ['owwwn']

 ret = re.findall('abc*', 'abcccc')  # 贪婪匹配[0,+∞]

 print(ret)  # ['abcccc']

 ret = re.findall('abc+', 'abccc')  # [1,+∞]

 print(ret)  # ['abccc']

 ret = re.findall('abc?', 'abccc')  # [0,1]

 print(ret)  # ['abc']

 ret = re.findall('abc{1,4}', 'abccc')

 print(ret)  # ['abccc'] 贪婪匹配

注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配

ret=re.findall('abc*?','abcccccc')
print(ret)#['ab']

字符集

 # --------------------------------------------字符集[]
 ret = re.findall('a[bc]d', 'acd')
 print(ret)  # ['acd']

 ret = re.findall('[a-z]', 'acd')
 print(ret)  # ['a', 'c', 'd']

 ret = re.findall('[.*+]', 'a.cd+')
 print(ret)  # ['.', '+']

 # 在字符集里有功能的符号: - ^ \

 ret = re.findall('[1-9]', '45dha3')  #‘-’在字符集是指范围
 print(ret)  # ['4', '5', '3']

 ret = re.findall('[^ab]', '45bdha3')  #^在字符集[]里是‘非’的意思
 print(ret)  # ['4', '5', 'd', 'h', '3']

 ret = re.findall('[\d]', '45bdha3')  #\在字符集中是转义,即有意义字符可以转换成普通字符,无意义字符可转化成特殊意义
 print(ret)  # ['4', '5', '3']

 ret = re.findall('\d+','45bda3')
 print(ret)  #['45', '3']
转义字符‘\’

反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等

ret=re.findall('I\b','I am LIST')
print(ret)#[]
ret=re.findall(r'I\b','I am LIST')
print(ret)#['I']

 #-----------------------------eg1:
 import re
 ret=re.findall('c\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\\\l','abc\le')
 print(ret)#['c\\l']
 ret=re.findall(r'c\\l','abc\le')
 print(ret)#['c\\l']

 #-----------------------------eg2:
 #之所以选择\b是因为\b在ASCII表中是有意义的
 m = re.findall('\bblow', 'blow')
 print(m)
 m = re.findall(r'\bblow', 'blow')
 print(m)

Python全栈开发【re正则模块】的更多相关文章

  1. Python 全栈开发六 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve configparser hashlib 一. ...

  2. Python 全栈开发九 日志模块

    日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.一个事件可以用一个可包含可选变量数据的消息来描述.此外,事件也有重要性的概念 ...

  3. python全栈开发day22-常用模块二(hashlib、configparse、logging)

    一.昨日内容回顾 1.钻石继承 #新式类,本身或父类显示继承object #找名字的时候是广度优先顺序 #有mro方法,super方法, # super并不是单纯的找父类,和mro顺序是完全对应的 # ...

  4. python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)

    1.昨日内容回顾 1.正则表达式     # 正则表达式 —— str           # 检测字符串是否符合要求     # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...

  5. Python全栈开发-Day5-常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil shelve xml处理 pyyaml处理 configparser hashlib re正则 ...

  6. Python全栈开发:configparser模块

    #!/usr/bin/env python # -*- coding;utf-8 -*- import configparser # 创建对象 conn = configparser.ConfigPa ...

  7. python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))

    python全栈开发笔记第二模块   第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用      有一个需求 : 从文件中读取所有联 ...

  8. python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

    python全栈开发笔记第二模块 第四章 :常用模块(第二部分)     一.os 模块的 详解 1.os.getcwd()    :得到当前工作目录,即当前python解释器所在目录路径 impor ...

  9. python全栈开发之正则表达式和python的re模块

    正则表达式和python的re模块 python全栈开发,正则表达式,re模块 一 正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的 ...

  10. Python全栈开发【模块】

    Python全栈开发[模块] 本节内容: 模块介绍 time random os sys json & picle shelve XML hashlib ConfigParser loggin ...

随机推荐

  1. DrawerLayout 和 NavigationView 的使用

    参考: 1.NavigationView 的使用 2.NavigationView更改菜单icon和title颜色变化效果 3.Android 自己实现 NavigationView 转了第一篇   ...

  2. php代码小实例

    php多图上传 <html> <meta http-equiv="Content-Type" content="text/html; charset=u ...

  3. caffe中卷积层和pooling层计算下一层的特征map的大小

    pool层,其中ceil是向上取整函数 卷积层:

  4. 贝赛尔曲线UIBezierPath

    使用UIBezierPath类可以创建基于矢量的路径,这个类在UIKit中.此类是Core Graphics框架关于path的一个封装.使用此类可以定义简单的形状,如椭圆或者矩形,或者有多个直线和曲线 ...

  5. 让 FreeBSD 和 Gentoo Linux 在 ZFS 存储卷上共存

    自我回归到 Librem 15 已经有段时间了.我一般会选择 FreeBSD 来处理所有的事情,但有时会要访问一个运行在 Librem 平台上的 Linux OS,以便用它来帮助我对一些遗留的设备驱动 ...

  6. 火车头dede采集接口,图片加水印,远程图片本地化,远程无后缀的无图片本地化

    <?php /* [LocoySpider] (C)2005-2010 Lewell Inc. 火车采集器 DedeCMS 5.7 UTF8 文章发布接口 Update content: 图片加 ...

  7. SQL Server 2008 允许远程连接的配置

    如果无法通过IP地址远程连接你的SQL Server 2008服务器,可以参考下面的内容进行设置.在进行下述设置之前,应该确保你的网络已经安装设置完毕,服务器已经正常连接到网络中. 1.单击Windo ...

  8. input file限制上传文件类型

    http://www.cnblogs.com/haocool/p/3431181.html http://www.haorooms.com/post/input_file_leixing http:/ ...

  9. 美国usan数据库——PDF提取

    QQ:231469242 原创 单个PDF内容提取 # -*- coding: utf-8 -*- """ io.open() is the preferred, hig ...

  10. android中导入低版本project可能会遇到的编译问题(转自: Victor@Beijing)

    使用高版本的SDK后再导入以前用低版本的project时,会遇到一些兼容性的问题. (1)Unable to resolve target 'android-5' 因为本机中现在使用的是2.2的SDK ...