re正则模块

本节内容:

  • 正则介绍
  • 元字符及元字符集
  • 元字符转义符
  • re模块下的常用方法
正则介绍(re)

正则表达式(或 RE)是一种小型的、高度专业化的编程语言.

在Python中,它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

元字符及元字符集

1、元字符之. ^ $ * + ? { }

 import re

 ret = re.findall('o...n', 'oksdaoceanaaaddf')

 print(ret)  # ['ocean']

 ret = re.findall('^o...n', 'oceanhelloowwwn') #以o开头的才能匹配上,这里的头是整个字符串的开头

 print(ret)  # ['ocean']

 ret = re.findall('o...n', 'ooceanhelloowwwn')

 print(ret)  # ['ocean','owwwn']

 ret = re.findall('o...n$', 'oceanhelloowwwn') #以n为结尾的匹配,整个字符串的结尾

 print(ret)  # ['owwwn']

 ret = re.findall('abc*', 'abcccc')  # 贪婪匹配[0,+∞]

 print(ret)  # ['abcccc']

 ret = re.findall('abc+', 'abccc')  # [1,+∞]

 print(ret)  # ['abccc']

 ret = re.findall('abc?', 'abccc')  # [0,1]

 print(ret)  # ['abc']

 ret = re.findall('abc{1,4}', 'abccc')

 print(ret)  # ['abccc'] 贪婪匹配

注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配

ret=re.findall('abc*?','abcccccc')
print(ret)#['ab']

字符集

 # --------------------------------------------字符集[]
 ret = re.findall('a[bc]d', 'acd')
 print(ret)  # ['acd']

 ret = re.findall('[a-z]', 'acd')
 print(ret)  # ['a', 'c', 'd']

 ret = re.findall('[.*+]', 'a.cd+')
 print(ret)  # ['.', '+']

 # 在字符集里有功能的符号: - ^ \

 ret = re.findall('[1-9]', '45dha3')  #‘-’在字符集是指范围
 print(ret)  # ['4', '5', '3']

 ret = re.findall('[^ab]', '45bdha3')  #^在字符集[]里是‘非’的意思
 print(ret)  # ['4', '5', 'd', 'h', '3']

 ret = re.findall('[\d]', '45bdha3')  #\在字符集中是转义,即有意义字符可以转换成普通字符,无意义字符可转化成特殊意义
 print(ret)  # ['4', '5', '3']

 ret = re.findall('\d+','45bda3')
 print(ret)  #['45', '3']
转义字符‘\’

反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等

ret=re.findall('I\b','I am LIST')
print(ret)#[]
ret=re.findall(r'I\b','I am LIST')
print(ret)#['I']

 #-----------------------------eg1:
 import re
 ret=re.findall('c\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\\\l','abc\le')
 print(ret)#['c\\l']
 ret=re.findall(r'c\\l','abc\le')
 print(ret)#['c\\l']

 #-----------------------------eg2:
 #之所以选择\b是因为\b在ASCII表中是有意义的
 m = re.findall('\bblow', 'blow')
 print(m)
 m = re.findall(r'\bblow', 'blow')
 print(m)

Python全栈开发【re正则模块】的更多相关文章

  1. Python 全栈开发六 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve configparser hashlib 一. ...

  2. Python 全栈开发九 日志模块

    日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.一个事件可以用一个可包含可选变量数据的消息来描述.此外,事件也有重要性的概念 ...

  3. python全栈开发day22-常用模块二(hashlib、configparse、logging)

    一.昨日内容回顾 1.钻石继承 #新式类,本身或父类显示继承object #找名字的时候是广度优先顺序 #有mro方法,super方法, # super并不是单纯的找父类,和mro顺序是完全对应的 # ...

  4. python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)

    1.昨日内容回顾 1.正则表达式     # 正则表达式 —— str           # 检测字符串是否符合要求     # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...

  5. Python全栈开发-Day5-常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil shelve xml处理 pyyaml处理 configparser hashlib re正则 ...

  6. Python全栈开发:configparser模块

    #!/usr/bin/env python # -*- coding;utf-8 -*- import configparser # 创建对象 conn = configparser.ConfigPa ...

  7. python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))

    python全栈开发笔记第二模块   第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用      有一个需求 : 从文件中读取所有联 ...

  8. python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

    python全栈开发笔记第二模块 第四章 :常用模块(第二部分)     一.os 模块的 详解 1.os.getcwd()    :得到当前工作目录,即当前python解释器所在目录路径 impor ...

  9. python全栈开发之正则表达式和python的re模块

    正则表达式和python的re模块 python全栈开发,正则表达式,re模块 一 正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的 ...

  10. Python全栈开发【模块】

    Python全栈开发[模块] 本节内容: 模块介绍 time random os sys json & picle shelve XML hashlib ConfigParser loggin ...

随机推荐

  1. xss篇-本着就了解安全本质的想法,尽可能的用通俗易懂的语言去解释安全漏洞问题

    前言 最早接触安全也是从xss攻击和sql注入攻击开始的. 0x01    跨站脚本攻击漏洞(XSS),是客户端脚本安全中的头号大敌,owasp top10 屡居榜首,由于攻击手法较多,开发者水平不一 ...

  2. python venv下安装mysql出错 解决方法

    1.首先使用exe文件安装python-mysql.链接: http://pan.baidu.com/s/1kVqILTX 密码: manj. 2.虚拟环境创建后,我们把已经在公共环境使用exe安装好 ...

  3. angularjs $emit $on $broadcast 父子 兄弟之间传值

    父子之间 <div ng-controller="ParentCtrl"> <div ng-controller="ChildCtrl"> ...

  4. Beta版本冲刺第四天

    Aruba 408 409 410 428 429 431 完成任务: 更改了一些边界模糊的图标 完善分享功能 立会照片: 燃尽图: commit: coding.net: https://codin ...

  5. Mac OSX:Powerline风格的zsh配置

    需要的工具 iTerm,一个替代OSX自带终端的软件,基于iTerm才能实现上面的效果: oh-my-zsh,zsh是OSX上最强大的shell,没有之一,但是配置过程较为复杂,这个脚本能够帮你一键配 ...

  6. iOS - 消息转发处理

    详细运行时基础 NSInvocation介绍 NSHipster-Swizzling Objective-C Method相关方法分析 Type Encodings Objc是OOP,所以有多态. 当 ...

  7. DOG检测

    共享一个代码算了,太忙鸟,有时间在补充. function [] = dog_learn() img = imread('/Users/img/lena.png'); img = rgb2gray(i ...

  8. ASCII码而已

    题目: \u5927\u5bb6\u597d\uff0c\u6211\u662f\u0040\u65e0\u6240\u4e0d\u80fd\u7684\u9b42\u5927\u4eba\uff01 ...

  9. OpenStack三种类型的NAT转换

    SNAT SNAT即源网络地址转换,这个NAT路由修改IP包包头中的源IP地址.SNAT功能通常用于让只具有私有IP地址的主机能够访问外网,比如,多个PC使用路由器共享上网,每个PC都配置了内网IP, ...

  10. Forward+

    http://aras-p.info/blog/2012/03/02/2012-theory-for-forward-rendering/ http://www.slideshare.net/taka ...