re正则模块

本节内容:

  • 正则介绍
  • 元字符及元字符集
  • 元字符转义符
  • re模块下的常用方法
正则介绍(re)

正则表达式(或 RE)是一种小型的、高度专业化的编程语言.

在Python中,它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

元字符及元字符集

1、元字符之. ^ $ * + ? { }

 import re

 ret = re.findall('o...n', 'oksdaoceanaaaddf')

 print(ret)  # ['ocean']

 ret = re.findall('^o...n', 'oceanhelloowwwn') #以o开头的才能匹配上,这里的头是整个字符串的开头

 print(ret)  # ['ocean']

 ret = re.findall('o...n', 'ooceanhelloowwwn')

 print(ret)  # ['ocean','owwwn']

 ret = re.findall('o...n$', 'oceanhelloowwwn') #以n为结尾的匹配,整个字符串的结尾

 print(ret)  # ['owwwn']

 ret = re.findall('abc*', 'abcccc')  # 贪婪匹配[0,+∞]

 print(ret)  # ['abcccc']

 ret = re.findall('abc+', 'abccc')  # [1,+∞]

 print(ret)  # ['abccc']

 ret = re.findall('abc?', 'abccc')  # [0,1]

 print(ret)  # ['abc']

 ret = re.findall('abc{1,4}', 'abccc')

 print(ret)  # ['abccc'] 贪婪匹配

注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配

ret=re.findall('abc*?','abcccccc')
print(ret)#['ab']

字符集

 # --------------------------------------------字符集[]
 ret = re.findall('a[bc]d', 'acd')
 print(ret)  # ['acd']

 ret = re.findall('[a-z]', 'acd')
 print(ret)  # ['a', 'c', 'd']

 ret = re.findall('[.*+]', 'a.cd+')
 print(ret)  # ['.', '+']

 # 在字符集里有功能的符号: - ^ \

 ret = re.findall('[1-9]', '45dha3')  #‘-’在字符集是指范围
 print(ret)  # ['4', '5', '3']

 ret = re.findall('[^ab]', '45bdha3')  #^在字符集[]里是‘非’的意思
 print(ret)  # ['4', '5', 'd', 'h', '3']

 ret = re.findall('[\d]', '45bdha3')  #\在字符集中是转义,即有意义字符可以转换成普通字符,无意义字符可转化成特殊意义
 print(ret)  # ['4', '5', '3']

 ret = re.findall('\d+','45bda3')
 print(ret)  #['45', '3']
转义字符‘\’

反斜杠后边跟元字符去除特殊功能,比如\.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;它相当于类 [0-9]。
\D 匹配任何非数字字符;它相当于类 [^0-9]。
\s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界,比如空格 ,&,#等

ret=re.findall('I\b','I am LIST')
print(ret)#[]
ret=re.findall(r'I\b','I am LIST')
print(ret)#['I']

 #-----------------------------eg1:
 import re
 ret=re.findall('c\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\l','abc\le')
 print(ret)#[]
 ret=re.findall('c\\\\l','abc\le')
 print(ret)#['c\\l']
 ret=re.findall(r'c\\l','abc\le')
 print(ret)#['c\\l']

 #-----------------------------eg2:
 #之所以选择\b是因为\b在ASCII表中是有意义的
 m = re.findall('\bblow', 'blow')
 print(m)
 m = re.findall(r'\bblow', 'blow')
 print(m)

Python全栈开发【re正则模块】的更多相关文章

  1. Python 全栈开发六 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve configparser hashlib 一. ...

  2. Python 全栈开发九 日志模块

    日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.一个事件可以用一个可包含可选变量数据的消息来描述.此外,事件也有重要性的概念 ...

  3. python全栈开发day22-常用模块二(hashlib、configparse、logging)

    一.昨日内容回顾 1.钻石继承 #新式类,本身或父类显示继承object #找名字的时候是广度优先顺序 #有mro方法,super方法, # super并不是单纯的找父类,和mro顺序是完全对应的 # ...

  4. python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)

    1.昨日内容回顾 1.正则表达式     # 正则表达式 —— str           # 检测字符串是否符合要求     # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...

  5. Python全栈开发-Day5-常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil shelve xml处理 pyyaml处理 configparser hashlib re正则 ...

  6. Python全栈开发:configparser模块

    #!/usr/bin/env python # -*- coding;utf-8 -*- import configparser # 创建对象 conn = configparser.ConfigPa ...

  7. python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))

    python全栈开发笔记第二模块   第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用      有一个需求 : 从文件中读取所有联 ...

  8. python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

    python全栈开发笔记第二模块 第四章 :常用模块(第二部分)     一.os 模块的 详解 1.os.getcwd()    :得到当前工作目录,即当前python解释器所在目录路径 impor ...

  9. python全栈开发之正则表达式和python的re模块

    正则表达式和python的re模块 python全栈开发,正则表达式,re模块 一 正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的 ...

  10. Python全栈开发【模块】

    Python全栈开发[模块] 本节内容: 模块介绍 time random os sys json & picle shelve XML hashlib ConfigParser loggin ...

随机推荐

  1. vue.js 第五课

    计算属性 1.基础例子 2.计算属性 vs $watch 3.计算 setter 4.计算属性开发实务demo   1.计算属性 computed( 电脑computer) (区别普通属性) 计算属性 ...

  2. 一次基于etcd的分布式锁自动延时失败问题的排查

    今天在测试基于etcd的分布式锁过程中,在测试获取锁后,释放之前超出TTL时长的情况下自动延长TTL这部分功能,在延长指定key的TTL时总是返回404错误信息,在对目标KEY更新TTL时目标KEY已 ...

  3. Xftp连接linux(ubuntu)时提示ssh服务器拒绝了密码,请再试一次

    用xftp root连接时显示ssh服务器拒绝了密码,请重新连接.由于sshd的设置不允许root用户用密码远程登录,修改/etc/ssh/sshd_config文件,但必须是安装了openssh才会 ...

  4. 启动Maven项目启动报错:java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener

    tomcat在发布项目的时候没有同时发布maven依赖所添加的jar包,你需要设置一下eclipse:项目 -> 属性 -> Deployment Assembly -> Add - ...

  5. js文件中函数前加分号和感叹号是什么意思?

    本文转自:http://blog.csdn.net/h_o_w_e/article/details/51388500 !function(){}();   !有什么用? 从语法上来开,JavaScri ...

  6. LAMP(1) 在VirtualBox里安装Ubuntu Server

    问题0.虚拟机中安装lamp环境 问题解决: 来自百度经验 问题1. 用putty远程登陆linux系统,显示network error connection refused 问题解决 问题2. my ...

  7. 浅谈:javascript的面向对象编程之具体实现

    下面的javascript代码都是需要使用jQuery插件来做的.希望大家可以搭建好工作环境 首先我们来做一个练习:在一个删除的超链接中添加一个提示信息,提示是否确认删除. 一般情况下我们都会这么做 ...

  8. sift特征

    已经有很多博客已经将sift特征提取算法解释的很清楚了,我只是记录一些我不明白的地方,并且记录几个理解sift特征比较好的博客. 1. http://aishack.in/tutorials/sift ...

  9. thinkphp3.2.3版本文件目录及作用

    下载thinkphp3.2.3版本,解压缩后将文件夹名字改为thinkphp,然后放在www目录下,里面的文件夹和文件的名字和作用如下:(前面有Tab健的表示下一级,thinkphp是根目录) //t ...

  10. Nodejs事件引擎libuv源码剖析之:高效线程池(threadpool)的实现

    声明:本文为原创博文,转载请注明出处. Nodejs编程是全异步的,这就意味着我们不必每次都阻塞等待该次操作的结果,而事件完成(就绪)时会主动回调通知我们.在网络编程中,一般都是基于Reactor线程 ...