re库常用方法

正则表达式的表示类型:

1、re库采用 raw string 类型(原生字符串类型),不用对转义符再次转义,表示为:r'text'
例如:r'\d{3}-\d{8}'
2、re库采用 string 类型表示正则表达式,但更繁琐。例如:'\\d{3}-\\d{8}'

re.search(pattern, string, flags=0)

在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象
  • pattern : 正则表达式的字符串或原生字符串表示
  • string : 待匹配字符串
  • flags : 正则表达式使用时的控制标记

re.match(pattern, string, flags=0)

从一个字符串的开始位置起匹配正则表达,返回match对象
  • pattern : 正则表达式的字符串或原生字符串表示
  • string : 待匹配字符串
  • flags : 正则表达式使用时的控制标记

re.findall(pattern, string, flags=0)

搜索字符串,以列表类型返回全部能匹配的子串
  • pattern : 正则表达式的字符串或原生字符串表示
  • string : 待匹配字符串
  • flags : 正则表达式使用时的控制标记

re.split(pattern, string, maxsplit=0, flags=0)

将一个字符串按照正则表达式匹配结果进行分割,返回列表类型
  • pattern : 正则表达式的字符串或原生字符串表示
  • string : 待匹配字符串
  • maxsplit: 最大分割数,剩余部分作为最后一个元素输出
  • flags : 正则表达式使用时的控制标记

re.finditer(pattern, string, flags=0)

搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
  • pattern : 正则表达式的字符串或原生字符串表示
  • string : 待匹配字符串
  • flags : 正则表达式使用时的控制标记

re.sub(pattern, repl, string, count=0, flags=0)

在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串
  • pattern : 正则表达式的字符串或原生字符串表示
  • repl : 替换匹配字符串的字符串
  • string : 待匹配字符串
  • count : 匹配的最大替换次数
  • flags : 正则表达式使用时的控制标记

regex = re.compile(pattern, flags=0)

将正则表达式的字符串形式编译成正则表达式对象
  • pattern : 正则表达式的字符串或原生字符串表示
  • flags : 正则表达式使用时的控制标记

练习代码

试着运行下列代码,看看能不能理解元字符和方法的功能。
import re
text = 'alpha. beta ... gamma delta'
re.split('[\. ]+', text)
re.split('[\. ]+', text, maxsplit = 2)
re.split('[\. ]+', text, maxsplit = 1)
pat = '[a-zA-Z]+'
re.findall(pat, text)
#---------------------------------------
pat = '{name}'
text = 'Dear {name}...'
re.sub(pat, 'Mr.Dong', text)
#----------------------------------------
s = "It's a very good good idea."
re.sub(r'(\b\w+) \1', r'\1', s)
re.sub(r'((\w+) )\1', r'\2 ', s)
#-----------------------------------------------
re.sub('a', lambda x:x.group(0).upper(), 'aaa, abc, bab')
#-----------------------------------------------
re.sub('[a-z]', lambda x: x.group(0).upper(), 'aaa abc abdfe')
#-----------------------------------------------
re.sub('[a-zA-Z]', lambda x: chr(ord(x.group(0))^32), 'aaa abc abde')
#-----------------------------------------------
re.subn('a', 'dfg', 'aaa abc abde')
#-----------------------------------------------
re.sub('a', 'dfg', 'aaa abc abde')
#-----------------------------------------------
re.escape('http://www.python.org')
#-----------------------------------------------
example = 'Beautiful is better than ugly.'
re.findall('\\bb.+?\\b', example)
re.findall('\\bb.+\\b', example)
re.findall('\\bb\w*\\b', example)
re.findall('\\Bh.+?\\b', example)
re.findall('\\b\w.+?\\b', example)
re.findall('\w+', example)
#-----------------------------------------------
re.findall('\d+\.\d+\.\d+', 'Python 2.7.11, python 3.6.5')
#-----------------------------------------------
example = 'ShanDong Institute of Business and Technology is a very beautiful school.'
re.findall('\\ba.+?\\b', example)
re.findall('\\ba\w*\\b', example)
re.findall('\\Bo.+?\\b', example)
re.findall('\\b\w.+?\\b', example)
re.findall(r'\b\w.+?\b', example)
re.split('\s', example)
参考资料:
  1. 《Python可以这样学》
  2. http://www.cnblogs.com/python-xkj/p/9231624.html

知识在于点点滴滴的积累,我会在这个路上Go ahead,
有幸看到我博客的朋友们,若能学到知识,请多多关注以及讨论,让我们共同进步,扬帆起航。

后记:打油诗一首

适度锻炼,量化指标

考量天气,设定目标

科学锻炼,成就体标

高效科研,实现学标


 
 
 
 

Python3正则表达式(2)的更多相关文章

  1. 详解 Python3 正则表达式(五)

    上一篇:详解 Python3 正则表达式(四) 本文翻译自:https://docs.python.org/3.4/howto/regex.html 博主对此做了一些注明和修改 ^_^ 非捕获组和命名 ...

  2. 详解 Python3 正则表达式(四)

    上一篇:详解 Python3 正则表达式(三) 本文翻译自:https://docs.python.org/3.4/howto/regex.html 博主对此做了一些注明和修改 ^_^ 更多强大的功能 ...

  3. 详解 Python3 正则表达式(三)

    上一篇:详解 Python3 正则表达式(二) 本文翻译自:https://docs.python.org/3.4/howto/regex.html 博主对此做了一些批注和修改 ^_^ 模块级别的函数 ...

  4. 详解 Python3 正则表达式(二)

    上一篇:详解 Python3 正则表达式(一) 本文翻译自:https://docs.python.org/3.4/howto/regex.html 博主对此做了一些批注和修改 ^_^ 使用正则表达式 ...

  5. 详解 Python3 正则表达式(一)

    本文翻译自:https://docs.python.org/3.4/howto/regex.html 博主对此做了一些批注和修改 ^_^ 正则表达式介绍 正则表达式(Regular expressio ...

  6. python025 Python3 正则表达式

    Python3 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. ...

  7. python3 正则表达式学习笔记

    re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none. ~匹配成功re.match方法返回一个匹配的对象,否则返回No ...

  8. Python3正则表达式

    正则表达式是一个特殊的字符序列,他能帮助你方便的检查一个字符串是否与某种模式匹配.   re.match函数 re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,matc ...

  9. python3正则表达式总结

    转自csdn,去这里看更多吧: https://blog.csdn.net/weixin_40136018/article/details/81183504 还有一个废话很多的详细系列,在这里:htt ...

  10. 【转】Python3 正则表达式特殊符号及用法(详细列表)

    转载自鱼c论坛:https://fishc.com.cn/forum.php?mod=viewthread&tid=57691&extra=page%3D1%26filter%3Dty ...

随机推荐

  1. eclipse 反编译

    Eclipse Class Decompiler安装此插件,可以编译源代码且调试

  2. MariaDB:在Linux下修改编码

    参考网址:http://www.cnblogs.com/vingi/articles/4302330.html: # vi /etc/my.cnf [mysqld] init_connect='SET ...

  3. docker 定时清理none镜像

    =============================================== 2019/3/31_第1次修改                       ccb_warlock == ...

  4. Java通过BCrypt加密

    一.概述 在用户模块,对于用户密码的保护,通常都会进行加密.我们通常对密码进行加密,然后存放在数据库中,在用户进行登录的时候,将其输入的密码进行加密然后与数据库中存放的密文进行比较,以验证用户密码是否 ...

  5. jquery之源码

    1.插件扩展机制 所有的Jquery代理对象的实例,都是扩展自$.fn对象的 意味着只要我们继续扩展$.fn这个对象的功能,就相当于扩展了所有的Jquery代理对象的实例的功能 代码 var $bod ...

  6. Oracle 11g服务器安装详细步骤——图文教程(系统 windows server 2012 R2)

    Oracle 11g服务器安装的相关问题,下面小编就带大家一起来下载.安装. 方法/步骤 1 大家可以根据自己的操作系统是多少位(32位或64位)的,到官网下载相应的安装程序,如下图所示. 有一点需要 ...

  7. 来自工程师的8项Web性能提升建议

    在互联网盛行的今天,越来越多的在线用户希望得到安全可靠并且快速的访问体验.针对Web网页过于膨胀以及第三脚本蚕食流量等问题,Radware向网站运营人员提出以下改进建议,帮助他们为用户提供最快最优质的 ...

  8. fatal error: google/protobuf/arena.h:没有那个文件或目录

    安装caffe时make all会出现这个错误,按照https://github.com/BVLC/caffe/issues/4988说法,可能时libprotobuf-dev过时了,需要从源码重新变 ...

  9. Python 列表推导、迭代器与生成器

    1.列表推导 1 2 3 4 5 6 7 8 9 10 11 numbers = [i for i in range(10) if i % 2 == 0] print(numbers)   seq = ...

  10. 自动化测试使用cookie跳过验证码

    准备工具: fiddler Python+selenium 安装fidder fidder官方下载地址 fidder首次安装需要设置才能抓取https参考如下 fidder设置抓取https 开始 1 ...