笔记-python-lib-re

1.      re模块简介

re模块提供了与perl类似的正则匹配功能。

要搜索的模式和字符串都可以是Unicode字符串(str)以及8位字符串(bytes)。但是,不能混合Unicode字符串和8位字符串:也就是说,不能将Unicode字符串与字节模式匹配,反之亦然。

反斜杠:正则表达式使用了\表示转义,如果要匹配一个反斜杠,需要写成\\\\作为模式字符串。

另一种办法是声明字符串中的\不会以特殊方式处理,在字符串前加r,r’\n’是两个字符,而不是换行;

2.      模块内容

2.1.    compile

re.compile(pattern, flags=0)

compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。

参数:

pattern:一个字符串形式的正则表达式

flags:可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

re.I 忽略大小写

re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境

re.M 多行模式,影响^和$

re.S 意为' . '包括换行符在内的任意字符(一般' . '不包括换行符)

re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

re.X 为了增加可读性,忽略空格和' # '后面的注释

example:

pattern = re.compile(r’\d+?’)

2.2.  match

re.match(pattern, string, flags=0)

判断RE是否在字符串刚开始的位置匹配,返回match object。

注意:只要字符串开始部分满足匹配即成功,如果想要整串匹配可加$符。

example:

s = re.match('[a-z]+', str1)

2.3.    search

re.search(pattern, string, flags=0)

在字符串内查找模式匹配,只要找到第一个匹配然后返回一个match object对象,如果没有则返回None。

<_sre.SRE_Match object; span=(0, 5), match='eoorg'>

2.4.    split

split(pattern, string, maxsplit=0, flags=0)

以模式匹配的字符串的为界拆分字符串;

如果使用(),则模式组也包含在结果中;

str1 = 'eoorg943443g382\jgdo 349po\oer g34 345364 sfwe fwegre ewfwe fwef'

s = re.split(r'\d+', str1, 4)

['eoorg', 'g', '\\jgdo ', 'po\\oer g', ' 345364 sfwe fwegre ewfwe fwef']

s = re.split(r'(\d+)', str1, 4)

['eoorg', '943443', 'g', '382', '\\jgdo ', '349', 'po\\oer g', '34', ' 345364 sfwe fwegre ewfwe fwef']

maxsplit指定最大拆分次数,达到次数后,剩余字符串作为列表元素添加到列表尾部。

2.5.    findall

findall(pattern, string, flags=0)

遍历匹配,获取字符串中所有匹配的字符串,返回一个列表;如果模式有多个组,返回元组列表。

2.6.    sub

sub(pattern, repl, string, count=0, flags=0)

替换匹配的子串,返回替换后的字符串。

str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'

s = re.sub('\s+', '-', str1)

print(s)

参数count指替换个数,默认为0,表示每个匹配项都替换。

2.7.    subn

subn(pattern, repl, string, count=0, flags=0)

与sub所做操作一样,但返回一个元组,(new_string, number_of_sub_made)。

2.8.    match objects

上面讲过search,match会返回一个match object

str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'

s = re.search('[a-z]+', str1)

print(s)

<_sre.SRE_Match object; span=(6, 8), match='is'>

match objects支持以下方法和属性:

match.group([group1]) 可以不带参数,表示所有匹配项;带参数则表示参数所对应的项;

str1 = 'JGOOD is a handome boy, he is cool, clever, and so on...'

pattern = re.compile(r'\s+')

s = re.match('(\w+)\s(\w+)', str1)

print(s)

<_sre.SRE_Match object; span=(0, 8), match='JGOOD is'>

>>> s.group()

'JGOOD is'

>>> s.group(1)

'JGOOD'

>>> s.group(2)

'is'

>>>

match.groups() 返回一个tuple,包含所有子组

match.start()

match.end() 返回匹配结果开始结束字符的下标

match.span() 与上文同义,返回匹配结果开始结束下标,格式是元组;

match.re      以re.compile('(\\w+)\\s(\\w+)')格式返回该对象使用的正则表达式

笔记-python-lib-re的更多相关文章

  1. 笔记-python -asynio

    笔记-python -asynio 1.      简介 asyncio是做什么的? asyncio is a library to write concurrent code using the a ...

  2. 笔记-python操作mysql

    笔记-python操作mysql 1.      开始 1.1.    环境准备-mysql create database db_python; use db_python; create tabl ...

  3. 笔记-python异常信息输出

    笔记-python异常信息输出 1.      异常信息输出 python异常捕获使用try-except-else-finally语句: 在except 语句中可以使用except as e,然后通 ...

  4. 笔记-python lib-pymongo

    笔记-python lib-pymongo 1.      开始 pymongo是python版的连接库,最新版为3.7.2. 文档地址:https://pypi.org/project/pymong ...

  5. 笔记-python tutorial-9.classes

    笔记-python tutorial-9.classes 1.      Classes 1.1.    scopes and namespaces namespace: A namespace is ...

  6. MongoDB学习笔记:Python 操作MongoDB

    MongoDB学习笔记:Python 操作MongoDB   Pymongo 安装 安装pymongopip install pymongoPyMongo是驱动程序,使python程序能够使用Mong ...

  7. 机器学习实战笔记(Python实现)-08-线性回归

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  8. 机器学习实战笔记(Python实现)-05-支持向量机(SVM)

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  9. 机器学习实战笔记(Python实现)-04-Logistic回归

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

  10. 机器学习实战笔记(Python实现)-03-朴素贝叶斯

    --------------------------------------------------------------------------------------- 本系列文章为<机器 ...

随机推荐

  1. kickstart2019 round_A B. Parcels

    思路: 利用了曼哈顿距离和切比雪夫距离之间的转化. 参考: https://blog.csdn.net/Dylan_Frank/article/details/88985444 https://www ...

  2. Vue打包后页面出现cannot get

    学习Vue有大半个月了,然而遇到了不少坑,完全没有高手们那么容易,中间有不少值得记录下的东东,回头好好理理.先理下今天的: Vue打包命令简单啊,直接在命令行输入:npm run build 然而没一 ...

  3. Spring MVC + Thymeleaf

    参考网址: https://www.cnblogs.com/litblank/p/7988689.html 一.简介 1.Thymeleaf 在有网络和无网络的环境下皆可运行,而且完全不需启动WEB应 ...

  4. C++编写字符串类CNString,该类有默认构造函数、类的拷贝函数、类的析构函数及运算符重载

    编码实现字符串类CNString,该类有默认构造函数.类的拷贝函数.类的析构函数及运算符重载,需实现以下“=”运算符.“+”运算.“[]”运算符.“<”运算符及“>”运算符及“==”运算符 ...

  5. LeetCode Remove Duplicates from Sorted Array II 删除整型数组中的重复元素并返回剩下元素个数2

    class Solution { public: int removeDuplicates(int A[], int n) { ],*e=&A[]; //s指向“连续数字”的第一个,e往后遍历 ...

  6. 详细讲解:通过phpstudy 设置站点域名、站点域名管理

    我们在本地编程的时候,会遇到路径特别长的情况,这样子我们在url中的输入就会变得不方便而且容易报错,那么在phpstudy这个环境中,有一个很好的功能,就是“站点域名管理”,他能让我们的url网址大大 ...

  7. C语言的一小步—————— 一些小项目及解析

    ——-------- 仅以此献给东半球第二优秀的C语言老师,黑锤李某鸽,希望总有那么一天我们的知识可以像他的丰臀一样渊博! bug跟蚊子的相似之处: 1.不知道藏在哪里. 2.不知道有多少. 3.总是 ...

  8. Dynemic Web Project中使用servlet的 doGet()方法接收来自浏览器客户端发送的add学生信息形成json字符串输出到浏览器并保存到本地磁盘文件

    package com.swift.servlet; import java.io.FileOutputStream;import java.io.IOException;import java.io ...

  9. elasticsearch 7 安装

    elasticsearch 安装 操作系统:CentOS Linux release 7.4 elasticsearch:elasticsearch-7.1.1 es7+centos7 1.软件下载 ...

  10. iView - Form中想要重置DatePicker生效,必须给DatePicker绑定value属性

    Form中想要重置DatePicker生效,必须给DatePicker绑定value属性