正则匹配函数

# 需要先导入re模块

import re

#字符串，匹配查找

info = "www  baidu  com"

print("=======字符串自带find方法查找============")

print(info.find("baidu"))

print(info.find("www"))

print("=======re.match方法从头查找==============")

print("从头匹配OK：", re.match("www", info))  # 匹配成功返回match类对象

print("获取从头匹配OK结果：", str(re.match("www", info).span()))  # span获取位置

print("从头不匹配：", re.match("baidu", info))  #不匹配返回None

print("忽略大小写：", re.match("www","WWW.BAIDU.COM", re.IGNORECASE))

print("=======re.search任意位置查找==============")

print("search匹配：",re.search("www",info))

print("search匹配：",re.search("baidu",info))

print("search忽略大小写：", re.search("www","WWW.BAIDU.COM", re.IGNORECASE))

print("=======re.findall全局查找==============")

print("findall匹配：",re.findall("www",info))

print("findall匹配：",re.findall("baidu",info))

print("findall忽略大小写：", re.findall("www","WWW.BAIDU.COM", re.IGNORECASE))

"""

=======字符串自带find方法查找=============

5

0

=======re.match方法从头查找==============

从头匹配OK： <re.Match object; span=(0, 3), match='www'>

获取从头匹配OK结果： (0, 3)

从头不匹配： None

忽略大小写： <re.Match object; span=(0, 3), match='WWW'>

=======re.search任意位置查找==============

search匹配： <re.Match object; span=(0, 3), match='www'>

search匹配： <re.Match object; span=(5, 10), match='baidu'>

search忽略大小写： <re.Match object; span=(0, 3), match='WWW'>

=======re.findall全局查找================

findall匹配： ['www']

findall匹配： ['baidu']

findall忽略大小写： ['WWW']

"""

匹配符号范围

import re

info = "www.baidu.com.17745674567.127.o.0.1.hello.heLLo.heLlo"

print("原始字符串：",info)

print("==========范围内匹配==========")

mark1 = "he[lkn][lkn]o"

mark2 = "he[a-z][a-z]o"

mark3 = "he[a-zA-Z][a-zA-Z]o"

print("匹配[lkn]范围字符：",re.findall(mark1, info, re.I))

print("匹配[a-z]范围字符：",re.findall(mark2, info, re.I))

print("匹配[a-zA-Z]范围字符：",re.findall(mark3, info, re.I))

print("匹配[0-9]范围字符：",re.findall("[0-9]", info, re.I))

print("匹配[^0-9a-t]范围取反匹配：",re.findall("[^0-9a-t]", info, re.I))

"""

原始字符串： www.baidu.com.17745674567.127.o.0.1.hello.heLLo.heLlo

==========范围内匹配==========

匹配[lkn]范围字符： ['hello', 'heLLo', 'heLlo']

匹配[a-z]范围字符： ['hello', 'heLLo', 'heLlo']

匹配[a-zA-Z]范围字符： ['hello', 'heLLo', 'heLlo']

匹配[0-9]范围字符： ['1', '7', '7', '4', '5', '6', '7', '4', '5', '6', '7', '1', '2', '7', '0', '1']

匹配[^0-9a-t]范围取反匹配： ['w', 'w', 'w', '.', 'u', '.', '.', '.', '.', '.', '.', '.', '.', '.']

"""

边界数量匹配

import re

#有边界符号，表示单边位置

#如没有边界符号，表示任意全局匹配

str = "food hello Food"

pat = "fo[ol][dlk]$"

print("============开始结束匹配==============")

pat22 = "^fo[ol][dlk]"

pat33 = "fo[ol][dlk]"

print("匹配开头：", re.findall(pat, str, re.I))

print("匹配结尾：", re.findall(pat22, str, re.I))

print("匹配不限开头结尾：", re.findall(pat33, str, re.I))

print("============多位简写匹配==============")

input_data = "2020-09-09"

mark = "[0-9]{4}-[0-9]{2}-[0-9]{2}" # 使用{}进行多次匹配

print("生日格式匹配为：", re.match(mark, input_data, re.I))

print("============拆分匹配==============")

info = "hjdfkj3243423.4324324kjkl343435353adf"

mark2 = r"\d+"  #加R表示，这是正则匹配，不加理论上也可以

print(re.split(mark2, info))

score = "119.9"

mark3 = r"^[+-]?\d+(\.\d+)?$"

print(re.match(mark3, score, re.I))

print("============逻辑匹配==============")

tel = "(010)-12343234"

"""

7-8位数字：'\d{7,8}'

前三位区号：\d{3,4}

区号+括号：(\d{3,4})

"""

mark4 = r"((\d{3,4})|(\(\d{3,4}\)-))?\d{7,8}"

print(re.match(mark4, tel))

"""

============开始结束匹配==============

匹配开头： ['Food']

匹配结尾： ['food']

匹配不限开头结尾： ['food', 'Food']

============多位简写匹配==============

生日格式匹配为： <re.Match object; span=(0, 10), match='2020-09-09'>

============拆分匹配==============

['hjdfkj', '.', 'kjkl', 'adf']

<re.Match object; span=(0, 5), match='119.9'>

============逻辑匹配==============

<re.Match object; span=(0, 14), match='(010)-12343234'>

"""

正则匹配模式

#正则匹配模式

import re

data = """

food is very good

food is very good

food is very good

"""

mark = "fo{2}d"

mark2 = ".+"

print("多行匹配以及忽略大小写：",re.findall(mark, data, re.I  | re.M)) #多行匹配以及忽略大小写

print("默认匹配，不加其他后缀：",re.findall(mark2, data)) #多行匹配以及忽略大小写

print("修改.匹配任意模式，可匹配换行等任意字符：",re.findall(mark2, data, re.S)) #多行匹配以及忽略大小写

print("忽略空白和注释，进行匹配：",re.findall(mark2, data, re.X)) #多行匹配以及忽略大小写

"""

多行匹配以及忽略大小写： ['food', 'food', 'food']

默认匹配，不加其他后缀： ['    ', 'food is very good', 'food is very good', 'food is very good    ']

修改.匹配任意模式，可匹配换行等任意字符： ['    \nfood is very good\nfood is very good\nfood is very good    \n']

忽略空白和注释，进行匹配： ['    ', 'food is very good', 'food is very good', 'food is very good    ']

"""

分组

#获取数据后，需要再拆分，可以使用分组

import re

info = "id:root, phone:11012341234, bir:2021-09-08"

mark = r"(\d{4})-(\d{2})-(\d{2})"

res = re.search(mark, info)

print("获取分组数据为 ：", res.group())

print("获取第1组数据为：", res.group(1))

print("获取第2组数据为：", res.group(2))

print("获取第3组数据为：", res.group(3))

mark2 = r"\d{4}-\d{2}-\d{2}"

res2 = re.search(mark2, info)

print("不加分组括号为 ：",res2.group())

"""

获取分组数据为 ： 2021-09-08

获取第1组数据为： 2021

获取第2组数据为： 09

获取第3组数据为： 08

不加分组括号为 ： 2021-09-08

"""

环视

# 通过获取指定字符串位置,然后达到匹配目的字符

import re

info = "id:root,name:tom,age:33,id:root"

mark = r"(?<=id:)(?P<name>\w+)"

print(re.findall(mark, info))

"""

['root', 'root']

"""

Python入门-正则表达式的更多相关文章

Python 入门学习（贰）文件/文件夹正则表达式批量重命名工具
基于 Udacity 的 Python 入门课程 Programming Foundations with Python 基于 Python 2.7 思路 Project 2 是一个去除文件名中所有数 ...
Python入门之树莓派
Linux命令行$+命令 pwd显示当前目录 ls列表 cd改变当前目录,/ sudo超级用户输入,特权来操作系统相关设置或删除文件 sudo apt-get install 安装程序 sudo ...
老鸟的Python入门教程
转自老鸟的Python入门教程重要说明这不是给编程新手准备的教程,如果您入行编程不久,或者还没有使用过1到2门编程语言,请移步!这是有一定编程经验的人准备的.最好是熟知Java或C,懂得命令行,S ...
Python入门教程（1）
人生苦短,我用Python! Python(英语发音:/ˈpaɪθən/), 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于19 ...
Python语言学习之Python入门到进阶
人们常说Python语言简单,编写简单程序时好像也确实如此.但实际上Python绝不简单,它也是一种很复杂的语言,其功能特征非常丰富,能支持多种编程风格,在几乎所有方面都能深度定制.要想用好Pytho ...
Python 入门网络爬虫之精华版
Python 入门网络爬虫之精华版转载宁哥的小站,总结的不错 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储另外,比较常用的爬虫框架Scrapy,这里最后也详细介绍一下. 首先列举 ...
python之正则表达式【转】
首先说正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达式.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计 ...
Python 入门之内置模块 -- re模块
Python 入门之内置模块 -- re模块 1.re 模块 (1)什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类 ...
Python入门到进阶必看的权威书籍与网站
随着人工智能全面爆发,Python[英文单词:蟒蛇],是一款近年来爆红的计算机编程语言.1989年发明,1991年发行,比目前应用最广的Java还要大7岁,有种大器晚成的感觉. 分享之前我还是要推荐下 ...

随机推荐

vue全局引入公共scss样式，子组件调用
前提已引用并使用scss npm install sass-loader --save-dev npm install node-sass --sava-dev 配置在vue.config.js中 ...
Navicat连接不上MySQL 8.0
Navicat连接不上MySQL 8.0 更改加密方式 1.先通过命令行进入mysql的root账户: C:\Windows\system32> mysql -uroot -p 2.更改加密方式 ...
DBUtils ResultSetHandeler常用的处理类
常用的处理类: BeanHandler: //将结果集中第一条记录封装到一个指定的javaBean中 BeanListHandler: //将结果集中每一条记录封装到指定的javaBean中,将这些j ...
LGP3346题解
广义 SAM 比较简单的题/fad 题意:树上所有路径一共能够组成多少个本质不同子串? 并且数据保证最多只有20个叶子节点. 我们先来考虑一下一种特殊情况: 对于路径 $[u,v]$,$u$ ...
mybatis——逆向工程中 where （条件1）and （条件2 or 条件3 or 条件4）
where (条件1)and (条件2 or 条件3 or 条件4) = where (条件1 and 条件2)or (条件1 and 条件3) or (条件1 and 条件4) 结果是这样的 WH ...
如何将docker 镜像上传到docker hub仓库
如何将docker 镜像上传到docker hub仓库目录如何将docker 镜像上传到docker hub仓库背景 1.注册docker hub账号 2.docker hub上创建仓库 3.d ...
springboot 踩坑之路之 Configuration Annotation Proessor not found in classpath
1.出现spring boot Configuration Annotation Proessor not found in classpath的提示是在用了@ConfigurationPropert ...
Django基础必会
Django基础必会 Django项目目录 mysite -mysite -__init__.py -urls.py(函数和函数的对应关系) -settings.py(Django项目的配置信息) - ...
玩转OpenMLDB社区，四张角色卡待解锁
关于OpenMLDB OpenMLDB 是一个开源机器学习数据库,提供企业级 FeatureOps 全栈解决方案.OpenMLDB 致力于闭环解决 AI 工程化落地的数据治理难题,并且已经在上百个企业 ...
内网渗透----使用mimikatz获取windows登陆口令
使用mimikatz提取windows密码以管理员运行后,可以随机打一些字符,进入如下界面输入aaa::aaa,可展示所有模块: 可采用log命令,保存日志获取hash与明文用户口令 privi ...

Python入门-正则表达式

正则匹配函数

匹配符号范围

边界数量匹配

Python入门-正则表达式的更多相关文章

随机推荐

热门专题