正则匹配函数

# 需要先导入re模块
import re #字符串,匹配查找
info = "www baidu com"
print("=======字符串自带find方法查找============")
print(info.find("baidu"))
print(info.find("www"))
print("=======re.match方法从头查找==============")
print("从头匹配OK:", re.match("www", info)) # 匹配成功返回match类对象
print("获取从头匹配OK结果:", str(re.match("www", info).span())) # span获取位置
print("从头不匹配:", re.match("baidu", info)) #不匹配返回None
print("忽略大小写:", re.match("www","WWW.BAIDU.COM", re.IGNORECASE))
print("=======re.search任意位置查找==============")
print("search匹配:",re.search("www",info))
print("search匹配:",re.search("baidu",info))
print("search忽略大小写:", re.search("www","WWW.BAIDU.COM", re.IGNORECASE)) print("=======re.findall全局查找==============")
print("findall匹配:",re.findall("www",info))
print("findall匹配:",re.findall("baidu",info))
print("findall忽略大小写:", re.findall("www","WWW.BAIDU.COM", re.IGNORECASE)) """
=======字符串自带find方法查找=============
5
0
=======re.match方法从头查找==============
从头匹配OK: <re.Match object; span=(0, 3), match='www'>
获取从头匹配OK结果: (0, 3)
从头不匹配: None
忽略大小写: <re.Match object; span=(0, 3), match='WWW'>
=======re.search任意位置查找==============
search匹配: <re.Match object; span=(0, 3), match='www'>
search匹配: <re.Match object; span=(5, 10), match='baidu'>
search忽略大小写: <re.Match object; span=(0, 3), match='WWW'>
=======re.findall全局查找================
findall匹配: ['www']
findall匹配: ['baidu']
findall忽略大小写: ['WWW']
"""

匹配符号范围

import re

info = "www.baidu.com.17745674567.127.o.0.1.hello.heLLo.heLlo"
print("原始字符串:",info)
print("==========范围内匹配==========")
mark1 = "he[lkn][lkn]o"
mark2 = "he[a-z][a-z]o"
mark3 = "he[a-zA-Z][a-zA-Z]o" print("匹配[lkn]范围字符:",re.findall(mark1, info, re.I))
print("匹配[a-z]范围字符:",re.findall(mark2, info, re.I))
print("匹配[a-zA-Z]范围字符:",re.findall(mark3, info, re.I))
print("匹配[0-9]范围字符:",re.findall("[0-9]", info, re.I))
print("匹配[^0-9a-t]范围取反匹配:",re.findall("[^0-9a-t]", info, re.I))
"""
原始字符串: www.baidu.com.17745674567.127.o.0.1.hello.heLLo.heLlo
==========范围内匹配==========
匹配[lkn]范围字符: ['hello', 'heLLo', 'heLlo']
匹配[a-z]范围字符: ['hello', 'heLLo', 'heLlo']
匹配[a-zA-Z]范围字符: ['hello', 'heLLo', 'heLlo']
匹配[0-9]范围字符: ['1', '7', '7', '4', '5', '6', '7', '4', '5', '6', '7', '1', '2', '7', '0', '1']
匹配[^0-9a-t]范围取反匹配: ['w', 'w', 'w', '.', 'u', '.', '.', '.', '.', '.', '.', '.', '.', '.']
"""

边界数量匹配

import re

#有边界符号,表示单边位置
#如没有边界符号,表示任意全局匹配
str = "food hello Food"
pat = "fo[ol][dlk]$"
print("============开始结束匹配==============")
pat22 = "^fo[ol][dlk]"
pat33 = "fo[ol][dlk]"
print("匹配开头:", re.findall(pat, str, re.I))
print("匹配结尾:", re.findall(pat22, str, re.I))
print("匹配不限开头结尾:", re.findall(pat33, str, re.I))
print("============多位简写匹配==============")
input_data = "2020-09-09"
mark = "[0-9]{4}-[0-9]{2}-[0-9]{2}" # 使用{}进行多次匹配
print("生日格式匹配为:", re.match(mark, input_data, re.I))
print("============拆分匹配==============")
info = "hjdfkj3243423.4324324kjkl343435353adf"
mark2 = r"\d+" #加R表示,这是正则匹配,不加理论上也可以
print(re.split(mark2, info))
score = "119.9"
mark3 = r"^[+-]?\d+(\.\d+)?$"
print(re.match(mark3, score, re.I))
print("============逻辑匹配==============")
tel = "(010)-12343234"
"""
7-8位数字:'\d{7,8}'
前三位区号:\d{3,4}
区号+括号:(\d{3,4})
"""
mark4 = r"((\d{3,4})|(\(\d{3,4}\)-))?\d{7,8}"
print(re.match(mark4, tel))
"""
============开始结束匹配==============
匹配开头: ['Food']
匹配结尾: ['food']
匹配不限开头结尾: ['food', 'Food']
============多位简写匹配==============
生日格式匹配为: <re.Match object; span=(0, 10), match='2020-09-09'>
============拆分匹配==============
['hjdfkj', '.', 'kjkl', 'adf']
<re.Match object; span=(0, 5), match='119.9'>
============逻辑匹配==============
<re.Match object; span=(0, 14), match='(010)-12343234'>
"""

正则匹配模式

#正则匹配模式
import re data = """
food is very good
food is very good
food is very good
"""
mark = "fo{2}d"
mark2 = ".+"
print("多行匹配以及忽略大小写:",re.findall(mark, data, re.I | re.M)) #多行匹配以及忽略大小写
print("默认匹配,不加其他后缀:",re.findall(mark2, data)) #多行匹配以及忽略大小写
print("修改.匹配任意模式,可匹配换行等任意字符:",re.findall(mark2, data, re.S)) #多行匹配以及忽略大小写
print("忽略空白和注释,进行匹配:",re.findall(mark2, data, re.X)) #多行匹配以及忽略大小写 """
多行匹配以及忽略大小写: ['food', 'food', 'food']
默认匹配,不加其他后缀: [' ', 'food is very good', 'food is very good', 'food is very good ']
修改.匹配任意模式,可匹配换行等任意字符: [' \nfood is very good\nfood is very good\nfood is very good \n']
忽略空白和注释,进行匹配: [' ', 'food is very good', 'food is very good', 'food is very good ']
"""

分组

#获取数据后,需要再拆分,可以使用分组
import re info = "id:root, phone:11012341234, bir:2021-09-08"
mark = r"(\d{4})-(\d{2})-(\d{2})"
res = re.search(mark, info)
print("获取分组数据为 :", res.group())
print("获取第1组数据为:", res.group(1))
print("获取第2组数据为:", res.group(2))
print("获取第3组数据为:", res.group(3))
mark2 = r"\d{4}-\d{2}-\d{2}"
res2 = re.search(mark2, info)
print("不加分组括号为 :",res2.group()) """
获取分组数据为 : 2021-09-08
获取第1组数据为: 2021
获取第2组数据为: 09
获取第3组数据为: 08
不加分组括号为 : 2021-09-08
"""

环视

# 通过获取指定字符串位置,然后达到匹配目的字符

import re
info = "id:root,name:tom,age:33,id:root"
mark = r"(?<=id:)(?P<name>\w+)"
print(re.findall(mark, info)) """
['root', 'root']
"""

Python入门-正则表达式的更多相关文章

  1. Python 入门学习(贰)文件/文件夹正则表达式批量重命名工具

    基于 Udacity 的 Python 入门课程 Programming Foundations with Python 基于 Python 2.7 思路 Project 2 是一个去除文件名中所有数 ...

  2. Python入门之树莓派

    Linux命令行$+命令 pwd显示当前目录 ls列表 cd改变当前目录,/ sudo超级用户输入,特权来操作系统相关设置或删除文件 sudo apt-get  install  安装程序 sudo ...

  3. 老鸟的Python入门教程

    转自老鸟的Python入门教程 重要说明 这不是给编程新手准备的教程,如果您入行编程不久,或者还没有使用过1到2门编程语言,请移步!这是有一定编程经验的人准备的.最好是熟知Java或C,懂得命令行,S ...

  4. Python入门教程(1)

    人生苦短,我用Python! Python(英语发音:/ˈpaɪθən/), 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于19 ...

  5. Python语言学习之Python入门到进阶

    人们常说Python语言简单,编写简单程序时好像也确实如此.但实际上Python绝不简单,它也是一种很复杂的语言,其功能特征非常丰富,能支持多种编程风格,在几乎所有方面都能深度定制.要想用好Pytho ...

  6. Python 入门网络爬虫之精华版

    Python 入门网络爬虫之精华版 转载 宁哥的小站,总结的不错 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 另外,比较常用的爬虫框架Scrapy,这里最后也详细介绍一下. 首先列举 ...

  7. python之正则表达式【转】

    首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达式.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计 ...

  8. Python 入门之 内置模块 -- re模块

    Python 入门之 内置模块 -- re模块 1.re 模块 (1)什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类 ...

  9. Python入门到进阶必看的权威书籍与网站

    随着人工智能全面爆发,Python[英文单词:蟒蛇],是一款近年来爆红的计算机编程语言.1989年发明,1991年发行,比目前应用最广的Java还要大7岁,有种大器晚成的感觉. 分享之前我还是要推荐下 ...

随机推荐

  1. NSView subview blocking drag/drop event

    原文链接 近期在Mac项目中有一个处理鼠标拖拽事件的需求, 大致处理流程是这样的: 从 NSView 继承得到一个子类 覆盖处理拖拽事件相关方法 注册拖拽事件 开始的时候一切都很正常,直到某次发现拖拽 ...

  2. 空间插值生物X适宜性分析

    1 前言 这期博主将根据示例大概讲一下插值分析. 2 问题阐述 根据要求,完成以下操作: (1)请就以上条件确定此地区适合X的生活范围,并制作专题图.专题图内容要求以地形和水系作为背景,且给出适宜区域 ...

  3. ArcMap从建库到出图

    1前言 本篇博主将介绍关于ArcMap建库.数据采集.拓扑检查.图表.制作符号等的基本操作. 2问题阐述 (1)检查现有block(线要素)图层,保证所有要素闭合,并将其转换为parcel(面要素): ...

  4. Android 12(S) 图形显示系统 - BufferQueue的工作流程(十)

    题外话 疫情隔离在家,周末还在努力学习的我  ..... 一.前言 上一篇文章中,有基本讲清楚Producer一端的处理逻辑,最后也留下了一个疑问: Consumer是什么时候来消费数据的?他是自己主 ...

  5. Nginx高并发实现原理以及常用的优化手段

    Nginx 是如何实现高并发的? 异步,非阻塞,使用了epoll 和大量的底层代码优化. 如果一个server采用一个进程负责一个request的方式,那么进程数就是并发数.正常情况下,会有很多进程一 ...

  6. Grafana镜像在阿里云镜像站首发上线

    阿里云镜像站体验官招募中, 在各大社区平台分享相关内容累计积分就可赢得Airpods耳机和移动硬盘等奖励,银牌体验官的奖励人数不设限哦.立即参与 简介 Grafana是一个跨平台的开源的度量分析和可视 ...

  7. 马哥教育Linux网络班结业考试(架构师)-简答题题目(附答案)

    1.叙述 centos7 启动图形界面的开机启动流程? 答:新版本的CentOS7里,已经做了调整.具体/etc/inittab 文件的第7行已经做出了说明: 系统已经使用'targets' 取代了运 ...

  8. 如何批量修改图片名称(win下)

    深度学习目标检测任务中常常需要大量的图片,这些图片一般来自网络爬虫或是自行批量下载,但下载下的图片常常在保存时被命名为长段英文数字混写,因此规律化命名下载的图片数据名称就显得尤为重要了,下面我演示在本 ...

  9. R数据分析:纵向分类结局的分析-马尔可夫多态模型的理解与实操

    今天要给大家分享的统计方法是马尔可夫多态模型,思路来源是下面这篇文章: Ward DD, Wallace LMK, Rockwood K Cumulative health deficits, APO ...

  10. 迷宫问题,打印所有路径,深度搜索,dfs

    #include<iostream> using namespace std; int maze [5][5] = { 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0 ...