day21-Python运维开发基础(单个字符匹配 / 多字符匹配)
1. 正则表达式(单个字符匹配)

# ### 正则表达式 => 单个字符匹配
import re
"""
lst = re.findall(正则表达式,字符串)
""" # (1) 预定义字符集 # \d 匹配数字
strvar = "sadfasdf^*&^&*^&*^&*你好 神秘男孩 2400909()()"
lst = re.findall("\d",strvar)
print(lst) # \D 匹配非数字
strvar = "&&*sdfjklasjdkf_sdf',神秘女孩23423岁4234234"
lst = re.findall("\D",strvar)
print(lst) # \w 匹配字母或数字或下划线 (正则函数中,支持中文的匹配)
strvar = "uiui7887_王文&*&*"
lst = re.findall("\w",strvar)
print(lst) # \W 匹配非字母或数字或下划线
strvar = "uiui7887_王文&*&*"
lst = re.findall("\W",strvar)
print(lst) # \s 匹配任意的空白符 \n \t \r " "
strvar = " 周杰伦 "
lst = re.findall("\s",strvar)
print(lst) # \S 匹配任意非空白符
strvar = " sdf234 "
lst = re.findall("\S",strvar)
print(lst) # \n 匹配一个换行符 [最好在正则表达式的前面加上r,让转义字符失效,原型化匹配]
strvar = """
王文你真帅呀,我受不了
"""
lst = re.findall(r"\n",strvar)
print(lst) # \t 匹配一个制表符
lst = re.findall(r"\t",strvar)
print(lst) # (2) 字符组 从小组中默认选一个
lst = re.findall("[123]","")
print(lst) print(re.findall('a[abc]b','aab abb acb adb')) # aab abb acb
print(re.findall('a[0123456789]b','a1b a2b a3b acb ayb')) # a1b a2b a3b # 优化写法 0123456789 => 0-9 0到9 -是特殊字符 , 居右特殊含义
print(re.findall('a[0-9]b','a1b a2b a3b acb ayb')) # a1b a2b a3b print(re.findall('a[abcdefg]b','a1b a2b a3b acb ayb adb')) # acb adb # 优化写法 abcdefg a-g 26个小写字母 a-z
print(re.findall('a[a-z]b','a1b a2b a3b acb ayb adb')) # acb adb ayb print(re.findall('a[ABCDEFG]b','a1b a2b a3b aAb aDb aYb')) # aAb aDb # 优化写法 ABCDEFG A-G 26个大写字母A-Z
print(re.findall('a[A-Z]b','a1b a2b a3b aAb aDb aYb')) # aAb aDb aYb # 匹配所有的字母+数字
print(re.findall('a[0-9a-zA-Z]b','a-b aab aAb aWb aqba1b')) # aab aAb aWb aqb a1b # 优化写法 0-9a-zA-Z 0-z 范围变大 一些特殊符号也被包含进行了 , 不推荐使用
print(re.findall('a[0-z]b','a-b aab aAb aWb aqba@b')) # ['aab', 'aAb', 'aWb', 'aqb', 'a@b'] print(re.findall('a[0-9][*#/]b','a1/b a2b a29b a56b a456b')) # a1/b # ^ 出现在字符组中,代表除了 ,除了+-*/ 这个符号 都要
print(re.findall('a[^-+*/]b',"a%b ccaa*bda&bd")) # ['a%b', 'a&b'] # 匹配特殊符号 利用\ 让原来有意义的字符失效, 通过转义来实现匹配
lst = re.findall(r"a[\^\-]b","a^b a-b")
print(lst) # 匹配\
lst = re.findall(r"a\\b",r"a\b")
print(lst) # 显示\\
print(lst[0]) # 打印出来是一个\
正则表达式_单个字符匹配 示例代码
2. 正则表达式(多字符匹配)

# ### 正则表达式 => 多个字符匹配 # (1) 量词基本语法
import re
'''1) ? 匹配0个或者1个a '''
print(re.findall('a?b','abbzab abb aab')) # ab b ab ab b ab '''2) + 匹配1个或者多个a '''
print(re.findall('a+b','b ab aaaaaab abb')) # ab aaaaaab ab '''3) * 匹配0个或者多个a '''
print(re.findall('a*b','b ab aaaaaab abbbbbbb')) # b ab aaaaaab ab b b b b b b '''4) {m,n} 匹配m个至n个a '''
"""1<= x <=3"""
print(re.findall('a{1,3}b','aaab ab aab abbb aaz aabb')) # aaab ab aab ab aab
# {m,} 至少m次
print(re.findall('a{2,}b','aaab ab aab abbb aaz aabb')) # aaab aab aab
# {m} 必须m次
print(re.findall('a{2}b','aaab ab aab abbb aaz aabb')) #aab aab aab # (2)贪婪模式与非贪婪模式
"""
贪婪模式 : 默认向更多次匹配
非贪婪模式: 默认向更少次匹配 贪婪模式在底层使用的是回溯算法:
回溯算法:默认从左向右进行匹配,一直到最后,直到最后再也匹配不到了,回头,找最后一个能够匹配到的数据 非贪婪模式: 在量词的后面加?,这个语法就是非贪婪,默认向更少次匹配
.?? .+? .*? .{1,25}?
"""
# 贪婪模式
strvar = "刘能和刘德华和刘铁锤子777子888"
lst = re.findall("刘.",strvar) #刘能 刘德 刘铁
print(lst) lst = re.findall("刘.?",strvar) #刘能 刘德 刘铁
print(lst) lst = re.findall("刘.+",strvar) #['刘能和刘德华和刘铁锤子777子888']
print(lst) lst = re.findall("刘.*",strvar) #['刘能和刘德华和刘铁锤子777子888']
print(lst) lst = re.findall("刘.{1,25}",strvar) #['刘能和刘德华和刘铁锤子777子888']
print(lst) lst = re.findall("刘.{1,25}子",strvar) # ['刘能和刘德华和刘铁锤子777子']
print(lst) # 非贪婪模式
strvar = "刘能和刘德华和刘铁锤子777子888"
lst = re.findall("刘.??",strvar) #['刘', '刘', '刘']
print(lst) lst = re.findall("刘.+?",strvar) #刘能 刘德 刘铁
print(lst) lst = re.findall("刘.*?",strvar) #['刘', '刘', '刘']
print(lst) lst = re.findall("刘.{1,25}?",strvar) #刘能 刘德 刘铁
print(lst) lst = re.findall("刘.{1,25}?子",strvar) # ['刘能和刘德华和刘铁锤子']
print(lst) # (3) 边界符
"""
转义字符 :\b backspace 退格
边界符也用的是\b,要注意转义
例如:word 卡住边界
(1) 卡住左边界 \bw
(2) 卡住右边界 d\b
"""
strvar = "pwd word szf"
lst = re.findall(r"\bw.*",strvar)
lst = re.findall(r"\bw.*?",strvar)
lst = re.findall(r"\bw.*? ",strvar)
lst = re.findall(r"\bw\S*",strvar) print(lst)
lst = re.findall(r"d\b",strvar)
lst = re.findall(r".*d\b",strvar)
lst = re.findall(r".*?d\b",strvar) # ['pwd', ' word']
print(lst) # (4) ^ $
"""
^ 以...开头
$ 以...结尾
如果正则表达式里面出现了^ $ ,代表把这个字符串看成一个整体,再去匹配
""" strvar = "大哥大嫂大爷"
print(re.findall('大.',strvar)) # 大哥 大嫂 大爷
print(re.findall('^大.',strvar)) # 大哥
print(re.findall('大.$',strvar)) # ['大爷']
print(re.findall('^大.$',strvar))# []
print(re.findall('^大.*?$',strvar)) # 大哥大嫂大爷
print(re.findall('^大.*?大$',strvar)) # []
print(re.findall('^大.*?爷$',strvar)) # ['大哥大嫂大爷'] print(re.findall('^g.*? ' , 'giveme 1gfive gay')) #giveme
print(re.findall('five$' , 'aassfive')) # five
print(re.findall('^giveme$' , 'giveme')) # giveme
print(re.findall('^giveme$' , 'giveme giveme')) # []
print(re.findall('giveme' , 'giveme giveme')) #[giveme giveme]
print(re.findall("^g.*e",'giveme 1gfive gay')) #giveme 1gfive
正则表达式_多字符匹配 示例代码
3. 正则表达式(匹配分组 / search / 命名分组)

# ### 正则表达式 => 匹配分组
import re
print(re.findall('.*?_good','wusir_good alex_good secret男_good'))
# 把想要匹配的内容,用小圆括号包起来,表达分组
print(re.findall('(.*?)_good','wusir_good alex_good secret男_good'))
# ?: 取消括号优先显示的功能
print(re.findall('(?:.*?)_good','wusir_good alex_good secret男_good')) # | 代表或 , a|b 匹配字符a 或者 匹配字符b . 把字符串长的写在前面,字符串短的写在后面
# abc 或者 abcd
strvar = "abcpiopipoabcd234"
lst = re.findall("abc|abcd",strvar)
print(lst) # 改写
lst = re.findall("abcd|abc",strvar)
print(lst) """
\ 可以把有意义的字符变得无意义,还可以把无意义的字符变得有意义,用来转义字符
\n : 换行
\. : 单纯的匹配一个点
"""
"""
5.6
\d\.\d 39.56
\d+\.\d+
"""
# 匹配小数
strvar = "3.56 89.. .898234 8,67 39.56 34"
lst = re.findall("\d+\.\d+",strvar)
print(lst) # 匹配小数和整数
lst = re.findall(r"\d+\.\d+|\d+",strvar)
print(lst) # 使用分组合并正则 匹配小数和整数
lst = re.findall(r"\d+(?:\.\d+)?",strvar)
print(lst) # 匹配135或171的手机号
lst = re.findall(r"(?:135|171)\d{8}","13566668888 17112345678 185996964545")
print(lst) lst = re.findall(r"^(?:135|171)\d{8}$","")
print(lst) # 匹配www.baidu.com 或者 www.oldboy.com
strvar = "www.oldboy.com www.baidu.com"
lst = re.findall(r"(?:www)\.(?:baidu|oldboy)\.(?:com)",strvar)
print(lst) # search
"""
findall 匹配所有内容,缺陷:不能把匹配到的内容和分组里面的内容同时显示出来,返回的是列表
search 匹配到一个内容就直接返回,优点:可以把分组的内容,和实际匹配到的内容分开,同时显示,返回的是对象obj obj.group() 获取匹配到的内容
obj.groups() 获取分组里面的内容
"""
strvar = "www.oldboy.com www.baidu.com"
obj = re.search(r"(www)\.(baidu|oldboy)\.(com)",strvar)
print(obj)
# 获取匹配到的内容
res = obj.group()
print(res)
# 获取分组里面的内容 (推荐)
res = obj.groups()
print(res) # 获取分组里第一个元素
res = obj.group(1)
print(res)
# 获取分组里第二个元素
res = obj.group(2)
print(res)
# 获取分组里第三个元素
res = obj.group(3)
print(res) # "5*6-7/3" 匹配 5*6 或者 7/3
strvar = "5*6-7/3"
obj = re.search(r"\d+[*/]\d+",strvar)
res = obj.group()
print(res) 30
""
replace("5*6","") "5*6-7/3"
正则表达式_匹配分组_search函数 示例代码
# ### 正则表达式 => 匹配分组
import re
print(re.findall('.*?_good','wusir_good alex_good secret男_good'))
# 把想要匹配的内容,用小圆括号包起来,表达分组
print(re.findall('(.*?)_good','wusir_good alex_good secret男_good'))
# ?: 取消括号优先显示的功能
print(re.findall('(?:.*?)_good','wusir_good alex_good secret男_good')) # | 代表或 , a|b 匹配字符a 或者 匹配字符b . 把字符串长的写在前面,字符串短的写在后面
# abc 或者 abcd
strvar = "abcpiopipoabcd234"
lst = re.findall("abc|abcd",strvar)
print(lst) # 改写
lst = re.findall("abcd|abc",strvar)
print(lst) """
\ 可以把有意义的字符变得无意义,还可以把无意义的字符变得有意义,用来转义字符
\n : 换行
\. : 单纯的匹配一个点
"""
"""
5.6
\d\.\d 39.56
\d+\.\d+
"""
# 匹配小数
strvar = "3.56 89.. .898234 8,67 39.56 34"
lst = re.findall("\d+\.\d+",strvar)
print(lst) # 匹配小数和整数
lst = re.findall(r"\d+\.\d+|\d+",strvar)
print(lst) # 使用分组合并正则 匹配小数和整数
lst = re.findall(r"\d+(?:\.\d+)?",strvar)
print(lst) # 匹配135或171的手机号
lst = re.findall(r"(?:135|171)\d{8}","13566668888 17112345678 185996964545")
print(lst) lst = re.findall(r"^(?:135|171)\d{8}$","")
print(lst) # 匹配www.baidu.com 或者 www.oldboy.com
strvar = "www.oldboy.com www.baidu.com"
lst = re.findall(r"(?:www)\.(?:baidu|oldboy)\.(?:com)",strvar)
print(lst) # search
"""
findall 匹配所有内容,缺陷:不能把匹配到的内容和分组里面的内容同时显示出来,返回的是列表
search 匹配到一个内容就直接返回,优点:可以把分组的内容,和实际匹配到的内容分开,同时显示,返回的是对象obj obj.group() 获取匹配到的内容
obj.groups() 获取分组里面的内容
"""
strvar = "www.oldboy.com www.baidu.com"
obj = re.search(r"(www)\.(baidu|oldboy)\.(com)",strvar)
print(obj)
# 获取匹配到的内容
res = obj.group()
print(res)
# 获取分组里面的内容 (推荐)
res = obj.groups()
print(res) # 获取分组里第一个元素
res = obj.group(1)
print(res)
# 获取分组里第二个元素
res = obj.group(2)
print(res)
# 获取分组里第三个元素
res = obj.group(3)
print(res) # "5*6-7/3" 匹配 5*6 或者 7/3
strvar = "5*6-7/3"
obj = re.search(r"\d+[*/]\d+",strvar)
res = obj.group()
print(res) 30
""
replace("5*6","") "5*6-7/3"
正则表达式_命名分组 示例代码
day21
day21-Python运维开发基础(单个字符匹配 / 多字符匹配)的更多相关文章
- Python运维开发基础09-函数基础【转】
上节作业回顾 #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 实现简单的shell命令sed的替换功能 import ...
- Python运维开发基础08-文件基础【转】
一,文件的其他打开模式 "+"表示可以同时读写某个文件: r+,可读写文件(可读:可写:可追加) w+,写读(不常用) a+,同a(不常用 "U"表示在读取时, ...
- Python运维开发基础07-文件基础【转】
一,文件的基础操作 对文件操作的流程 [x] :打开文件,得到文件句柄并赋值给一个变量 [x] :通过句柄对文件进行操作 [x] :关闭文件 创建初始操作模板文件 [root@localhost sc ...
- Python运维开发基础06-语法基础【转】
上节作业回顾 (讲解+温习120分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 添加商家入口和用户入口并实现物 ...
- Python运维开发基础05-语法基础【转】
上节作业回顾(讲解+温习90分钟) #!/usr/bin/env python # -*- coding:utf-8 -*- # author:Mr.chen import os,time Tag = ...
- Python运维开发基础03-语法基础 【转】
上节作业回顾(讲解+温习60分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen #只用变量和字符串+循环实现“用户登陆 ...
- Python运维开发基础02-语法基础【转】
上节作业回顾(讲解+温习60分钟) #!/bin/bash #user login User="yunjisuan" Passwd="666666" User2 ...
- Python运维开发基础01-语法基础【转】
开篇导语 整个Python运维开发教学采用的是最新的3.5.2版,当遇到2.x和3.x版本的不同点时,会采取演示的方式,让同学们了解. 教学预计分为四大部分,Python开发基础,Python开发进阶 ...
- Python运维开发基础10-函数基础【转】
一,函数的非固定参数 1.1 默认参数 在定义形参的时候,提前给形参赋一个固定的值. #代码演示: def test(x,y=2): #形参里有一个默认参数 print (x) print (y) t ...
- Python运维开发基础04-语法基础【转】
上节作业回顾(讲解+温习90分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 仅用列表+循环实现“简单的购物车程 ...
随机推荐
- poi处理excel自定义日期格式
poi读取excel自定义时间类型时,读取到的是CELL_TYPE_NUMERIC,即数值类型,这个时候如果直接取值的话会发现取到的值和表格中的值不一样,这时应该先判断值是否是时间或者日期类型再进行处 ...
- java.net.URISyntaxException: Illegal character in query at index 147
这是url出现了特殊字符,需要将特殊字符进行替换
- 线上BUG定位神器(阿尔萨斯)-Arthas2019-0801
1.下载这个jar 2.运行这个jar 3.选取你需要定位的问题应用进程 然后各种trace -j xx.xxx.xx.className methodName top -n 3 这个后面要补充去看, ...
- 写作环境搭建(git+github+markdown+jekyll)
转载自: https://site.douban.com/196781/widget/notes/12161495/note/264946576/ 2013-03-04 19:33:10 --- ...
- javascript数据类型及类型的转换总结
javascript 是浏览器客户端脚本语言,要想让网页与后台程序更好的交互效果,这里我们详细了解javascript 数据类型及类型的转换 1,数据类型 number number类型 数字类型,浮 ...
- PyQt5的菜单栏、工具栏和状态栏
1.创建菜单栏import sys, mathfrom PyQt5.QtWidgets import *from PyQt5.QtGui import *from PyQt5.QtCore impor ...
- hadoop集群启动报错: java.io.IOException: Incompatible clusterIDs
java.io.IOException: Incompatible clusterIDs in /export/hadoop-2.7.5/hadoopDatas/datanodeDatas2: nam ...
- Spring Boot Shiro 使用教程
Apache Shiro 已经大名鼎鼎,搞 Java 的没有不知道的,这类似于 .Net 中的身份验证 form 认证.跟 .net core 中的认证授权策略基本是一样的.当然都不知道也没有关系,因 ...
- GO面向接口
Go 语言提供了另外一种数据类型即接口,它把所有的具有共性的方法定义在一起,任何其他类型只要实现了这些方法就是实现了这个接口. 实例 实例 /* 定义接口 */ type interface_name ...
- jQuery学习(三)
jQuery文档操作方法 1.内部追加内容 选择器追加到内容 append(content)在当前jQuery对象内部所包含的DOM对象的内部的最后追加content对应的内容,其中content可以 ...