Python常用模块(四)
一.re模块
正则表达式时计算机科学的一个概念,正则表达式通常被用来检索,替换那些符合某个模式的文本,大多数程序设计语言都支持利用正则表达式进行字符串操作.
正则就是用一些具有特殊含义的符号组合到一起来描述字符或者字符串的方法,或者说正则就是用来描述一类事物的规则.它内嵌在python中,并通过re模块来实现,正则表达式模式被编译成一系列的字节码,然后由C编写的匹配引擎执行.re模块的作用是对字符串进行过滤,在一字符串中如果想要找到想要得到的内容就需要告知其过滤规则,这个过滤规则就是正则表达式.
常用匹配模式:

import re
# 待处理字符串
str1 = 'abc-d$eaf+ \n 1*/__g12a3'
# findall()在字符串中查找所有满足条件的
# \w查找字母数字下划线 \W查找非字母数字下划线
print(re.findall('\w',str1))
print(re.findall('\W',str1)) # \s查找所有不可见字符 \S查找所有可见字符
print(re.findall('\s',str1))
print(re.findall('\S',str1)) # \d查找任意数字 \D查找任意非数字
print(re.findall('\d',str1))
print(re.findall('\D',str1)) # \n
print(re.findall('\n',str1)) # .匹配除了换行符的任意字符
print(re.findall('.',str1)) # \s\w\d 都是匹配单个字符
# 匹配重复字符* + ? {}
# *前面的表达式匹配0次或多次
print(re.findall('\w\d*',str1)) # +前面的表达式匹配1次或多次
print(re.findall('\d+','1 11 asf 2')) # ?前面的表达式匹配1次或0次
print(re.findall('\d?','1 111')) # {m,n}最少m次,最多n次
print(re.findall('\d{1,3}','1 12111'))
#{m}必须是m次
print(re.findall('[a-z]{3}','aaa aa a aa aaa aaaa')) # 从字符中找到左右的0或1或2
# | 匹配范围
print(re.findall('0|1|2','123af45ad60d21'))
# []字符集合 中括号中的符号不是整体是单个字符
print(re.findall('[012]','123af45ad60d21'))
# 在范围匹配时使用脱字符表示取反
print(re.findall('[^0-9]','123af45ad60d21'))
# 请找出所有的数字0-9和字母a-z A-Z 注意 减号只有在两个字符中间才有范围的意思
print(re.findall('[0-9a-zA-Z]','123+_lk#$a')) # ^ 匹配行首
print(re.findall('^h','hellohh'))
# $ 匹配行尾 注意$写在表达式的后面
print(re.findall('ha$','hellohha')) # \b匹配单词末尾
print(re.findall(r'h\B','elloh wohrld okhi')) # 贪婪匹配 * +
# 会一直匹配到不满足条件为止 用问好来阻止贪婪匹配(匹配最少满足条件的字符数)
print(re.findall('\w*?','sfasdefd')) src = "<img src='www.baidu.jpg'><img src='www.baidu1.jpg'><img src='www.baidu2.jpg'>"
# ()用于给正则表达式分组(group) 不会改变原来的表达式逻辑意义
# 优先取出括号内的内容 ?:取消括号的优先级
print(re.findall("src='(.+?)'",src))
二.subprocess模块
subprocess模块是python2.4中新增的一个模块,它允许你生成新的进程,连接到它们的in/out/err管道,并获取他们的返回码.
subprocess模块中常用函数:
subprocess.run() Python 3.5中新增的函数。执行指定的命令,等待命令执行完成后返回一个包含执行结果的CompletedProcess类的实例
subprocess.call() 执行指定的命令,返回命令执行状态,其功能类似于os.system(cmd)。
subprocess.Popen() 该类用于在一个新的程序中执行一个子程序.上面的函数都是基于subprocess.Popen类实现的
实例代码:
import subprocess
res = subprocess.run('tasklist',shell=True,stdout=subprocess.PIPE)
print(res.stdout.decode('gbk')) print(res.stderr)
#
res = subprocess.call('tasklist',shell=True)
print(res)
# 第一个进程a读取tasklist的内容 将数据交给另一个进程b 另一个进程b将数据写到文件中
res1 = subprocess.Popen('tasklist',stdout=subprocess.PIPE,shell=True,stderr=subprocess.PIPE)
res2 = subprocess.Popen('findstr cmd',stdout=subprocess.PIPE,shell=True,stderr=subprocess.PIPE,stdin=res1.stdout)
print(res2.stdout.read().decode('gbk'))
Python常用模块(四)的更多相关文章
- python常用模块之时间模块
python常用模块之时间模块 python全栈开发时间模块 上次的博客link:http://futuretechx.com/python-collections/ 接着上次的继续学习: 时间模块 ...
- python常用模块-调用系统命令模块(subprocess)
python常用模块-调用系统命令模块(subprocess) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. subproces基本上就是为了取代os.system和os.spaw ...
- python常用模块-配置文档模块(configparser)
python常用模块-配置文档模块(configparser) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. ConfigParser模块用于生成和修改常见配置文档,当前模块的名称 ...
- Python常用模块-摘要算法(hashlib)
Python常用模块-摘要算法(hashlib) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.MD5算法参数详解 1.十六进制md5算法摘要 #!/usr/bin/env p ...
- Python常用模块-时间模块(time&datetime)
Python常用模块-时间模块(time & datetime) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.初始time模块 #!/usr/bin/env pyth ...
- Python常用模块之sys
Python常用模块之sys sys模块提供了一系列有关Python运行环境的变量和函数. 常见用法 sys.argv 可以用sys.argv获取当前正在执行的命令行参数的参数列表(list). 变量 ...
- Python常用模块中常用内置函数的具体介绍
Python作为计算机语言中常用的语言,它具有十分强大的功能,但是你知道Python常用模块I的内置模块中常用内置函数都包括哪些具体的函数吗?以下的文章就是对Python常用模块I的内置模块的常用内置 ...
- python——常用模块2
python--常用模块2 1 logging模块 1.1 函数式简单配置 import logging logging.debug("debug message") loggin ...
- python——常用模块
python--常用模块 1 什么是模块: 模块就是py文件 2 import time #导入时间模块 在Python中,通常有这三种方式来表示时间:时间戳.元组(struct_time).格式化的 ...
随机推荐
- 【bzoj1853】: [Scoi2010]幸运数字 数论-容斥原理
[bzoj1853]: [Scoi2010]幸运数字 预处理出所有幸运数字然后容斥原理 但是幸运数字是2logn个数的 直接搞会炸 所以把成倍数的处理掉 然后发现还是会T 所以数字要从大到小处理会快很 ...
- python学习过程(四)
上节我们说了怎么从一个网页中获取所有的a标签,包括a标签的文本和a标签的url,以及最后经过整理,直接从网页中获取key-value键值对,也就是标签:url这种形式. 例如 : 百度: http:/ ...
- jupyter notebook 设置默认目录
1.打开 cmd 输入命令 jupyter notebook --generate-config 可以看到生成文件的路径,这个就是生成的配置文件jupyter_notebook_config.py, ...
- Qt 学习之路 2(26):反走样
Qt 学习之路 2(26):反走样 豆子 2012年11月12日 Qt 学习之路 2 9条评论 我们在光栅图形显示器上绘制非水平.非垂直的直线或多边形边界时,或多或少会呈现锯齿状外观.这是因为直线和多 ...
- ubuntu 搭建django 环境
ubuntu 默认安装了 python2.7 . 安装django apt install python-django: 安装mysql apt install mysql-server* *代表版 ...
- HDU 5934 (强连同分量+缩点)
题意: 给出n个炸弹的信息 :坐标x , 坐标y , 爆炸半径 , 成本: 如果一个炸弹被引爆那这个范围的都爆炸 , 问最小的成本是多少? 题意:首先先来个n^2 暴力出某个炸弹爆炸波及的其他炸弹,用 ...
- HIVE锁相关
hive存在两种锁,共享锁Shared (S)和互斥锁Exclusive (X) 其中只触发s锁的操作可以并发的执行,只要有一个操作对表或者分区出发了x锁,则该表或者分区不能并发的执行作业. -- 加 ...
- spring aop实现log 日志跟踪
之前写的那篇是基于springboot的(https://www.cnblogs.com/yaoyuan2/p/10302802.html),由于遗留项目用的是spring,因此需要在spring基础 ...
- 1 Groovy
1.1 什么是Groovy? groovy 是一个弱类型,动态语言,并且运行在JVM之上.它与java联系紧密.它是一个功能丰富和友好的java语言. Groovy源代码,通过Groovy编译器编译 ...
- ubuntu 常用安装软件
1. Ubuntu安装chrome. sudo apt-get install chromium-browser w