Python之获取文件夹中文件列表以及glob与fnmatch模块的使用
获取文件夹中的文件列表
print(os.listdir("../secondPackage")) # ['__init__.py', 'secondCookBook.py', '文件与IO.py', 'testPackage', '迭代器与生成器.py']
# 注释: curdir = '.' pardir = '..'
print(os.listdir(os.curdir)) # ['__init__.py', 'secondCookBook.py', '文件与IO.py', 'testPackage', '迭代器与生成器.py']
print(os.listdir(os.pardir)) # ['__init__.py', 'cookBook', 'secondPackage', 'cookBook.py']
通过某种方式过滤数据,可以考虑结合 os.path 库中的一些函数来使用列表推导。比如:
通过isfile判断是否是文件
files=[name for name in os.listdir("../secondPackage") if os.path.isfile(os.path.join("../secondPackage",name))]
print(files) # ['__init__.py', 'secondCookBook.py', '文件与IO.py', '迭代器与生成器.py'] # isdir判断是否是目录
dirs=[name for name in os.listdir("../secondPackage") if os.path.isdir(os.path.join("../secondPackage",name))]
print(dirs) # ['testPackage'] # 过滤一个目录的内容 startswith() 和 endswith()
pyfiles = [name for name in os.listdir('../secondPackage')
if name.endswith('.py')]
print(pyfiles) # ['__init__.py', 'secondCookBook.py', '文件与IO.py', '迭代器与生成器.py']
文件名的匹配,你可能会考虑使用 glob 或 fnmatch 模块
glob模块的主要方法就是glob,该方法返回所有匹配的文件路径列表(list);该方法需要一个参数用来指定匹配的路径字符串(字符串可以为绝对路径也可以为相对路径),其返回的文件名只包括当前目录里的文件名,不包括子文件夹里的文件。
import glob
# 在 secondPackage 文件夹下找所有的py 文件
print(glob.glob(r"../secondPackage/*.py")) # ['../secondPackage/__init__.py', '../secondPackage/secondCookBook.py', '../secondPackage/文件与IO.py', '../secondPackage/迭代器与生成器.py'] # iglob方法 获取一个迭代器( iterator )对象,使用它可以逐个获取匹配的文件路径名,与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而 glob.iglob一次只获取一个匹配路径
print([res for res in glob.iglob(r"../secondPackage/*.py")]) # ['../secondPackage/__init__.py', '../secondPackage/secondCookBook.py', '../secondPackage/文件与IO.py', '../secondPackage/迭代器与生成器.py']
glob模块支持的通配符:
通配符 |
功能 |
* |
匹配0或多个字符 |
** |
匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增) |
? |
匹配1个字符,与正则表达式里的?不同 |
[exp] |
匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符 |
[!exp] |
匹配不在指定范围内的字符 |
fnmatch模块,fnmatch、fnmatchcase、filter和translate
- fnmatch:判断文件名是否符合特定的模式。
- fnmatchcase:判断文件名是否符合特定的模式,区分大小写。
- filter:返回输入列表中,符合特定模式的文件名列表。
- translate:将通配符模式转换成正则表达式。
import fnmatch
print([name for name in os.listdir(os.curdir) if fnmatch.fnmatch(name,'*.py')])
# ['__init__.py', 'secondCookBook.py', '文件与IO.py', '迭代器与生成器.py']
namelist=os.listdir(os.curdir)
print(fnmatch.filter(namelist,'*.py')) # 区别是接受的第一个参数是列表
# ['__init__.py', 'secondCookBook.py', '文件与IO.py', '迭代器与生成器.py']
fnmatch模块支持的通配符:
| 通配符 | 含义 |
|---|---|
| * | 匹配任何数量的字符 |
| ? | 匹配单个字符 |
| [seq] | 匹配seq中的字符 |
| [!seq] | 匹配除seq以外的任何字符 |
glob模块和fnmatch模块区别
fnmatch模块,都是利用os.listdir获取文件列表,然后通过字符串fnmatch模块进行文件名匹配的,而glob模块比较简单,直接 实现了os.listdir 加上 fnmatch的功能
# 结合使用例子:
pyfiles = glob.glob(r"../secondPackage/*.py")
pystate=[(name,os.stat(name))for name in pyfiles]
for name,state in pystate:
print(name,state.st_size,state.st_mtime)
# ../secondPackage/__init__.py 73 1550806762.0806901
# ../secondPackage/secondCookBook.py 73 1550806783.724303
# ../secondPackage/文件与IO.py 11685 1552458917.495922
# ../secondPackage/迭代器与生成器.py 6428 1551944052.2551782
Python之获取文件夹中文件列表以及glob与fnmatch模块的使用的更多相关文章
- Python按顺序读取文件夹中文件
参考资料: https://blog.csdn.net/qq_22227123/article/details/79903116 https://blog.csdn.net/merdy_xi/arti ...
- python批量处理文件夹中文件的问题
用os模块读取文件夹中文件 原来的代码: import osfrom scipy.misc import imread filenames=os.listdir(r'./unprocess')for ...
- php获取指定文件夹中文件名称
/** * php获取指定文件夹中文件名称 * @author jackie <2018.10.10> */ public static function getFileName($fil ...
- C# 将文件夹中文件复制到另一个文件夹
p{ text-align:center; } blockquote > p > span{ text-align:center; font-size: 18px; color: #ff0 ...
- Java访问文件夹中文件的递归遍历代码Demo
上代码: import java.io.File; /* * 需求:对指定目录进行所有内容的列出(包含子目录中的内容) * 也可以理解为 深度遍历. */ public class FindAllFi ...
- C#实现对指定文件夹中文件按修改时间排序
string path = "~/Document/Introduction/团队管理制度/"; DirectoryInfo dirinfo = new Di ...
- 【linux】复制文件夹中文件,排除部分文件
如下 cp `ls|grep -v -E '*json|out'|xargs` /home/data/ 用grep -v 表示排除, -E 表示正则 ls|grep -v -E '*json|out ...
- python文件夹中文件读取踩坑
Q: 进行数据集图片预处理时,初始命名如下图(Fig1左),发现读取文件时,读取的结构并非如所设想的那样顺序读取 Fig 1 A: pyhton读取文件的时候,按照文件名的ascii码中的顺序进行逐位 ...
- 使用java读取文件夹中文件的行数
使用java统计某文件夹下所有文件的行数 经理突然交代一个任务:要求统计某个文件夹下所有文件的行数.在网上查了一个多小时没有解决.后来心里不爽就决定自己写一个java类用来统计文件的行数,于是花了两个 ...
随机推荐
- 04机器学习实战之朴素贝叶斯scikit-learn实现
In [8]: import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.pre ...
- set unused
使用 set unused 选项标记不再使用的列 使用 drop unsused columns 丢弃标记为unused的列 alter table tabName set unused column ...
- C#基础提升系列——C#任务和并行编程
C#任务和并行编程 我们在处理有些需要等待的操作时,例如,文件读取.数据库或网络访问等,这些都需要一定的时间,我们可以使用多线程,不需要让用户一直等待这些任务的完成,就可以同时执行其他的一些操作.即使 ...
- UI定位元素大全(跟App定位元素差不多哦)
selenium+python自动化之元素定位 作者:一飞冲天 同样的道理,把一个页面上的元素当成是一个对象(你的女神),我们就可以通过她的属性值来找到她,比如她性别女爱好爬山---------你就可 ...
- python学习笔记(八)函数return多个值,列表推导式和交换两个变量的值
函数return多个值: 补充知识点:写代码得到时候少用全局变量: 1.不安全 2.会一直占着内存不释放 函数多个return值,那么会把这几个return的值都放在一个元组里面,然后返回 def h ...
- 模拟安装redis5.0集群并通过Java代码访问redis集群
在虚拟机上模拟redis5.0的集群,由于redis的投票机制,一个集群至少需要3个redis节点,如果每个节点设置一主一备,一共需要六台虚拟机来搭建集群,此处,在一台虚拟机上使用6个redis实例来 ...
- shell学习记录----初识sed和gawk
Linux命令行与shell脚本编程大全中关于sed和gawk的介绍合在一起,而且结构有点乱. 不像之前的命令写的很清楚.所以这次我需要写下来整理一下. 一.sed部分 1.1 sed命令格式如下: ...
- sublime px转rem插件
http://www.cnblogs.com/phoebewang00/p/5593699.html lime 插件- px 转rem 一个CSS的px值转rem值的Sublime Text 3自 ...
- linux用setup命令来更改ip配置
在有安装系统桌面情况下,可以使用图形化形式来配置ip地址, 在命令行下,输入“setup”调出网卡.防火墙等配置界面: 2 选择“network configuration“,回车: 选择“devic ...
- PHP 常用算法【总结】
一.声明数组 ini_set("max_execution_time", "12000"); $arr = [2,4,1,7,33,4,5,6,7,11,1,0 ...