Python os模块实例之遍历目录及子目录指定扩展名的文件
需求:在该目录下有很多子目录(如下图,截图了部分),现要从该目录和所有子目录下找到所有扩展名为.meta的文件,并获取文件中第二行guid的值(': '后面的),然后将所有guid的值输出到另一文件中

.meta文件截图:

思路:
遍历当前目录的子目录,如果是文件并且扩展名为.meta,获取guid,写入到guid.txt;如果是子目录,则遍历子目录下的文件。
方法一:
#!usr/bin/env python
# -*- coding: utf-8 -*- import os outfile = open('guid.txt', 'a') # 以追加方式打开输出文件
for dir in os.listdir('.'): # 遍历当前目录所有问价和目录
child = os.path.join('.', dir) # 加上路径,否则找不到
if os.path.isdir(child): # 如果是目录,则继续遍历子目录的文件
for file in os.listdir(child):
if os.path.splitext(file)[1] == '.meta': # 分割文件名和文件扩展名,并且扩展名为'meta'
file = os.path.join(child, file) # 同样要加上路径
f = open(file, 'r')
guid = f.readlines()[1].split(': ')[1] # 获取文件第二行以': '分割的后者
outfile.write(guid) # 写入输出文件
f.close()
elif os.path.isfile(child): # 如果是文件,则直接判断扩展名
if os.path.splitext(child)[1] == '.meta':
f = open(child, 'r')
guid = f.readlines()[1].split(': ')[1]
outfile.write(guid)
f.close()
outfile.close()
方法二:上面的方法只能遍历两级目录,如果要遍历三级目录,必须还要加一个for循环。那么可以用到os.walk()方法一次性遍历当前目录和所有子目录的文件和目录。
#!usr/bin/env python
# -*- coding: utf-8 -*- import os outfile = open('guid.txt', 'a') # 以追加方式打开输出文件
for dirpath, dirs, files in os.walk('.'): # 递归遍历当前目录和所有子目录的文件和目录
for name in files: # files保存的是所有的文件名
if os.path.splitext(name)[1] == '.meta':
filename = os.path.join(dirpath, name) # 加上路径,dirpath是遍历时文件对应的路径
f = open(filename, 'r')
guid = f.readlines()[1].split(': ')[1] # 获取文件第二行以': '分割的后者
outfile.write(guid) # 写入输出文件
f.close()
outfile.close()
在该目录下运行此程序,将会得到guid.txt。
相关方法的作用和理解见:http://www.cnblogs.com/victorwu/p/5838430.html
Python os模块实例之遍历目录及子目录指定扩展名的文件的更多相关文章
- java基础知识回顾之javaIO类--File类应用:获取指定目录下面的指定扩展名的文件,将文件的绝对路径写入到目的文件当中
/** * File文件综合应用 * 需求:获取指定目录下面,指定扩展名的文件,将文件的绝对路径写到文本文件当中. * * 思路:1.需要深度遍历.--递归 * 2.遍历的过程中过滤指定扩展名的文件 ...
- python工具程序一、复制目录中指定扩展名的文件
#!/usr/bin/env python # coding:utf-8 # xcopy Lib directory and rename all files to *d.lib import os ...
- Python::OS 模块 -- 文件和目录操作
os模块的简介参看 Python::OS 模块 -- 简介 os模块的进程管理 Python::OS 模块 -- 进程管理 os模块的进程参数 Python::OS 模块 -- 进程参数 os模块中包 ...
- python OS 模块 文件目录操作
Python OS 模块 文件目录操作 os模块中包含了一系列文件操作的函数,这里介绍的是一些在Linux平台上应用的文件操作函数.由于Linux是C写的,低层的libc库和系统调用的接口都是C AP ...
- 【学习】Python os模块常用方法 记录
记录一些工作中常用到的用法 os.walk() 模块os中的walk()函数可以遍历文件夹下所有的文件. os.walk(top, topdown=Ture, onerror=None, follow ...
- Python::OS 模块 -- 进程参数
os模块的简介请参看 Python::OS 模块 -- 简介 os模块的文件和目录操作 Python::OS 模块 -- 文件和目录操作 os模块的进程管理 Python::OS 模块 -- 进程管理 ...
- Python::OS 模块 -- 进程管理
os模块的简介参看 Python::OS 模块 -- 简介 os模块的文件相关操作参看 Python::OS 模块 -- 文件和目录操作 os模块的进程参数 Python::OS 模块 -- 进程参数 ...
- Python::OS 模块 -- 简介
OS 模块简介 OS模块是Python标准库中的一个用于访问操作系统功能的模块,OS模块提供了一种可移植的方法使用操作系统的功能.使用OS模块中提供的接口,可以实现跨平台访问.但是在OS模块中的接口并 ...
- Python OS模块标准库的系统接口及操作方法
Python OS模块标准库的系统接口及操作方法 os.name 返回当前操作系统名,定义了'posix','nt','mac','os2','ce','java'(我使用win7/python3.1 ...
随机推荐
- haproxy安装配置for mysql负载均衡(ubantu)
1.安装pcre apt-get update (apt-get install openssl libssl-dev ==>可能需要安装的依赖包) apt-get install libpc ...
- java泛型探索——小特性
泛型特性(小篇幅) 1. 补充介绍一些常见的泛型特性: 类型参数T可以是recursive(类似递归性),它的边界可以是类型参数是自身的接口或类. 如我实现寻找最大值的方法,可以这么写: public ...
- Centos6.5静默安装Oracle11g
sed -i "s/SELINUX=enforcing/SELINUX=disabled/" /etc/selinux/configsetenforce 0yum -y insta ...
- Centos6.5_x86上Oracle11g2 32位的安装与卸载以及相关问题汇总
需要注意的问题: 1.Linux包括内核和要安装的oralce版本是否符合(这个在官方文档中有说明). 2.安装oracle一般会新建一个为oracle的账户,注意在安装的过程中的root和oracl ...
- smarty的学习计划(1)
1.什么事smarty? 不知道,smarty是一个使用PHP写出来的模板引擎,它提供了逻辑外在内容的分离 2.smarty优点: a.速度:成熟的模板引擎技术 b.编译型:采用smarty编写的程序 ...
- 进军VR虚拟现实-先来全景智慧城市-有梦想的互联网创业者
随着VR的大火,越来越多的企业开始进军VR行业,不过并不是所有企业进军VR行业都是成功的,那么问题来了,VR虚拟现实行业投资怎么做才能取得成功呢?这是当下很多企业面临的一个问题,VR虚拟现实行业投资也 ...
- java虚拟机学习-JVM调优总结-基本垃圾回收算法(7)
可以从不同的的角度去划分垃圾回收算法: 1.按照基本回收策略分 引用计数(Reference Counting): 比较古老的回收算法.原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计 ...
- PHP开发微信模版消息换行的问题
微信是个坑!微信是个坑!微信是个坑!重要的时间说三遍 关键的地方是空白换行符到底是什么也不说,百度说是"\n":但是在发送消息的时候发现原样输出,发现json_encode对\n进 ...
- Updates were rejected because the remote contains work that you do
每次建立新的仓库,提交的时总会出现这样的错误,真是头疼,...... 直接开始正题,git 提交的步骤: 1. git init //初始化仓库 2. git add .(文件name) //添加文件 ...
- VOD, TVOD, SVOD FVOD的区别(转)
VOD: Video On Demand 视频点播 TVOD: True Video On Demand 即点即播 按次付费点播,付费后,观众一般有48小时的时间可以观看该片,48小时后需要再次付费才 ...