Python组织文件 实践:将带有美国风格日期的文件改名为欧洲风格日期
描述:假设有这样一个任务,你需要将文件名中含有美国风格日期(MM-DD-YYYY)的部分更换为欧洲风格日期(DD-MM-YYYY),并且需要你处理的文件多达上千个
分析:检查当前工作目录的所有文件名,寻找美国风格的日期。如果找到,将改文件改名,交换月份和日期的位置,使之成为欧洲风格
程序需要做以下事情
1)创建一个正则表达式,可以识别美国风格日期的文本模式
2)调用 os.listdir() 找出工作目录中的所有文件
3)循环遍历每个文件名,利用该正则表达式检查他是否包含日期
4)如果它包含日期,用 shutil.move() 对该文件改名
完整代码如下
#! python3
# renameDates.py - 将带有美国风格日期的文件更名为欧洲风格日期
import os,re #为美国风格日期(MM-DD-YYYY)创建一个正则表达式
def USADateSearch(flodername):
USADateRegex=re.compile(r'''
^(.*?) #匹配文件名的全部
((0|1)?\d) #匹配月份并分组
[-.] #分隔符为.或-
([0-3]?[0-9]) #匹配日期并分组
[-.]
((19|20)\d\d)
(.*?)$
''',re.VERBOSE) return USADateRegex.search(flodername)
#在文件夹中创建文件
#filename-包含多个文件名的列表
#path-保存文件的路径
def creatfile(filename,path):
for filename in filename:
fileAbsPath=os.path.join(path,filename)
fileObj=open(fileAbsPath,'w')
fileObj.close() path=r'C:\\Users\\Administrator.SC-s\\AppData\\Local\\Programs\\Python\\Python37\\forTest'
foldername=['img-11.08.1995.txt','img-2333434.txt','img-21.05.1995.txt',
'img-12.08-1994.jpg','img-12.8.1994.gif','img-01.31.2030.txt',
'img-1.31.2030.jpg','img-05.05.1995.jpg','img-2-2-2011.txt']
#设置当前工作目录(要用绝对路径的话就不用设置了)
os.chdir(path)
#先创建文件,只运行一次,先不要删除
#creatfile(foldername,path)
#定义一个主函数吧
def main():
for filename in os.listdir(path):
mo=USADateSearch(filename)
if mo==None:
print('-'*20)
continue
#这里必须把所有的值给取过来,不能只要月和日
#获得年月日各部分
beforePart=mo.group(1)
monthPart=mo.group(2)
dayPart=mo.group(4)
yearPart=mo.group(5)
afterPart=mo.group(7)
#连接字符串
euroFilename=beforePart+dayPart+'-'+monthPart+'-'+yearPart+afterPart
#获取绝对路径
amerFilename=os.path.join(path,filename)
euroFilename=os.path.join(path,euroFilename)
#重命名文件
print('Renaming "%s" to "%s"...' %(amerFilename,euroFilename))
os.rename(amerFilename,euroFilename)
main()
step1:为美国风格日期(MM-DD-YYYY)创建一个正则表达式
可以根据每个数段的范围来拼写正则表达式,但又出现了一个问题,假如MM和DD的日期相同时可能会匹配到到错的,你不能确定他是欧洲风格还是美国风格,但是仔细思考过后,我只是把它们翻转过来,即是匹配到的是不准确的,但是因为他们相同,翻转后也是相同的
USADateRegex=re.compile(r'''(
^(.*?) #匹配文件名的全部
((0|1)?\d) #匹配月份并分组
[-.] #分隔符为.或-
([0-3]?[0-9]) #匹配日期并分组
[-.]
(19|20)\d\d
(.*?)$
)''',re.VERBOSE)
step2:识别文件名中日期部分
for filename in os.listdir('.'):
mo=USADateSearch(filename)
if mo==None:
print('-'*20)
continue
#这里必须把所有的值给取过来,不能只要月和日
#获得年月日各部分
beforePart=mo.group(1)
monthPart=mo.group(2)
dayPart=mo.group(4)
yearPart=mo.group(5)
afterPart=mo.group(7)
step3:构成新文件名,并对文件改名
#连接字符串
euroFilename=beforePart+dayPart+'-'+monthPart+'-'+yearPart+afterPart
#获取绝对路径
amerFilename=os.path.join(path,filename)
euroFilename=os.path.join(path,euroFilename)
#重命名文件
print('Renaming "%s" to "%s"...' %(amerFilename,euroFilename)) #这里面之所以把占位符用双引号括起来,是因为用单引号需要转义,太麻烦
os.rename(amerFilename,euroFilename) #第一次运行时通常需要将这行注释,用然后检查上一行打印的信息,确认重命名争取了后再运行
遇到的问题:
管道匹配时句法
可能会存在的缺陷:
匹配日期的正则表达式有漏洞:如会匹配XXX31.08.1995 未纠正
调用 shutil.move() 来改名,会不会太浪费了,会造成无用的操作,毕竟我们只需要改变文件名(已解决)
Python组织文件 实践:将带有美国风格日期的文件改名为欧洲风格日期的更多相关文章
- Pyhton项目实践:将带有美国风格日期的文件改名为欧洲风格日期
题目 项目要求:上千个文本文件,文件名包含美国风格的日期( MM-DD-YYYY),需要将它们改名为欧洲风格的日期( DD-MM-YYYY) 先写个创建一百个美国风格日期的文件 #! python # ...
- Python组织文件 实践:拷贝某种类型的所有文件
#! python3 #chapter09-test01- 遍历目录树,查找特定扩展名的文件不论这些文件的位置在哪里,都将他们 #拷贝到一个新的文件夹中 import os,shutil,pprint ...
- Python组织文件 实践:将文件的不同版本备份为ZIP文件
功能:备份文件夹.能将文件的不同版本备份下来,并且每个有不同的名字 #! python3 # backupToZip.py - 备份文件的不同版本到压缩文件中 import zipfile,os #f ...
- paip.复制文件 文件操作 api的设计uapi java python php 最佳实践
paip.复制文件 文件操作 api的设计uapi java python php 最佳实践 =====uapi copy() =====java的无,要自己写... ====php copy ...
- python实践项目十:zipfile模块-将一个文件夹备份到一个 ZIP 文件
描述:将指定路径下的某文件夹备份到一个zip文件 代码: #!/usr/bin/python # -*- coding: UTF-8 -*- # backupToZip - Copies an ent ...
- 《Python机器学习及实践:从零开始通往Kaggle竞赛之路》
<Python 机器学习及实践–从零开始通往kaggle竞赛之路>很基础 主要介绍了Scikit-learn,顺带介绍了pandas.numpy.matplotlib.scipy. 本书代 ...
- Redis的Python实践,以及四中常用应用场景详解——学习董伟明老师的《Python Web开发实践》
首先,简单介绍:Redis是一个基于内存的键值对存储系统,常用作数据库.缓存和消息代理. 支持:字符串,字典,列表,集合,有序集合,位图(bitmaps),地理位置,HyperLogLog等多种数据结 ...
- Python自动化运维之4、格式化输出、文件对象
Python格式化输出: Python的字符串格式化有两种方式: 百分号方式.format方式 百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存.[P ...
- [Python][小知识][NO.5] 使用 Pyinstaller 打包成.exe文件
1.安装 pyinstaller 插件 cmd命令:pip install PyInstaller PS . o.o 不知道 easy_install 的百度吧. 2.pyinstaller 简介 他 ...
随机推荐
- Angular4集成ng2-file-upload
在Github上找到了一个支持Angular4好用的文件上传组件ng2-file-upload,这里简单介绍一下这个库的集成使用方案. 本文基于该组件的1.2.1版. 1. 安装 安装非常简单, ...
- 【原创】使用Kettle的一些心得和经验
用kettle做etl也有段时间了,遇到很多问题,总结了一下. [关于版本的问题] kettle常用的版本有4.1和4.4,对于4.1版本: 1.该版本的兼容性有点差,在某些机器上运行会启动失败,或者 ...
- POJ 3660 Cow Contest【传递闭包】
解题思路:给出n头牛,和这n头牛之间的m场比赛结果,问最后能知道多少头牛的排名. 首先考虑排名怎么想,如果知道一头牛打败了a头牛,以及b头牛打赢了这头牛,那么当且仅当a+b+1=n时可以知道排名,即为 ...
- 《Unix环境高级编程》读书笔记 第8章-进程控制
1. 进程标识 进程ID标识符是唯一.可复用的.大多数Unix系统实现延迟复用算法,使得赋予新建进程的ID不同于最近终止所使用的ID ID为0的进程通常是调度进程,也常被称为交换进程.它是内核的一部分 ...
- document.body
比如document.body,最好是写成document.getElementsByTagName("body")[0];
- VB学习生成JavaBean
Application.ActiveWorkbook.Path 获取当前excel文件所在的文件地址 Excel VBA中表示当前工作簿,有Activeworkbook和Thisworkbook 两种 ...
- React中的事件处理为什么要bind this?
个人总结: 问: 请给我讲一下React中的事件处理为什么要bind this? 答: 好的,比如说我写了一个类组件,有个onClick属性 ,onClick={ this.fun },如果不bind ...
- 紫书 习题8-18 UVa 11536 (扫描法)
这道题貌似可以用滑动窗口或者单调栈做, 但是我都没有用到. 这道题要求连续子序列中和乘上最小值最大, 那么我们就可以求出每一个元素, 以它为最小值的的最大区间的值, 然后取max就ok了.那么怎么求呢 ...
- jquery IE7 下报错:SCRIPT257: 由于出现错误 80020101 而导致此项操作无法完成
非IE(内核)浏览器运行正常,在IE中运行异常,一般考虑为js中多了符号. 常见的有: 1.上面的html注释"<!-- -->",这种 ...
- POJ 1741 Tree 树的分治(点分治)
题目大意:给出一颗无根树和每条边的权值,求出树上两个点之间距离<=k的点的对数. 思路:树的点分治.利用递归和求树的重心来解决这类问题.由于满足题意的点对一共仅仅有两种: 1.在以该节点的子树中 ...