运营那边有个需求。

下载了一批视频文件,由于当时下载的时候陆陆续续创建了很多文件夹,并且,每个文件夹下面还有子文件夹以及视频文件,子文件夹下面有视频文件或者文件夹

现在因为需要转码,转码软件只能对单个文件夹操作。

这时候找上我,问我能不能帮忙把所有的文件单独提取出来到一个文件夹中。他们那边转码完毕,还要放回原来的文件夹

这边琢磨下下。匆忙写了个脚本。功能实现了。但是代码需要优化(后面有空了再说吧)

使用递归方法获取每个文件绝对路径(不要单独的目录),并放入列表中。最终存到excel表中

excel表存2列,第一列是每个文件的绝对目录,第二列是文件名

使用shutil模块移动文件(这里是剪切,因为文件比较多。太占空间了)

考虑到目录中可能存在文件名一致的文件,这样移动到一个目录的话可能会覆盖原来的。

这边考虑文件名一致的话不移动,但是记录下路径。让运营决定怎么处理同名的文件(因为可能他们要存2份,或者说文件名一致,实际文件内容是有差别的)

失败记录.log文件用于记录在移动文件过程中某文件名变化或者文件不存在

(因为文件较多,这里有6000多文件。文件列表很快就获取到,但是从文件列表逐个移动文件过程中,万一某文件由于人为操作删除或者改名了或者其它因素导致列表中文件路径不对了。因此用了if else判断记录下)

重名文件信息.log用于记录重名文件。这个是给运营看的。让他们决定如何处理重名文件

这里多了一些print操作以及time.sleep操作,是为了后面打成exce程序执行的时候好看点,不然一个黑洞洞的窗口不太友善。多一些输出信息显得好点(文件太少的话可能瞬间执行完毕了。sleep一下显得好点)

!!!最后注意下,因为此脚本最后打成exe程序。准备放入某目录下执行。因此这里的this_path获取的是当前路径。假如自己使用pycharm或者python工具测试,需要指定一下测试路径

比如this_path="D:\\work\\tmp"

否则可能把你当前目录下的文件都移走到all_files下面了

import os
import xlwt,time,shutil
#获取当前文件所在绝对目录路径
this_path=os.path.abspath('.')
#定义个列表存放每个文件路径,便于后期操作
file_list=[] #创建个方法,统计每个文件路径,并追加列表中。用到了递归
def get_all_file(dir_path):
for file in os.listdir(dir_path):
# print(file)
filepath=os.path.join(dir_path,file)
# print(filepath)
if os.path.isdir(filepath):
get_all_file(filepath)
else:
file_list.append(filepath)
return file_list
#执行上面方法,把每个文件绝对路径追加到列表中
get_all_file(this_path) #定义总目录名,准备存放列表中所有文件
target_dir='all_files'
#创建一个总视频目录,用于存放视频文件
if not os.path.exists(target_dir):
print(target_dir+'作为总视频目录不存在,正在创建.....')
time.sleep(2)
os.mkdir(target_dir)
print(target_dir+"总视频目录创建成功")
time.sleep(2) #创建一个excel表存放文件路径信息,第一列是目录,第二列是文件名
wb = xlwt.Workbook()
sh = wb.add_sheet('文件和目录信息')
row_count=0
for file in file_list:
dir_filename=os.path.split(file)
sh.write(row_count,0,dir_filename[0])
sh.write(row_count,1,dir_filename[1])
row_count+=1 wb.save("文件路径信息统计结果.xls") #定义个日志存放异常信息以及重名文件
f_fail = open('失败记录.log','a') # 追加模式
f_same= open('重名文件信息.log','a') # 追加模式
#移动文件 print("开始移动文件.................")
time.sleep(2)
for file in file_list:
if os.path.exists(file):
file_name=os.path.split(file)[1]
target_path=os.path.join(target_dir,file_name)
if os.path.exists(target_path):
print(target_dir+"目录中----"+file_name+"----已经存在,移动失败")
f_same.write(target_dir+"目录中----"+file_name+"----已经存在,移动"+file+"失败\r\n")
else:
shutil.move(file,target_path)
time.sleep(0.1)
else:
print(file,"not exist")
f_fail.write(file+"----不存在\r\n")
print(file+"----不存在\r\n")
time.sleep(0.5)
print("程序执行完毕,3秒后退出")
time.sleep(3)

  

把程序打成exe

找到此文件

下面是测试过程

把此exe程序放入0512这个目录下。执行的时候他会查找每个目录下的子目录和文件。并统一放入新创建的all_files目录中。

同时记录excel表移动之前的路径信息。

同名文件不会移动,继续保持原来的路径

假如youku目录下也有个hehe.rtf文件,那么正常来说0512目录下或者0512\youku目录下,有一个hehe.ref文件不会被移动过去。但是会记录重名文件信息.log中

开始执行(记得关闭杀毒软件)

执行完毕,多了3个文件。一个excel表记录原文件路径的,2个日志文件

查看重名文件信息日志

此文件没被移动

其它目录下都空了

(尴尬)此exe程序也被移动过去了,这点有点不足(把自己移动过去了)。后期优化下吧

看一下excel表,第一列是原文件目录名,第二列是此文件名。转码之后可以通过excel表路径信息把文件再移动回去

python找递归目录中文件,并移动到一个单独文件夹中,同时记录原始文件路径信息的更多相关文章

  1. 在VS中让一个JS文件智能提示另一个JS文件中的成员

    “在VS中如何让一个JS文件智能提示另一个JS文件中的成员” 有时候会有这种情况:当我的一个Web页面引用了两个JS文件(假如分别叫common.js和JScript1.js),如果JScript1. ...

  2. Shell脚本中引用、调用另一个脚本文件的2种方法

    Shell脚本中引用.调用另一个脚本文件的2种方法 http://www.jb51.net/article/67903.htm

  3. linux面试题:删除一个目录下的所有文件,但保留一个指定文件

    面试题:删除一个目录下的所有文件,但保留一个指定文件 解答: 假设这个目录是/xx/,里面有file1,file2,file3..file10 十个文件 [root@oldboy xx]# touch ...

  4. Linux:删除一个目录下的所有文件,但保留一个指定文件

    面试题:删除一个目录下的所有文件,但保留一个指定文件 解答: 假设这个目录是/xx/,里面有file1,file2,file3..file10  十个文件 [root@oldboy xx]# touc ...

  5. 在VS中让一个JS文件智能提示另一个JS文件中的成员2--具体引用

    我们知道,在html中,利用<script language="javascript" type="text/javascript" src=" ...

  6. [原创]VBA实现汇总excel,将多个Excel文件内容复制到一个Excel文件中

    功能:遍历用户指定的文件夹,把文件夹中所有的excel文件的第一个表格的数据复制到本excel文件中.注意,每个excel文件中有效数据行的判断标准是A列的最后一个有数据的单元格的行号,比如A列到第1 ...

  7. Linux内核驱动将多个C文件编译成一个ko文件的方法——每一个C文件中都有module_init与module_exit

    以两个C文件为例: 将本该被分别编译成adc_device.ko和adc_driver.ko的adc_device.c.adc_driver.c编译成一个ko文件! 採用方法: 第一步.改动C文件 1 ...

  8. c++ 一个cpp文件如何调用另一个cpp文件已经定义的类?我不想重复定义

    文件test1.cpp有类class A;文件test2.cpp有类class B.如在test2.cpp中想用A:#include "test1.cpp" 当然一般的做法是将类的 ...

  9. 用Python删除本地目录下某一时间点之前创建的文件

    参考http://www.cnblogs.com/iderek/p/8035757.html os.listdir(dirname):列出dirname下的目录和文件 os.getcwd():获得当前 ...

随机推荐

  1. P1325 雷达安装

    传送门 思路: 采取贪心的思想. 把每个岛屿看作圆心,以雷达的范围 d 为半径,求出与 x 轴的左右两个交点,两交点所夹的区间就需要放置一个雷达,这样就把这道题转换为了区间取点问题.在枚举岛屿时,记录 ...

  2. js实现往数组中添加非存在的对象,如果存在就改变键值。

    let arr = [] // 数组中元素数据类型为{name: 'bb', age: 12} // 现在需求是,将每次获得的新对象{name: '', age: }push到数组arr中,但前提是数 ...

  3. React文档(十七)非受控组件

    大多数情况下,我们建议使用受控组件(也就是用React的state来控制表单元素的value值)来实现表单.在一个受控组件里,表单数据被React组件处理.另一种方案就是非控制组件,这样的话表单数据就 ...

  4. 中国历史人物传记数据库 CBDB 若干表简介

    ''' 推荐使用SQLite版本的CBDB数据库 推荐使用SQlite Studio进行数据库的操作 免费,可视化操作,轻量级应用,无需配置,学习扩展性好,非常适合广大历史系学生. ''' 一 人物基 ...

  5. RABC --权限控制解读

    一.基于RBAC的概念介绍 1.RBAC(Role-Based Access Control )基于角色的访问控制. 2.RBAC认为权限的过程可以抽象概括为:判断[Who是否可以对What进行How ...

  6. Java实现类似eval()函数或exec()函数的功能

    一篇参考博客:http://www.cnblogs.com/fangwenyu/archive/2011/10/12/2209051.html 在Python中有一个exec()函数,同样在JavaS ...

  7. 实践:搭建基于Load Balancer的MySql Cluster

    服务器规划: 整套系统全部在rhel5u1 server 64位版本下,由基于xen的虚拟机搭建,其中集群管理节点*2.SQL节点*2.数据节点*4.Web服务节点*2组成,其中数据节点做成2个组,每 ...

  8. Python第一个GUI

    #!/usr/bin/python#coding=utf-8'''Created on 2017年11月2日 from home @author: James zhan ''' from functo ...

  9. PXE 实现自动装机

    搭建 PXE 远程安装服务器 image_1cqg00g0os9b1pop122e98o19ef9b.png-255kB 1.把光盘源放在/var/ftp/centos6 因为远程装机对放服务器得读取 ...

  10. Forth 词典和词汇

    body, table{font-family: 微软雅黑; font-size: 13.5pt} table{border-collapse: collapse; border: solid gra ...