ilecmp可以实现文件,目录,遍历子目录的差异对比功能。

  自带filecmp模块,无需安装。

常用方法说明

  filecmp提供3个操作方法,cmp(单文件对比),cmpfile(多文件对比),dircmp(目录对比).

  单文件对比,filecmp.cmp(f1,f2[,shallow])

  f1 f2为文件,相同True,不同False,shallow默认为True,只根据os.stat()方法返回的文件基本信息进行对比。比如最后访问时间,修改时间,状态改变时间等,会忽略文件内容的对比,当shallow为False时,则os.stat()与文件内容同时进行校验。

1 >>>filrcmp.cmp("/temp/a1","/temp/a2")
2 >>>True
3
4 >>>filrcmp.cmp("/temp/a1","/temp/a3")
5 >>>False

  多文件对比,采用filecmp.cmpfiles(dir1, dir2, common[, shallow])
  比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

  目录对比,通过 filecmp(a,b[,ignore[,hide]])类创建一个目录比较对象
  用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

dircmp#提供了三个方法用于报告比较的结果:
report():#只比较指定文件夹中的内容(文件与文件夹)
report_partial_closure():#比较文件夹及第一级子文件夹的内容
report_full_closure():#递归比较所有的文件夹的内容
#dircmp还提供了下面这些属性用于获取比较的详细结果
left_list:#左边文件夹中的文件与文件夹列表;
right_list:#右边文件夹中的文件与文件夹列表;
common:#两边文件夹中都存在的文件或文件夹;
left_only:#只在左边文件夹中存在的文件或文件夹;
right_only:#只在右边文件夹中存在的文件或文件夹;
common_dirs:#两边文件夹都存在的子文件夹;
common_files:#两边文件夹都存在的子文件;
common_funny:#两边文件夹都存在的子文件夹;
same_files:#匹配的文件;
diff_files:#不匹配的文件;
funny_files:#两边文件夹中都存在,但无法比较的文件;
subdirs:#将common_dirs 目录映射到新的dircmp对象,格式为字典的类型。
 1 #!/usr/bin/python3
2 #coding:utf-8
3 import os,sys
4 import filecmp
5 import re
6 import shutil
7 '''
8 校验源与备份目录的差异
9 '''
10
11 holderlist = []
12 def compareme(dir1,dir2): #递归获取更新项函数
13 dircomp = filecmp.dircmp(dir1,dir2)
14 only_in_one = dircomp.left_only #源目录新文件或目录
15 diff_in_one = dircomp.diff_files #不匹配文件,源目录文件已发生变化
16 dirpath = os.path.abspath(dir1) #定义源目录绝对路径
17
18 #将更新文件或目录追加到holderlist
19 [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in only_in_one ]
20 [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in diff_in_one ]
21 if len(dircomp.common_dirs) > 0: #判断是否存在相同子目录,以便递归
22 for item in dircomp.common_dirs: #递归子目录
23 compareme(os.path.abspath(os.path.join(dir1,item)),os.path.abspath(os.path.join(dir2,item)))
24 return holderlist
25
26 def main():
27 if len(sys.argv) > 2: #输入源目录与备份目录
28 dir1 = sys.argv[1]
29 dir2 = sys.argv[2]
30 else :
31 print('Usage:',sys.argv[0],'datadir backdir')
32 sys.exit()
33 source_files = compareme(dir1,dir2) #对比源目录与备份目录
34 dir1 = os.path.abspath(dir1) #取绝对路径后,后面不会自动加上'/'
35
36 if not dir2.endswith('/'):
37 dir2 = dir2+'/' #备份目录路径加'/'
38
39 dir2 = os.path.abspath(dir2)
40 destination_files = []
41 createdir_bool = False
42
43 for item in source_files: #遍历返回的差异文件或目录清单
44 destination_dir = re.sub(dir1,dir2,item) #将源目录差异路径清单对应替换成备份目录,即需要在dir2中创建的差异目录和文件
45 destination_files.append(destination_dir)
46 if os.path.isdir(item): #如果差异路径为目录且不存在,则在备份目录中创建
47 if not os.path.exists(destination_dir):
48 os.makedirs(destination_dir)
49 createdir_bool = True #再次调用copareme函数标记
50 if createdir_bool : #重新调用compareme函数,重新遍历新创建目录的内容
51 destination_files = []
52 source_files = []
53 source_files = compareme(dir1,dir2) #调用compareme函数
54 for item in source_files: #获取源目录差异路径清单,对应替换成备份目录
55 destination_dir = re.sub(dir1,dir2,item)
56 destination_files.append(destination_dir)
57
58 print('update item:')
59 print(source_files) #输出更新项列表清单
60 copy_pair = zip(source_files,destination_files) #将源目录与备份目录文件清单拆分成元组
61 for item in copy_pair:
62 if os.path.isfile(item[0]): #判断是否为文件,是则进行复制操作
63 shutil.copyfile(item[0],item[1])
64
65 if __name__ == '__main__' :
66 main()

python---filecmp 实现文件,目录,遍历子目录的差异对比功能。的更多相关文章

  1. 【Python开发】python重命名文件和遍历文件夹操作

    当前文件夹下,把所有文件名中的"50076"替换成"50092",用Python实现,代码所下: # encoding: utf-8 import os imp ...

  2. python 路径和文件的遍历

    python发现文件夹下所有的jpg文件,并且安装文件排放的顺序输出 glob模块是最简单的模块之一,内容非常少.用它可以查找符合特定规则的文件路径名.跟使用windows下的文件搜索差不多.查找文件 ...

  3. Python自动化运维——文件与目录差异对比

    Infi-chu: http://www.cnblogs.com/Infi-chu/ 模块:filecmp 安装:Python版本大于等于2.3默认自带 功能:实现文件.目录.遍历子目录的差异 常用方 ...

  4. Kali学习笔记31:目录遍历漏洞、文件包含漏洞

    文章的格式也许不是很好看,也没有什么合理的顺序 完全是想到什么写一些什么,但各个方面都涵盖到了 能耐下心看的朋友欢迎一起学习,大牛和杠精们请绕道 目录遍历漏洞: 应用程序如果有操作文件的功能,限制不严 ...

  5. Python os模块实例之遍历目录及子目录指定扩展名的文件

    需求:在该目录下有很多子目录(如下图,截图了部分),现要从该目录和所有子目录下找到所有扩展名为.meta的文件,并获取文件中第二行guid的值(': '后面的),然后将所有guid的值输出到另一文件中 ...

  6. python查找目录及子目录下特定文件

    写这篇博客的缘由: 面试归来翻脉脉发现一个陌生的朋友提出一个面试题,设计实现遍历目录及子目录,抓取.pyc文件. 并贴出两种实现方法: 个人感觉,这两种方法中规中矩,不像是python的风格.pyth ...

  7. java遍历给定目录,树形结构输出所有文件,包括子目录中的文件

    (转自:http://blog.csdn.net/gangwazi0525/article/details/7569701) import java.io.File; public class Rea ...

  8. python之模块filecmp(文件/目录比较)

    # -*- coding: utf-8 -*- #python 27 #xiaodeng #python之模块filecmp(文件/目录比较) #用于比较文件及文件夹的内容.他是轻量级的工具.可以做一 ...

  9. python递归列出目录及其子目录下所有文件

    python递归列出目录及其子目录下所有文件 一.前言 函数的递归,简单来说,就是函数内部调用自己 先举个小例子,求阶乘 def factorial(n): if n == 0: return 1 e ...

随机推荐

  1. Digix2019华为算法精英挑战赛代码

    Digix2019华为算法精英挑战赛代码 最终成绩: 决赛第九 问题 根据手机型号,颜色,用户偏好,手机APP等信息预测用户年龄. https://developer.huawei.com/consu ...

  2. 《UNIX环境高级编程》(APUE) 笔记第五章 - 标准I/O库

    5 - 标准I/O库 Github 地址 1. 标准 I/O 库作用 缓冲区分配 以优化的块长度执行 I/O 等 使用户不必担心如何选择使用正确的块长度 标准 I/O 最终都要调用第三章中的 I/O ...

  3. 利用 Nginx 实现限流

    在当下互联网高并发时代中,项目往往会遇到需要限制客户端连接的需求.我们熟知的 Nginx 就提供了有这样的功能,可以简单的实现对客户端请求频率,并发连接和传输速度的限制…. Nginx 限流 Ngin ...

  4. Netty 源码解析(七): NioEventLoop 工作流程

    原创申明:本文由公众号[猿灯塔]原创,转载请说明出处标注 今天是猿灯塔“365篇原创计划”第七篇. 接下来的时间灯塔君持续更新Netty系列一共九篇 Netty 源码解析(一): 开始 Netty 源 ...

  5. Guava RateLimiter限流器使用示例

    Guava中的RateLimiter可以限制单进程中某个方法的速率,本文主要介绍如何使用,实现原理请参考文档:推荐:超详细的Guava RateLimiter限流原理解析和推荐:RateLimiter ...

  6. pycharm连接远程服务器(拉取版本)

    pycharm连接远程服务器(拉取版本) 有这篇教程是因为,博主有两个办公地点,想着在办公地点A上传代码到服务器并调试,并在B时候可以拉取这份代码,并进行调试.因此有这篇拉取版本的博客,之前还有上传版 ...

  7. Creator填色游戏的一种实现方案

    前言 先上一个辛苦弄出来的gif效果.写公众号时间不长,很多技巧还在慢慢跟小伙伴学习.可关注公众号,回复"绘图"或者"填色"都可获得demo的git地址.请使用 ...

  8. 【Nginx】实现负载均衡、限流、缓存、黑白名单和灰度发布,这是最全的一篇了!

    写在前面 在<[高并发]面试官问我如何使用Nginx实现限流,我如此回答轻松拿到了Offer!>一文中,我们主要介绍了如何使用Nginx进行限流,以避免系统被大流量压垮.除此之外,Ngin ...

  9. python 装饰器(六):装饰器实例(三)内置装饰器

    内置的装饰器和普通的装饰器原理是一样的,只不过返回的不是函数,而是类对象,所以更难理解一些. @property 在了解这个装饰器前,你需要知道在不使用装饰器怎么写一个属性. def getx(sel ...

  10. 重学c#系列——c#运行原理(二)

    前言 c# 是怎么运行的呢?是否和java一样运行在像jvm的虚拟机上呢?其实差不多,但是更广泛. c# 运行环境不仅c#可以运行,符合.net framework 开发规范的都可以运行. c# 程序 ...