Python实现目录文件的全量和增量备份

目标：

　　1.传入3个参数:源文件路径，目标文件路径，md5文件

　　2.每周一实现全量备份，其余时间增量备份

1.通过传入的路径，获取该路径下面的所有目录和文件(递归)

方法一：使用os.listdir

代码如下：

#!/usr/bin/env python

#coding:utf8

import os,sys

def lsdir(folder):

    contents = os.listdir(folder)

    print "%s\n%s\n" % (folder, contents)

    for path in contents:

        full_path = os.path.join(folder, path)

        if os.path.isdir(full_path):

            lsdir(full_path)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，效果如下：

[root@localhost python]# python listdir.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

方法二：使用os.walk

代码如下：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import os,sys

def lsdir(folder):

   contents = os.walk(folder)

   for path, folder, file in contents:

       print "%s\n%s\n" %(path, folder + file)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python listdir1.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

2.如何计算文件的md5值(每次读取4K，直到读取完文件所有内容，返回一个16进制的md5值)

代码如下：

[root@localhost python]# cat md5.py

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import hashlib

import sys

def md5(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

if __name__ == "__main__":

    print md5(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python md5.py a.txt

c33da92372e700f98b006dfa5325cf0d

[root@localhost python]# md5sum a.txt

c33da92372e700f98b006dfa5325cf0d  a.txt

*提示：使用linux自带的md5sum和自己编写的Python计算的md5值相通

3.编写全量和增量备份脚本

代码如下：

#!/usr/bin/env python

#coding:utf8

import time

import os

import tarfile

import cPickle as p

import hashlib

def md5check(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

def full_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_full_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5dict = {}

    tar = tarfile.open(full_name, 'w:gz')

    tar.add(src_dir)

    tar.close()

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5dict[full_path] = md5check(full_path)

    with open(md5file, 'w') as fobj:

        p.dump(md5dict, fobj)

def incr_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_incr_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5new = {}

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5new[full_path] = md5check(full_path)

    with open(md5file) as fobj:

        md5old = p.load(fobj)

    with open(md5file, 'w') as fobj:

        p.dump(md5new, fobj)

    tar = tarfile.open(full_name, 'w:gz')

    for key in md5new:

        if md5old.get(key) != md5new[key]:

            tar.add(key)

    tar.close()

if __name__ == '__main__':

    src_dir = '/Users/xkops/gxb/'

    dst_dir = '/tmp/'

    md5file = '/Users/xkops/md5.data'

    if time.strftime('%a') == 'Mon':

        full_backup(src_dir, dst_dir, md5file)

    else:

        incr_backup(src_dir, dst_dir, md5file)

•运行代码，测试效果(执行前，修改需要备份的文件和路径)，运行之后检查/tmp下是否生成了当天的备份文件。

Python实现目录文件的全量和增量备份的更多相关文章

python实现对文件的全量、增量备份
#!/user/bin/env python # @Time :2018/6/6 10:10 # @Author :PGIDYSQ #@File :FileBackup2.py import os i ...
MySQL5.7.18 备份、Mysqldump，mysqlpump，xtrabackup，innobackupex 全量，增量备份，数据导入导出
粗略介绍冷备,热备,温暖,及Mysqldump,mysqlpump,xtrabackup,innobackupex 全量,增量备份 --备份的目的灾难恢复:意外情况下(如服务器宕机.磁盘损坏等)对损 ...
mysql全量和增量备份详解（带脚本）
在日常运维工作中,对mysql数据库的备份是万分重要的,以防在数据库表丢失或损坏情况出现,可以及时恢复数据. 下面对这种备份方案详细说明下:1.MySQLdump增量备份配置执行增量备份的前提条件是M ...
oracle全量、增量备份
采用0221222增量备份策略,7天一个轮回也就是周日0级备份,周1 2 4 5 6 采用2级增量备份,周3采用1级增量备份打开控制文件自动备份 CONFIGURE CONTROLFILE AUT ...
innobackupex在线备份及恢复（全量和增量）
Xtrabackup是由percona开发的一个开源软件,它是innodb热备工具ibbackup(收费的商业软件)的一个开源替代品.Xtrabackup由个部分组成:xtrabackup和innob ...
关于Subversion主从备份方式的调整（全量、增量脚本）更新
本文引用于http://blog.chinaunix.net/uid-25266990-id-3369172.html 之前对Subversion服务器作了迁移,关于SVN的架构也走了调整,有单一的服 ...
Mysql备份工具xtraback全量和增量测试
Mysql备份工具xtraback全量和增量测试 xtrabackup 是 percona 的一个开源项目,可以热备份innodb ,XtraDB,和MyISAM(会锁表) 官方网址http:// ...
MySQL数据以全量和增量方式，同步到ES搜索引擎
本文源码:GitHub·点这里 || GitEE·点这里一.配置详解场景描述:MySQL数据表以全量和增量的方式向ElasticSearch搜索引擎同步. 1.下载内容 elasticsearch ...
全量、增量数据在HBase迁移的多种技巧实践
作者经历了多次基于HBase实现全量与增量数据的迁移测试,总结了在使用HBase进行数据迁移的多种实践,本文针对全量与增量数据迁移的场景不同,提供了1+2的技巧分享. HBase全量与增量数据迁移的方 ...

随机推荐

spss v21.0 使用笔记
spss v21.0 使用笔记有问题,戳官方帮助文档神经网络分析-神经网络-多层感知机变量. 分析-神经网络-多层感知机-变量预测变量可指定为因子(分类)或协变量(刻度). 在因变量框输入预 ...
myeclipse部署maven项目到tomcat，src/main/resources里面配置文件部署不到webapp下classes
解决myeclipse部署maven时,src/main/resources里面配置文件加载不到webapp下classes路径下的问题. 有时候是src/main/resources下面的,有时候是 ...
[Web]网址净化方法
本文来自:https://meta.appinn.com/t/topic/3130 原理很简单,所以不说了. 用法很简单,先把下面的代码保存为书签(复制到地址里面),在需要的页面里点击一下这个书签就好 ...
5月9日上课笔记-网页定位、网页动画【HTML5】
一.网页定位 position: static (默认值) relative 相对定位(相对原来的位置) right left botton top absolute 绝对定位 fixed: 固定定位 ...
Java的Socket通信----通过 Socket 实现 TCP 编程之多线程demo(2)
JAVA Socket简介所谓socket 通常也称作”套接字“,用于描述IP地址和端口,是一个通信链的句柄.应用程序通常通过”套接字”向网络发出请求或者应答网络请求. import java.io ...
sqlldr并发
sage: SQLLDR keyword=value [,keyword=value,...] 部分关键字: userid -- ORACLE username/password c ...
Oracle函数日期转换成秒（时间戳）
SELECT TO_NUMBER(TO_DATE('2015-01-01 05:00:00', 'YYYY-MM-DD HH24:MI:SS') - TO_DATE( * * FROM DUAL; 秒 ...
24_java之转换流和缓冲流
01转换流概述 * A: 转换流概述 * a: 转换流概述 * OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的字符编码表,将要写入流中的字符编码成字节 * 将字符串按照指 ...
Linux6系统安装
Centos内核参数
内核参数 abi.vsyscall32 = 1 在2.6.25版本以后的x86-64内核中,默认启用了VDSO32. 虚拟动态共享对象 http://man7.org/linux/man-pages ...

Python实现目录文件的全量和增量备份

Python实现目录文件的全量和增量备份的更多相关文章

随机推荐

热门专题