Python实现目录文件的全量和增量备份

目标：

　　1.传入3个参数:源文件路径，目标文件路径，md5文件

　　2.每周一实现全量备份，其余时间增量备份

1.通过传入的路径，获取该路径下面的所有目录和文件(递归)

方法一：使用os.listdir

代码如下：

#!/usr/bin/env python

#coding:utf8

import os,sys

def lsdir(folder):

    contents = os.listdir(folder)

    print "%s\n%s\n" % (folder, contents)

    for path in contents:

        full_path = os.path.join(folder, path)

        if os.path.isdir(full_path):

            lsdir(full_path)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，效果如下：

[root@localhost python]# python listdir.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

方法二：使用os.walk

代码如下：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import os,sys

def lsdir(folder):

   contents = os.walk(folder)

   for path, folder, file in contents:

       print "%s\n%s\n" %(path, folder + file)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python listdir1.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

2.如何计算文件的md5值(每次读取4K，直到读取完文件所有内容，返回一个16进制的md5值)

代码如下：

[root@localhost python]# cat md5.py

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import hashlib

import sys

def md5(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

if __name__ == "__main__":

    print md5(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python md5.py a.txt

c33da92372e700f98b006dfa5325cf0d

[root@localhost python]# md5sum a.txt

c33da92372e700f98b006dfa5325cf0d  a.txt

*提示：使用linux自带的md5sum和自己编写的Python计算的md5值相通

3.编写全量和增量备份脚本

代码如下：

#!/usr/bin/env python

#coding:utf8

import time

import os

import tarfile

import cPickle as p

import hashlib

def md5check(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

def full_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_full_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5dict = {}

    tar = tarfile.open(full_name, 'w:gz')

    tar.add(src_dir)

    tar.close()

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5dict[full_path] = md5check(full_path)

    with open(md5file, 'w') as fobj:

        p.dump(md5dict, fobj)

def incr_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_incr_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5new = {}

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5new[full_path] = md5check(full_path)

    with open(md5file) as fobj:

        md5old = p.load(fobj)

    with open(md5file, 'w') as fobj:

        p.dump(md5new, fobj)

    tar = tarfile.open(full_name, 'w:gz')

    for key in md5new:

        if md5old.get(key) != md5new[key]:

            tar.add(key)

    tar.close()

if __name__ == '__main__':

    src_dir = '/Users/xkops/gxb/'

    dst_dir = '/tmp/'

    md5file = '/Users/xkops/md5.data'

    if time.strftime('%a') == 'Mon':

        full_backup(src_dir, dst_dir, md5file)

    else:

        incr_backup(src_dir, dst_dir, md5file)

•运行代码，测试效果(执行前，修改需要备份的文件和路径)，运行之后检查/tmp下是否生成了当天的备份文件。

Python实现目录文件的全量和增量备份的更多相关文章

python实现对文件的全量、增量备份
#!/user/bin/env python # @Time :2018/6/6 10:10 # @Author :PGIDYSQ #@File :FileBackup2.py import os i ...
MySQL5.7.18 备份、Mysqldump，mysqlpump，xtrabackup，innobackupex 全量，增量备份，数据导入导出
粗略介绍冷备,热备,温暖,及Mysqldump,mysqlpump,xtrabackup,innobackupex 全量,增量备份 --备份的目的灾难恢复:意外情况下(如服务器宕机.磁盘损坏等)对损 ...
mysql全量和增量备份详解（带脚本）
在日常运维工作中,对mysql数据库的备份是万分重要的,以防在数据库表丢失或损坏情况出现,可以及时恢复数据. 下面对这种备份方案详细说明下:1.MySQLdump增量备份配置执行增量备份的前提条件是M ...
oracle全量、增量备份
采用0221222增量备份策略,7天一个轮回也就是周日0级备份,周1 2 4 5 6 采用2级增量备份,周3采用1级增量备份打开控制文件自动备份 CONFIGURE CONTROLFILE AUT ...
innobackupex在线备份及恢复（全量和增量）
Xtrabackup是由percona开发的一个开源软件,它是innodb热备工具ibbackup(收费的商业软件)的一个开源替代品.Xtrabackup由个部分组成:xtrabackup和innob ...
关于Subversion主从备份方式的调整（全量、增量脚本）更新
本文引用于http://blog.chinaunix.net/uid-25266990-id-3369172.html 之前对Subversion服务器作了迁移,关于SVN的架构也走了调整,有单一的服 ...
Mysql备份工具xtraback全量和增量测试
Mysql备份工具xtraback全量和增量测试 xtrabackup 是 percona 的一个开源项目,可以热备份innodb ,XtraDB,和MyISAM(会锁表) 官方网址http:// ...
MySQL数据以全量和增量方式，同步到ES搜索引擎
本文源码:GitHub·点这里 || GitEE·点这里一.配置详解场景描述:MySQL数据表以全量和增量的方式向ElasticSearch搜索引擎同步. 1.下载内容 elasticsearch ...
全量、增量数据在HBase迁移的多种技巧实践
作者经历了多次基于HBase实现全量与增量数据的迁移测试,总结了在使用HBase进行数据迁移的多种实践,本文针对全量与增量数据迁移的场景不同,提供了1+2的技巧分享. HBase全量与增量数据迁移的方 ...

随机推荐

[深度学习]Python/Theano实现逻辑回归网络的代码分析
2014-07-21 10:28:34 首先PO上主要Python代码(2.7), 这个代码在Deep Learning上可以找到. # allocate symbolic variables for ...
搭建基于hyperledger fabric的联盟社区（四） --chaincode开发
前几章已经分别把三台虚拟机环境和配置文件准备好了,在启动fabric网络之前我们要准备好写好的chaincode.chaincode的开发一般是使用GO或者JAVA,而我选择的是GO语言.先分析一下官 ...
javascript正则表达式定义（语法）
正则表达式的2种定义方法:一种是直接调用RegExp(),第二种是直接用字面量来定义,即var re = /正则规则/; 2种定义方法本质都是调用RegExp()方法在调用同一段正则代码的时候,EC ...
STM32之中断
在STM32(Cortex-M3)中没有显示的代码拷贝,只有启动代码进行了向量的初始化,一直以为是编译器在程序影像中自己完成了相关向量的拷贝,即,拷贝到固定的NVIC区,事实上并不是这样,cortex ...
java中FIle的用法
package com.a.b; import java.io.*; public class Cmo { public static void main(String[] args) throws ...
SpingData 的学习
Spring Data : Spring 的一个子项目,类似于Sping MVC 一样是Spring的另一个模块,所以还需要下载其jar ,它需要的jar有: spring-data-jpa-1.11 ...
Java四舍五入保留小数
java 四舍五入保留小数 // 方式一: double f = 3.1516; BigDecimal b = new BigDecimal(f); double f1 = b.setScale( ...
仅用CSS3创建h5预加载交错圈
<head> <meta charset="UTF-8"> <title></title> <style type=" ...
IDA Pro 权威指南学习笔记(十三) - 基本代码转换
IDA提供的代码转换包括: 1.将数据转换为代码 2.将代码转换为数据 3.指定一个指令序列为函数 4.更改现有函数的起始或结束地址 5.更改指令操作数的显示格式代码显示选项通过 Options ...
Mysql Docker Container Command
Hello, in my docker-compose file I have the following: db: image: mysql command: mysqld --character- ...

Python实现目录文件的全量和增量备份

Python实现目录文件的全量和增量备份的更多相关文章

随机推荐

热门专题