基于七牛Python SDK写的一个同步脚本

需求背景

最近刚搭了个markdown静态博客，想把博客的图片放到云存储中。

经过调研觉得七牛可以满足我个人的需求，就选它了。

博客要引用图片就要先将图片上传到云上。

虽然七牛网站后台可以上传文件，但每次上传都需要先登录，然后选择图片，设置连接地址，才能上传。

这个过程有些繁琐，所以我便想用七牛云提供的SDK写个一同步工具，方便增量同步文件。

有了这个想法，就马上行动。花了大概一个上午的时间，总算把这个工具给写出来，

并放到GitOSC和github上。

实现

(博客园的markdown代码区显示不友好，可以到我的个人博客中浏览)

#!/usr/bin/env python

#-*- coding:utf-8 -*-

#

# AUTHOR = "heqingpan"

# AUTHOR_EMAIL = "heqingpan@126.com"

# URL = "http://git.oschina.net/hqp/qiniu_sync"

import qiniu

from qiniu import Auth

from qiniu import BucketManager

import os

import re

access_key = ''

secret_key = ''

bucket_name = ''

bucket_domain = ''

q = Auth(access_key, secret_key)

bucket = BucketManager(q)

basedir=os.path.realpath(os.path.dirname(__file__))

filename=__file__

ignore_paths=[filename,"{0}c".format(filename)]

ignore_names=[".DS_Store",".git",".gitignore"]

charset="utf8"

diff_time=2*60

def list_all(bucket_name, bucket=None, prefix="", limit=100):

    rlist=[]

    if bucket is None:

        bucket = BucketManager(q)

    marker = None

    eof = False

    while eof is False:

        ret, eof, info = bucket.list(bucket_name, prefix=prefix, marker=marker, limit=limit)

        marker = ret.get('marker', None)

        for item in ret['items']:

            rlist.append(item["key"])

    if eof is not True:

        # 错误处理

        #print "error"

        pass

    return rlist

def get_files(basedir="",fix="",rlist=None,ignore_paths=[],ignore_names=[]):

    if rlist is None:

        rlist=[]

    for subfile in os.listdir(basedir):

        temp_path=os.path.join(basedir,subfile)

        tp=os.path.join(fix,subfile)

        if tp in ignore_names:

            continue

        if tp in ignore_paths:

            continue

        if os.path.isfile(temp_path):

            rlist.append(tp)

        elif os.path.isdir(temp_path):

            get_files(temp_path,tp,rlist,ignore_paths,ignore_names)

    return rlist

def get_valid_key_files(subdir=""):

    basedir=subdir or basedir

    files = get_files(basedir=basedir,ignore_paths=ignore_paths,ignore_names=ignore_names)

    return map(lambda f:(f.replace("\\","/"),f),files)

def sync():

    qn_keys=list_all(bucket_name,bucket)

    qn_set=set(qn_keys)

    l_key_files=get_valid_key_files(basedir)

    k2f={}

    update_keys=[]

    u_count=500

    u_index=0

    for k,f in l_key_files:

        k2f[k]=f

        str_k=k

        if isinstance(k,str):

            k=k.decode(charset)

        if k in qn_set:

            update_keys.append(str_k)

            u_index+=1

            if u_index > u_count:

                u_index-=u_count

                update_file(k2f,update_keys)

                update_keys=[]

        else:

            # upload

            upload_file(k,os.path.join(basedir,f))

    if update_keys:

        update_file(k2f,update_keys)

    print "sync end"

def update_file(k2f,ulist):

    ops=qiniu.build_batch_stat(bucket_name,ulist)

    rets,infos = bucket.batch(ops)

    for i in xrange(len(ulist)):

        k=ulist[i]

        f=k2f.get(k)

        ret=rets[i]["data"]

        size=ret.get("fsize",None)

        put_time = int(ret.get("putTime")/10000000)

        local_size=os.path.getsize(f)

        local_time=int(os.path.getatime(f))

        if local_size==size:

            continue

        if put_time >= local_time - diff_time:

            # is new

            continue

        # update

        upload_file(k,os.path.join(basedir,f))

def upload_file(key,localfile):

    print "upload_file:"

    print key

    token = q.upload_token(bucket_name, key)

    mime_type = get_mime_type(localfile)

    params = {'x:a': 'a'}

    progress_handler = lambda progress, total: progress

    ret, info = qiniu.put_file(token, key, localfile, params, mime_type, progress_handler=progress_handler)

def get_mime_type(path):

    mime_type = "text/plain"

    return mime_type

def main():

    sync()

if __name__=="__main__":

    main()

这个同步脚本支持批量比较文件，差异增量更新、批量更新。

使用方式

安装七牛Python SDK

pip install qiniu
填写脚本文件(qiniusync.py)的配置信息

access_key = ''

secret_key = ''

bucket_name = ''

注册后可以拿到对应的信息

将脚本文件(qiniusync.py)拷贝到待同步根目录
运行脚本

python qiniusync.py

后记

写完提交之后才发现，七牛已经提供相应的工具，我这个算是重复造轮子吧。

既然已经写，就发出来，当做熟悉一下七牛的SDK也不错，说不定以后还能用的上。

博客园的markdown代码区显示不友好，可以到我的个人博客中浏览

基于七牛Python SDK写的一个同步脚本的更多相关文章

基于七牛Python SDK写的一个批量下载脚本
前言上一篇基于七牛Python SDK写的一个同步脚本所写的脚本只支持上传,不支持文件下载. 虽然这个需求不太强烈,但有可能有人(在备份.迁移时)需要,而官方有没提供对应的工具,所以我就把这个功能也 ...
Async Cow Python 七牛异步SDK
# Async Cow Python 七牛异步SDK > gitee链接 >github链接本SDK基于官方SDK改造而成,但又对其进行了进一步封装,简化了相关操作例如:- 1.不需要使用 ...
用Python 3写的一个Spider小爬虫(使用内置urllib模块and正则表达式)
用Python写了一个Spider小爬虫,爬一爬斗鱼“王者荣耀”在线直播的主播及人气
七牛 python
Python SDK使用指南上传策略变量对象存储 API 参考手册多媒体数据处理 API 参考手册
[原创]基于html5新标签canvas写的一个小画板
最近刚学了canvas,写个小应用练习下源代码 <!DOCTYPE> <html> <head> <meta http-equiv="Conten ...
python+imageMagick写的一个压缩图片脚本
!/usr/bin/python import os import cPickle as p import re import Image def imageCompre(imagedir = '.' ...
七牛php sdk 生成上传凭证时出现 undefined function Qiniu_SetKeys()
将qiniu/http.php文件改名即可,原因是xampp等集成环境会安装pear存在了http.php
[Python][自己写的杀病毒脚本]
电脑里的HTML都插入了一段VB病毒代码..只能自己手动清除了..发现Python确实好用 import os import re; Root = ["H:"]; for root ...
今天看了shell大神的写的一个统计脚本
通过nginx日志统计接口耗时排行 grep '/bigbox?' access_log | awk '{print $7"&process="$NF}'| sed -r ...

随机推荐

yum安装php5.5，php5.6和php7.0
本文主要介绍在CentOS系统下的php多个版本的安装使用 1.清理系统上的旧版本php 1)查询已安装的php软件 rpm -qa|grep php* yum list installed | gr ...
小程序开发之改变data中数组或对象的某一属性值
前言:在小程序的开发中,我们在view中便利data中数组或对象时,很多情况下需要在js中动态改变数组或者对象中某一香的属性值. 效果图: 我给大家总结了案例如下: wxml如下: <scr ...
Python源码分析（一）
最近想学习下Python的源码,希望写个系列博客,记录的同时督促自己学习. Python源码目录从Python.org中下载源代码压缩包并解压,我下载的是Python2.7.12,解压后: 对于主要 ...
Linux之Ubuntu
1.1 使用创建用户登陆 Ubuntu 默认root用户无法登陆,只能使用在安装系统的时候新创建的用户登录我这里新建的用户是ubuntu密码111111 1.2 安装ssh server 由于新建的 ...
实现同时提交多个form(基础方法) 收集（转）
方法一: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4 ...
for循环使用append问题
append添加到元素的时候,已存在的元素是移动而不是复制,使用了遍历,所以第一次是新增,后面都是移动前面新增的,最后当然就出现了只有最后一项有东西.解决办法:1.不要遍历,使用jQuery的类选择器 ...
开发Java web应用程序的介绍
本文将介绍使用Eclipse来开发web应用程序的基础知识.它演示了如何创建一个简单的web应用程序,将其部署到服务器,查看其呈现在浏览器中.应用程序使用JavaServer Pages™(JSP)页 ...
LOJ2611. NOIP2013 积木大赛【线段树】
LOJ2611. NOIP2013 积木大赛 LINK 题目大意是给你一个目标状态数组每次你可以选择一个连续区间加上一个值,求最小操作次数我是神奇的脑子最近做数据结构疯了然后看见这题就数据结构 ...
ballerina 学习四如何进行项目结构规划
备注: * ballerina 程序员可以将代码放到一个文件或者一个项目目录 * 一个ballerina program是一个已经编译以及链接的二进制文件 * package是一个包含ba ...
Hangfire 任务调度
Hangfire是一个开源且商业免费使用的工具函数库.可以让你非常容易地在ASP.NET应用(也可以不在ASP.NET应用)中执行多种类型的后台任务,而无需自行定制开发和管理基于Windows Ser ...

基于七牛Python SDK写的一个同步脚本

需求背景

实现

使用方式

后记

基于七牛Python SDK写的一个同步脚本的更多相关文章

随机推荐

热门专题