新技能 get —— Python 断点续传下载文件

from urllib.request import urlretrieve

import sys

import os

prev_reported_download_percent = None

# 首先定义下载 hook，作为 urllib.request.urlretrive 的关键字参数

def download_hook(count, block_size, total_size):

    """ 接口是写死的 """

    global prev_reported_download_percent

    percent = int(count*block_size*100/total_size)

    if prev_reported_download_percent != percent:

        if percent % 5 == 0:

            sys.stdout.write('%s%%' % percent)

            sys.stdout.flush()

        else:

            sys.stdout.write('.')

            sys.stdout.flush()

        prev_reported_download_percent = percent

def maybe_download(filename, force=False):

    """ force 表示是否强制下载 """

    if force or not os.path.exists(filename):

        print('Attempting to download')

        filename, _ = urlretrieve(url+filename, filename, reporthook=download_hook)

            # url+filename：表示文件的 url 地址，

            # filename 则为保存到本地时的文件名

        print('\nDownload completed!')

    # statinfo = os.stat(filename)

    return filename

比如对于 http://ufldl.stanford.edu/housenumbers/ 网站下的 train.tar.gz/test.tar.gz两文件，客户端的调用方式为：

url = 'http://ufldl.stanford.edu/housenumbers/'

train_filename = maybe_download('train.tar.gz')

test_filename = maybe_download('test.tar.gz')

新技能 get —— Python 断点续传下载文件的更多相关文章

python爬虫下载文件
python爬虫下载文件下载东西和访问网页差不多,这里以下载我以前做的一个安卓小游戏为例地址为:http://hjwachhy.site/game/only_v1.1.1.apk 首先下载到内存 ...
反射机制及开源框架xUitls的使用,使用HttpUtils通过断点续传下载文件
反射: Java反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法: 对于任意一个对象,都能够调用它的任意一个方法和属性 Java反射机制主要提供下面几种用途: 1•在运行时判断 ...
Selenium+Python：下载文件(Firefox 和 Chrome)
引自 https://blog.csdn.net/Momorrine/article/details/79794146 1. 环境操作系统 Win10 IDE Eclipse (Oxyg ...
Python如何下载文件
转载自:http://www.codecho.com/how-to-download-a-file-in-python/ 利用程序自己编写下载文件挺有意思的.Python中最流行的方法就是通过Http ...
python+selenium下载文件——firefox
修改Firefox的相关配置. 1.profile.set_preference('browser.download.folderList',2) 设置成0代表桌面,1代表下载到浏览器默认下载路径:2 ...
使用curl断点续传下载文件
办公网络网速不是很好,使用Chrome下载一些软件时不时会中断,恶心的是Chrome居然不支持断点续传下载(为什么chrome的下载不支持断点续传呢?),迅雷自然是不能装的,那怎么办?还好我有大名鼎鼎 ...
python多线程下载文件
从文件中读取图片url和名称,将url中的文件下载下来.文件中每一行包含一个url和文件名,用制表符隔开. 1.使用requests请求url并下载文件 def download(img_url, i ...
python实现断点续传下载文件
最近的任务里有一个功能是要我从日志服务器实时跟新日志到本地,日志在不断新增内容就需要我隔一段时间从上次下载的位置继续下载,并写入本地文件上次写完的位置后面. headers = {'Range': ' ...
android多线程断点续传下载文件
一.目标 1.多线程抢占服务器资源下载. 2.断点续传. 二.实现思路. 假设分为三个线程: 1.各个线程分别向服务器请求文件的不同部分. 这个涉及Http协议,可以在Header中使用Range参数 ...

随机推荐

mmx-编译脚本
脚本目录位置 /home/zhangshuli/git2/vanzo_team/xulei/Mmx.py 在-/bin目录下,链接Mmx.py ln -sf ~/git2/vanzo_team/xul ...
ubuntu-安装中文拼音输入法
一下内容转载自http://blog.chinaunix.net/uid-24410388-id-3501873.html 自己验证了可用.转载了,已留做日后使用步骤: step1:安装ibus所需 ...
Flume Channel Selectors官网剖析(博主推荐）
不多说,直接上干货! Flume Sources官网剖析(博主推荐) Flume Channels官网剖析(博主推荐) 一切来源于flume官网 http://flume.apache.org/Flu ...
Android 通过SOCKET下载文件的方法
本文实例讲述了Android通过SOCKET下载文件的方法.分享给大家供大家参考,具体如下: 服务端代码 import java.io.BufferedInputStream; import java ...
Eclipse如何从导入SVN上导入项目
1.右键单击,选择 Import,进入导入项目窗口 2.点击选择从SVN检出项目,点击Next下一步 3.选择创建新的资源库位置,点击Next,如果项目之前已经导入过删除掉了,重新导入的时候,只需勾选 ...
Day2：模块初识
一.模块(库) 别人写好的一堆功能,封装起来,你直接导入就可以用,就不用自己再写一次,使用import方法二.分类:标准库与第三方库标准库:免安装,导入即可使用,最常用的一些功能第三方库:需要下 ...
Eclipse中开发环境也想把Tomcat 的默认BIO模式改为NIO模式
1.1 问题有时候,开发环境我们也想把Tomcat 的默认BIO模式改为NIO模式,该如何改呢? 1.2 方案通过eclipse里面的server.xml进行修改. 1.3 步骤首先我们来一起看 ...
Spring拦截器和Servlet过滤器区别
http://blog.csdn.net/chenleixing/article/details/44573495
dataTable() 与 DataTable() 的差别与处理方式
jQuery dataTable的初始化有两种方式: var dataTable = $('#example').dataTable(); 与 var DataTable = $('#example' ...
【高德地图API】从零開始学高德JS API（五）路线规划——驾车|公交|步行
先来看两个问题:路线规划与导航有什么差别?步行导航与驾车导航有什么差别? 回答: 1.路线规划,指的是为用户提供3条路线推荐.[高德]在提供路线规划的时候,会提供用户自己定义路线规划功能,这是别家没有 ...

新技能 get —— Python 断点续传下载文件

新技能 get —— Python 断点续传下载文件的更多相关文章

随机推荐

热门专题