Python之FTP多线程下载文件之多线程分块下载文件
Python之FTP多线程下载文件之多线程分块下载文件
Python中的ftplib模块用于对FTP的相关操作,常见的如下载,上传等。使用python从FTP下载较大的文件时,往往比较耗时,如何提高从FTP下载文件的速度呢?多线程粉墨登场,本文给大家分享我的多线程下载代码,需要用到的python主要模块包括:ftplib和threading。
首先讨论我们的下载思路,示意如下:

1. 将文件分块,比如我们打算采用20个线程去下载同一个文件,则需要将文件以二进制方式打开,平均分成20块,然后分别启用一个线程去下载一个块:

1 def setupThreads(self, filePath, localFilePath, threadNumber = 20):
2 """
3 set up the threads which will be used to download images
4 list of threads will be returned if success, else
5 None will be returned
6 """
7 try:
8 temp = self.ftp.sendcmd('SIZE ' + filePath)
9 remoteFileSize = int(string.split(temp)[1])
10 blockSize = remoteFileSize / threadNumber
11 rest = None
12 threads = []
13 for i in range(0, threadNumber - 1):
14 beginPoint = blockSize * i
15 subThread = threading.Thread(target = self.downloadFileMultiThreads, args = (i, filePath, localFilePath, beginPoint, blockSize, rest,))
16 threads.append(subThread)
17
18 assigned = blockSize * threadNumber
19 unassigned = remoteFileSize - assigned
20 lastBlockSize = blockSize + unassigned
21 beginPoint = blockSize * (threadNumber - 1)
22 subThread = threading.Thread(target = self.downloadFileMultiThreads, args = (threadNumber - 1, filePath, localFilePath, beginPoint, lastBlockSize, rest,))
23 threads.append(subThread)
24 return threads
25 except Exception, diag:
26 self.recordLog(str(diag), 'error')
27 return None

其中的downloadFileMultiThreads函数如下:

1 def downloadFileMultiThreads(self, threadIndex, remoteFilePath, localFilePath, \
2 beginPoint, blockSize, rest = None):
3 """
4 A sub thread used to download file
5 """
6 try:
7 threadName = threading.currentThread().getName()
8 # temp local file
9 fp = open(localFilePath + '.part.' + str(threadIndex), 'wb')
10 callback = fp.write
11
12 # another connection to ftp server, change to path, and set binary mode
13 myFtp = FTP(self.host, self.user, self.passwd)
14 myFtp.cwd(os.path.dirname(remoteFilePath))
15 myFtp.voidcmd('TYPE I')
16
17 finishedSize = 0
18 # where to begin downloading
19 setBeginPoint = 'REST ' + str(beginPoint)
20 myFtp.sendcmd(setBeginPoint)
21 # begin to download
22 beginToDownload = 'RETR ' + os.path.basename(remoteFilePath)
23 connection = myFtp.transfercmd(beginToDownload, rest)
24 readSize = self.fixBlockSize
25 while 1:
26 if blockSize > 0:
27 remainedSize = blockSize - finishedSize
28 if remainedSize > self.fixBlockSize:
29 readSize = self.fixBlockSize
30 else:
31 readSize = remainedSize
32 data = connection.recv(readSize)
33 if not data:
34 break
35 finishedSize = finishedSize + len(data)
36 # make sure the finished data no more than blockSize
37 if finishedSize == blockSize:
38 callback(data)
39 break
40 callback(data)
41 connection.close()
42 fp.close()
43 myFtp.quit()
44 return True
45 except Exception, diag:
46 return False

2. 等待下载完成之后我们需要对各个文件块进行合并,合并的过程见本系列之二:Python之FTP多线程下载文件之分块多线程文件合并
感谢大家的阅读,希望能够帮到大家!
Published by Windows Live Writer!
作者: 薛定谔の喵
出处: http://www.cnblogs.com/berlin-sun/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接,否则保留追究法律责任的权利。
Python之FTP多线程下载文件之多线程分块下载文件的更多相关文章
- Python之FTP多线程下载文件之分块多线程文件合并
Python之FTP多线程下载文件之分块多线程文件合并 欢迎大家阅读Python之FTP多线程下载系列之二:Python之FTP多线程下载文件之分块多线程文件合并,本系列的第一篇:Python之FTP ...
- 打造百度网盘备份利器:自动备份Linux VPS文件和多线程下载百度网盘资源
前一段时间国内的各大网盘百度云盘,金山快盘,360云盘,华为网盘为争夺用户上演空间容量博弈,网盘商们还固执地以为中国的网民都不懂网络技术,可以像某公司那样用一些数字的手段来忽悠用户,参与到网盘商的数字 ...
- iOS开发网络篇—大文件的多线程断点下载
http://www.cnblogs.com/wendingding/p/3947550.html iOS开发网络篇—多线程断点下载 说明:本文介绍多线程断点下载.项目中使用了苹果自带的类,实现了同时 ...
- iOS开发网络请求——大文件的多线程断点下载
iOS开发中网络请求技术已经是移动app必备技术,而网络中文件传输就是其中重点了.网络文件传输对移动客户端而言主要分为文件的上传和下载.作为开发者从技术角度会将文件分为小文件和大文件.小文件因为文件大 ...
- Python编码/文件读取/多线程
Python编码/文件读取/多线程 个人笔记~~记录才有成长 编码/文件读取/多线程 编码 常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...
- iOS开发网络篇—大文件的多线程断点下载(转)
http://www.cnblogs.com/wendingding/p/3947550.html iOS开发网络篇—多线程断点下载 说明:本文介绍多线程断点下载.项目中使用了苹果自带的类,实现了 ...
- Python 基于Python实现Ftp文件上传,下载
基于Python实现Ftp文件上传,下载 by:授客 QQ:1033553122 测试环境: Ftp客户端:Windows平台 Ftp服务器:Linux平台 Python版本:Python 2.7 ...
- python使用ftplib模块实现FTP文件的上传下载
python已经默认安装了ftplib模块,用其中的FTP类可以实现FTP文件的上传下载 FTP文件上传下载 # coding:utf8 from ftplib import FTP def uplo ...
- Python实现FTP文件定时自动下载
之前遇到技术问题总能在技术博客上得到启发,十分感谢各位的无私分享.而自己却很少发文,固然是水平有限,但也限制了知识积累和总结.今后多总结分享,回馈博客的同时也希望大家多多批评. 一.需求: 某数据公司 ...
随机推荐
- XCL-Charts圈图
我不知道是不是叫图,无论如何,所以叫它. 图形是今天我Circliful这个jQuery 插件上看到的. 认为非常好看. 就想把它实现出来,由于之前画过环形图.且我如今的图表基类基本已成型,所以非常快 ...
- 从头开始学JavaScript(一)——基础中的基础
概要:javascript的组成. 各个组成部分的作用 . 一.javascript的组成 javascript ECMAScript(核心) DOM(文档对象模型) BOM(浏览器对象模型) ...
- Tomcat剖析(五):Tomcat 容器
Tomcat剖析(五):Tomcat 容器 1. Tomcat剖析(一):一个简单的Web服务器 2. Tomcat剖析(二):一个简单的Servlet服务器 3. Tomcat剖析(三):连接器(1 ...
- 完整具体解释GCD系列(二)dispatch_after;dispatch_apply;dispatch_once
原创Blog,转载请注明出处 本文阅读的过程中,如有概念不懂,请參照前专栏中之前的文章,假设还有疑惑,请留言. 这是我关于GCD专栏的地址 http://blog.csdn.net/column/de ...
- 用DIV+css写Table
做出的效果样式如下图, 1,首先考虑的是如何显示border,就像是分割代码,我把border分割为最外层DIV全border,和内层DIV的right和bottom的border,就是右边和下边. ...
- linux下一个Oracle11g RAC建立(八)
linux下一个Oracle11g RAC建立(八) 七.安装oracle软件 直接在图形界面里安装oracle.在node1操作 在虚拟机界面中,直接切换到oracle用户下: [grid@no ...
- MonkeyRunner于Windows在下面Eclipse开发环境的搭建步骤(并解决在线Jython配置错误的问题)
网上有一shangdong_chu网友写了一篇文章介绍了如何Eclipse构造MonkeyRunner,他做了叙述一个很好的说明.但我对我的环境试验后会见Jython解析错误的问题,和制品缺少Pyde ...
- POJ 3255 Roadblocks (次级短路问题)
解决方案有许多美丽的地方.让我们跳回到到达终点跳回(例如有两点)....无论如何,这不是最短路,但它并不重要.算法能给出正确的结果 思考:而最短的路到同一点例程.spfa先正达恳求一次,求的最短路径的 ...
- 基于Mvc3,Ef,领域驱动电子商务系统的EShop开发
分享自己从代码小工一步步走向搭架子,ING... 简单了解UnitOfWork 摘要: UnitOfWorkUnit Of Work模式,即工作单元,它是一种数据访问模式.它是用来维护一个由已经被业务 ...
- 程序猿必要10免费的钱jquery小工具
本周带来10款免费的jquery插件.假设你也有好的作品,欢迎分享到社区中来,在得到帮助的同一时候,也能与很多其它人分享来自你的作品. jQuery导航菜单置顶插件 - stickyUp . 在线演示 ...