python下载文件的三种方法

Python开发中时长遇到要下载文件的情况，最常用的方法就是通过Http利用urllib或者urllib2模块。

当然你也可以利用ftplib从ftp站点下载文件。此外Python还提供了另外一种方法requests。

下面来看看三种方法是如何来下载zip文件的：
方法一：

import urllib

import urllib2

import requests

print "downloading with urllib"

url = 'http://***/test/demo.zip'

print "downloading with urllib"

urllib.urlretrieve(url, "demo.zip")

方法二：

import urllib2

print "downloading with urllib2"

url = 'http://***/test/demo.zip'

f = urllib2.urlopen(url)

data = f.read()

with open("demo2.zip", "wb") as code:

code.write(data)

方法三：

import requests

print "downloading with requests"

url = 'http://***/test/demo.zip'

r = requests.get(url)

with open("demo3.zip", "wb") as code:

code.write(r.content)

看起来使用urllib最为简单，一句语句即可。当然你可以把urllib2缩写成：

f = urllib2.urlopen(url)

with open("demo2.zip", "wb") as code:

code.write(f.read())

==========================================python requests======

在HTTP相关处理中使用python是不必要的麻烦，这包括urllib2模块以巨大的复杂性代价获取综合性的功能。相比于urllib2，Kenneth Reitz的Requests模块更能简约的支持完整的简单用例。

简单的例子：
想象下我们试图使用get方法从http://example.test/获取资源并且查看返回代码，content-type头信息，还有response的主体内容。这件事无论使用urllib2 或者Requests都是很容易实现的。
urllib2：

import urllib2

url = 'http://example.test/'

response = urllib2.urlopen(url)

response.getcode()
-- 200
response.headers.getheader('content-type')
-- 'text/html; charset=utf-8'
response.read()
-- 'Hello, world!'

Requests：

import requests

url = 'http://example.test/'

response = requests.get(url)

response.status_code

--

response.headers['content-type']

-- 'text/html; charset=utf-8'

response.content

-- u'Hello, world!这两种方法很相似，相对于urllib2调用方法读取response中的属性信息，Requests则是使用属性名来获取对应的属性值。

两者还有两个细微但是很重要的差别：
1. Requests 自动的把返回信息有Unicode解码
2. Requests 自动保存了返回内容，所以你可以读取多次，而不像urllib2.urlopen()那样返回的只是一个类似文件类型只能读取一次的对象。

第二点是在python交互式环境下操作代码很令人讨厌的事情

一个复杂一点的例子：现在让我们尝试下复杂点得例子：使用GET方法获取http://foo.test/secret的资源，这次需要基本的http验证。使用上面的代码作为模板，好像我们只要把urllib2.urlopen() 到requests.get()之间的代码换成可以发送username，password的请求就行了

这是urllib2的方法：

import urllib2

url = 'http://example.test/secret'

password_manager = urllib2.HTTPPasswordMgrWithDefaultRealm()

password_manager.add_password(None, url, 'dan', 'h0tdish')

auth_handler = urllib2.HTTPBasicAuthHandler(password_manager)

opener = urllib2.build_opener(auth_handler)

urllib2.install_opener(opener)

response = urllib2.urlopen(url)

response.getcode()

--

response.read()

-- 'Welcome to the secret page!'

一个简单的方法中实例化了2个类，然后组建了第三个类，最后还要装载到全局的urllib2模块中，最后才调用了urlopen，那么那两个复杂的类是什么的
迷惑了吗，这里所有urllib2的文档 http://docs.python.org/release/2.7/library/urllib2.html
那Requests是怎么样解决同样的问题的呢？

Requests：

import requests

url = 'http://example.test/secret'

response = requests.get(url, auth=('dan', 'h0tdish'))

response.status_code

--

response.content

-- u'Welcome to the secret page!'

只是在调用方法的时候增加了一个auth关键字函数
我敢打赌你不用查文档也能记住。

错误处理 Error HandlingRequests 对错误的处理也是很非常方面。如果你使用了不正确的用户名和密码，urllib2会引发一个urllib2.URLError错误，然而Requests 会像你期望的那样返回一个正常的response对象。只需查看response.ok的布尔值便可以知道是否登陆成功。

response = requests.get(url, auth=('dan', 'wrongPass'))

response.ok

-- False

其他的一些特性：
* Requests对于HEAD, POST, PUT, PATCH, 和 DELETE方法的api同样简单
* 它可以处理多部分上传，同样支持自动转码
* 文档更好
* 还有更多

Requests 是很好的，下次需要使用HTTP时候可以试试。

python下载文件的三种方法的更多相关文章

Python实现下载文件的三种方法
下面来看看三种方法是如何来下载zip文件的:方法一: import urllib print "downloading with urllib" url = 'http://www ...
Python 下载图片的三种方法
import os os.makedirs('./image/', exist_ok=True) IMAGE_URL = "http://image.nationalgeographic.c ...
Python下载网页的几种方法
get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在 ...
VC中加载LIB库文件的三种方法
VC中加载LIB库文件的三种方法在VC中加载LIB文件的三种方法如下: 方法1:LIB文件直接加入到工程文件列表中在VC中打开File View一页,选中工程名,单击鼠标右键,然后选中&quo ...
java将doc文件转换为pdf文件的三种方法
http://feifei.im/archives/93 —————————————————————————————————————————————— 项目要用到doc转pdf的功能,一番google ...
python字符串连接的三种方法及其效率、适用场景详解
python字符串连接的方法,一般有以下三种:方法1:直接通过加号(+)操作符连接website=& 39;python& 39;+& 39;tab& 39;+& ...
python读文件的三个方法read()、readline()、readlines()详解
文件 runoob.txt 的内容如下: 1:www.runoob.com2:www.runoob.com3:www.runoob.com4:www.runoob.com5:www.runoob.co ...
Logstash处理json格式日志文件的三种方法
假设日志文件中的每一行记录格式为json的,如: {"Method":"JSAPI.JSTicket","Message":"JS ...
Viewing the interface of your Swift code,查看Swift代码的头文件的三种方法
Technical Q&A QA1914 Viewing the interface of your Swift code Q: How do I view the interface ...

随机推荐

bzoj1503 Splay 维护名次数，支持删除
题目:http://www.lydsy.com/JudgeOnline/problem.php?id=1503 题解: 维护一颗Splay和一个外部变量,树中每个节点表示一个人,节点权值a + 外部变 ...
Linux性能监控分析命令（四）—top命令介绍
性能监控分析的命令包括如下: 1.vmstat 2.sar 3.iostat 4.top 5.free 6.uptime 7.netstat 8.ps 9.strace 10.lsof ======= ...
java并发基础（二）
<java并发编程实战>终于读完4-7章了,感触很深,但是有些东西还没有吃透,先把已经理解的整理一下.java并发基础(一)是对前3章的总结.这里总结一下第4.5章的东西. 一.java监 ...
重温PHP之插入排序
插入排序基本思路:将数组分为两个区(已排序区和未排序区),假定数组的第一个元素处于已排序区, 第一个元素之后的所有元素都处于未排序部分.排序时用到双层循环,外层循环用于从未排序部分中取出待排序元素,并 ...
js异步任务处理方式
一.es6(es2015)之前:使用原始的callback函数,会陷入回掉地域 this.$http.jsonp('/login', (res) => { this.$http.jsonp('/ ...
[Dynamic Language] Python非子包引用
Python非子包引用 python的搜索路径其实是一个列表(sys.path) 导入模块时python会自动去找搜索这个列表当中的路径,如果路径中存在要导入的模块文件则导入成功. 在项目中如果要引用 ...
xarmain使用Forms编译android工程出现support_r19.0.1.zip支持包错误
第一次使用xarain下载Forms程序,提示一下错误. C:\Program Files (x86)\MSBuild\Xamarin\Android\Xamarin.Android.Common.t ...
25LINQ拾遗及实例
投影 □ 遍历数组索引,Select获取 int[] indexes = {0, 2}; string[] strs = {"a", "b", " ...
【笨木头Lua专栏】基础补充05：迭代器番外篇
关于迭代器的内容, 另一点点,只是已经无关紧要了.应该算是一种扩展吧.就一起来开开眼界好了~ 笨木头花心贡献.哈?花心?不.是用心~ 转载请注明,原文地址: http://www.benmutou.c ...
pytest文档23-使用多个fixture和fixture直接互相调用
使用多个fixture 如果用例需要用到多个fixture的返回数据,fixture也可以return一个元组.list或字典,然后从里面取出对应数据. # test_fixture4.py impo ...

python下载文件的三种方法

python下载文件的三种方法的更多相关文章

随机推荐

热门专题