慢慢的把它们总结一下，总结就是最好的学习方法

宗述

首先来看一下他们的区别

urllib和urllib2

urllib 和urllib2都是接受URL请求的相关模块，但是urllib2可以接受一个Request类的实例来设置URL请求的headers，urllib仅可以接受URL。

这意味着，你不可以伪装你的User Agent字符串等。

urllib提供urlencode方法用来GET查询字符串的产生，而urllib2没有。这是为何urllib常和urllib2一起使用的原因。

目前的大部分http请求都是通过urllib2来访问的

httplib

httplib实现了HTTP和HTTPS的客户端协议，一般不直接使用，在python更高层的封装模块中（urllib,urllib2）使用了它的http实现。

urllib简单用法

urllib.urlopen(url[, data[, proxies]]) :

详细使用方法见

urllib学习

urllib2简单用法

最简单的形式

import urllib2

   response=urllib2.urlopen('http://www.douban.com')

   html=response.read()

实际步骤：

1、urllib2.Request()的功能是构造一个请求信息，返回的req就是一个构造好的请求

2、urllib2.urlopen()的功能是发送刚刚构造好的请求req，并返回一个文件类的对象response，包括了所有的返回信息。

3、通过response.read()可以读取到response里面的html，通过response.info()可以读到一些额外的信息。

如下：

#!/usr/bin/env python

    import urllib2

    req = urllib2.Request("http://www.douban.com")

    response = urllib2.urlopen(req)

    html = response.read()

    print html

有时你会碰到，程序也对，但是服务器拒绝你的访问。这是为什么呢?问题出在请求中的头信息(header)。有的服务端有洁癖，不喜欢程序来触摸它。这个时候你需要将你的程序伪装成浏览器来发出请求。请求的方式就包含在header中。
常见的情形：

import urllib

import urllib2

url = 'http://www.someserver.com/cgi-bin/register.cgi'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'# 将user_agent写入头信息

values = {'name' : 'who','password':''}

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)

req = urllib2.Request(url, data, headers)

response = urllib2.urlopen(req)

the_page = response.read()

values是post数据

GET方法

例如百度：

百度是通过http://www.baidu.com/s?wd=XXX 来进行查询的，这样我们需要将{‘wd’:’xxx’}这个字典进行urlencode

#coding:utf-

import urllib

import urllib2

url = 'http://www.baidu.com/s'

values = {'wd':'D_in'}

data = urllib.urlencode(values)

print data

url2 = url+'?'+data

response = urllib2.urlopen(url2)

the_page = response.read()

print the_page

POST方法

import urllib

import urllib2

url = 'http://www.someserver.com/cgi-bin/register.cgi'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' //将user_agent写入头信息

values = {'name' : 'who','password':''}      //post数据

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)                   //对post数据进行url编码

req = urllib2.Request(url, data, headers)

response = urllib2.urlopen(req)

the_page = response.read()

urllib2带cookie的使用

#coding:utf-

import urllib2,urllib

import cookielib  

url = r'http://www.renren.com/ajaxLogin'  

#创建一个cj的cookie的容器

cj = cookielib.CookieJar()

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

#将要POST出去的数据进行编码

data = urllib.urlencode({"email":email,"password":pass})

r = opener.open(url,data)

print cj

httplib简单用法

简单示例

#!/usr/bin/env python

# -*- coding: utf- -*-

import httplib

import urllib    

def sendhttp():

    data = urllib.urlencode({'@number': , '@type': 'issue', '@action': 'show'})

    headers = {"Content-type": "application/x-www-form-urlencoded",

               "Accept": "text/plain"}

    conn = httplib.HTTPConnection('bugs.python.org')

    conn.request('POST', '/', data, headers)

    httpres = conn.getresponse()

    print httpres.status

    print httpres.reason

    print httpres.read()               

if __name__ == '__main__':

    sendhttp()

具体用法见

httplib模块

python 3.x中urllib库和urilib2库合并成了urllib库。其中、

首先你导入模块由

import urllib

import urllib2

变成了

import urllib.request

然后是urllib2中的方法使用变成了如下

urllib2.urlopen()变成了urllib.request.urlopen()

urllib2.Request()变成了urllib.request.Request() 

urllib2.URLError 变成了urllib.error.URLError

而当你想使用urllib 带数据的post请求时，

在python2中

urllib.urlencode(data)

而在python3中就变成了

urllib.parse.urlencode(data)

脚本使用举例：

python 2中

import urllib

import urllib2

import json
from config import settings

def url_request(self, action, url, **extra_data):    abs_url = "http://%s:%s/%s" % (settings.configs['Server'],

                                   settings.configs["ServerPort"],

                                   url)

    if action in ('get', 'GET'):

        print(abs_url, extra_data)

        try:

            req = urllib2.Request(abs_url)

            req_data = urllib2.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            # print "-->server response:",callback

            return callback

        except urllib2.URLError as e:

            exit("\033[31;1m%s\033[0m" % e)

    elif action in ('post', 'POST'):

        # print(abs_url,extra_data['params'])

        try:

            data_encode = urllib.urlencode(extra_data['params'])

            req = urllib2.Request(url=abs_url, data=data_encode)

            res_data = urllib2.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = res_data.read()

            callback = json.loads(callback)

            print("\033[31;1m[%s]:[%s]\033[0m response:\n%s" % (action, abs_url, callback))

            return callback

        except Exception as e:

            print('---exec', e)

            exit("\033[31;1m%s\033[0m" % e)

python3.x中

import urllib.request

import json

from config import settings

def url_request(self, action, url, **extra_data):

    abs_url = 'http://%s:%s/%s/' % (settings.configs['ServerIp'], settings.configs['ServerPort'], url)

    if action in ('get', 'Get'): # get请求

        print(action, extra_data)try:

            req = urllib.request.Request(abs_url)

            req_data = urllib.request.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            return callback

        except urllib.error.URLError as e:

            exit("\033[31;1m%s\033[0m" % e)

    elif action in ('post', 'POST'): # post数据到服务器端

        try:

            data_encode = urllib.parse.urlencode(extra_data['params'])

            req = urllib.request.Request(url=abs_url, data=data_encode)

            req_data = urllib.request.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            callback = json.loads(callback.decode())

            return callback

        except urllib.request.URLError as e:

            print('---exec', e)

            exit("\033[31;1m%s\033[0m" % e)

settings配置如下：

configs = {

    'HostID': ,

    "Server": "localhost",

    "ServerPort": ,

    "urls": {

        'get_configs': ['api/client/config', 'get'],  #acquire all the services will be monitored

        'service_report': ['api/client/service/report/', 'post'],

    },

    'RequestTimeout': ,

    'ConfigUpdateInterval': ,  #  mins as default

}

python的httplib、urllib和urllib2的区别及用的更多相关文章

Python:urllib和urllib2的区别(转)
原文链接:http://www.cnblogs.com/yuxc/ 作为一个Python菜鸟,之前一直懵懂于urllib和urllib2,以为2是1的升级版.今天看到老外写的一篇<Python: ...
4 urllib和urllib2的区别
4 urllib和urllib2的区别这个面试官确实问过,当时答的urllib2可以Post而urllib不可以. urllib提供urlencode方法用来GET查询字符串的产生,而urllib2 ...
[转]Python中urllib与urllib2的区别与联系
引用文章1:http://my.oschina.net/u/558071/blog/144792 引用文章2:http://zhuoqiang.me/python-urllib2-usage.html ...
python基于http协议编程：httplib,urllib和urllib2<转>
httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现. httplib.HTTPConnecti ...
Python:urllib和urllib2的区别
urllib和urllib2都是处理url请求的两个模块,但是相互之间存在不同,不能相互取代 urllib2可以接受一个Reuqest类的实例来设置URL请求的headers,urllib仅可以接受U ...
httplib,urllib和urllib2
一.httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现. import httplib con ...
爬虫新手学习2-爬虫进阶(urllib和urllib2 的区别、url转码、爬虫GET提交实例、批量爬取贴吧数据、fidder软件安装、有道翻译POST实例、豆瓣ajax数据获取)
1.urllib和urllib2区别实例 urllib和urllib2都是接受URL请求相关模块,但是提供了不同的功能,两个最显著的不同如下: urllib可以接受URL,不能创建设置headers的 ...
python2核心类库：urllib、urllib2的区别和使用
urllib/urllib2都是接受URL请求的相关模块区别:1.urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL.这意味着,你不可以伪装 ...
python学习之----urllib与urllib2的区分
urllib 还是urllib2 ? 如果你用过Python 2.x 里的urllib2 库,可能会发现urllib2 与urllib 有些不同. 在Python 3.x 里,urllib2 改名为u ...

随机推荐

flarum论坛系统搭建教程
安装 PHP 5.5+ and MySQL 5.5+, and install Composer. composer create-project flarum/flarum . --stabilit ...
webpack1--安装与初始化
webpack可用于打包所有的脚本,图片,样式表及其他资源. 今天来讲一下如何安装webpack 及创建package.json.webpack依赖于npm和 node,所以本文是假设你已安装好了n ...
数据框排序 data.frame order
# sorting examples using the mtcars datasetattach(mtcars) # sort by mpgnewdata <- mtcars[order(mp ...
如何使用Javascript XSLT 处理XML文件（支持Firefox）
最近使用Firefox进行网页的调试,发现有些Javascript XSLT处理XML的语句仅仅支持IE浏览器.而网络中的一些介绍javascript XSLT 处理XML的文章基本上都是依据AJAX ...
磁盘映射： between 宿主机 and 客户机
一.虚拟机映射到宿主机在虚拟机关机的状态下,双击右侧设备栏里硬盘,在弹出的窗口中单击“实用程序“,选择“映射”.打开映射虚拟磁盘的窗口,其中的“卷”就是你希望映射虚拟机中的哪个分区到主机,如 ...
SpannableString
http://blog.csdn.net/fengkuanghun/article/details/7904284 背景介绍在开发应用过程中经常会遇到显示一些不同的字体风格的信息犹如默认的LockS ...
关于Unity中Mecanim动画的动画状态代码控制与代码生成动画控制器
对于多量的.复杂的.有规律的控制器使用代码生成动画状态代码控制 1:每个动画状态,比如进入状态,离开状态, 等都有可能需要代码来参与和处理,比如,进入这个动画单元后做哪些事情,来开这个动画单元后做哪 ...
关于Unity中的刚体和碰撞器的相关用法(二)
在关于Unity中的刚体和碰撞器的相关用法(一)的基础上有一个plane平面,一个ball球体,都挂了碰撞器,ball挂了刚体Rigidbody,写了一个脚本ball挂载在球体上,球体从空中落下装机 ...
python 按照自然数排序遍历文件 python os.listdir sort by natural sorting
import os import re def sorted_aphanumeric(data): convert = lambda text: int(text) if text.isdigit() ...
(笔记)Mysql命令select：当前选择（连接）的数据库
select命令表示当前选择(连接)的数据库. select命令格式:mysql> select database(); MySQL中SELECT命令类似于其他编程语言里的print或者writ ...

python的httplib、urllib和urllib2的区别及用

宗述