# -*- coding: utf-8 -*-

# python:2.x

__author__ = 'Administrator'

#使用python创建一个简单的WEB客户端

import urllib,urllib2,urlparse

"""

web地址元素

URL部件                 描述

prot_sch             网络协议或者下载规划

nety_loc             服务器位置(或者也有用户信息)

path                 斜杠(/)限定文件或者CGI应用程序路径

query                连接符(&)连接键值对

params               可选参数

frag                 拆分文档中特殊锚

网络定位元素

net_loc

部件                   描述

user                   用户名

password               密码

host                 web服务器运行机器名或者地址(必须字段)

port                 端口号(默认为80)

"""

#urlparse.urlparse()urlparse(url, scheme='', allow_fragments=True)

"""

将url解析成一个6元组(prot_sch,net_loc,path,params,query,frag)

当url中没有提供默认网络协议或者下载规划时可以使用scheme,allw_fragments标识一个URL是否允许使用零部件

"""

#例如

#print urlparse.urlparse('http://www.python.org/doc/FAQ.html')

#ParseResult(scheme='http', netloc='www.python.org', path='/doc/FAQ.html', params='', query='', fragment='')

#urlparse.urlunparse()功能与urlparse.urlparse()相反:它是拼合一个6元组(prot_sch,net_loc,path,params,query,frag)

#url1=urlparse.urlparse('http://www.163.com')

#print urlparse.urlunparse(url1)

#urlparse.urljoin()进行多个结合一起

##                       'photo.shtml')

"""urllib

支持WEB协议,HTTP,FTP,GOPHER协议,可以进行上载下载,避免使用以前的那些模块

"""

#urllib.urlopen()打开一个给定的URL字符串与WEB连接,返回文件类型

#语法urllib.urlopen(url,data=None,proxies=None):如果没有给定协议或者下载,或者文件规划早已给出,它会打开本地文件

"""

对于所有HTTP请教,常见的请求是GET,在这样的情况下,WEB服务器会发送请求字符串(编码键值或者引用)

如果要求使用POST方法信息,请查看CGI应用编程部分普通文档或者文本。

f.info()方法返回MIME(多目标因特网邮件扩展,Multipurpose internet mail extension)头文件,这个头文件通知浏览器返回文件类型可以是那类应用程序打开

geturl()方法在考虑了所有可能发生间接导向后,从最终打开的文件中获得真实的URL

"""

"""

urllilb.urlopen()方法如下

对象方法                                       描述

f.read([bytes])              从f中读出所有或者bytes个字节

f.readline()                 从f中读出一行

f.readlines()                读取所有行返回一个列表

f.close()                    关闭连接

f.fileno()                   返回f文件句柄

f.geturl()                   返回f所打开的真正URL

如果需要复杂的URL或者要处理复杂的情况,比如cookie等问题,建议使用urllib2模块

"""

#urllib.urlretrieve(url,fulename=None,reporthook=None,data=None)当需要URL文档时,可以使用它

"""

reporthook这个函数会在每块数据下载或者传输完之后被调用,3个参数:目前读入块数,块的字节数和文件字节数,

urlretrieve()返回一个2元组,(filename,mime_hdrs),filename包含下载数据本地文件名,mime_hdrs是对WEB服务器响应后返回一系列MIME文件判断

更多信息可以看mimetools的message类,对于本地文件来说mime_hdrs是空的

"""

#urllib.quote()和urllib.quote_plus()

"""

quote*()函数获取URL数据,将其编码,从而适用于URL字符串中,对于一些不能被打印或者不被WEB服务器作为有效的URL接收特殊字符串可以使用此函数

语法如

quote(urldata,safe='/')

"""

#例如

# name='jon mama'

# number=6

# base='http://www/~foo/cgi-bin/s.py'

# final='%s?name=%s&num=%d'%(base,name,number)

# print final

# print urllib.quote(final)

# print urllib.quote_plus(final)

#urllib.unquote(),urllib.unquote_plus()这2个函数功能完全相反,将所有编码'%xx'式的字母转换成它们的ascii值

#调用unquote()函数会把s中所有URL编码字母都解码,返回字符串,urllib.unquote_plus()函数会将加号转换成空格符

#urllib.urlencode()它是接收字典键-值对,将其编译成CGI请求的URL字符串,键值对格式:键=值,以连接符&划分,更进一步,键和它们值被传到quote_pluis()进行适当的编码

#例如

adict={'name':'georgion garica','b':'c'}

print urllib.urlencode(adict)

#urllib方法的例子学习

url1='http://cnblogs.com'

#代理服务器

proxies={'http':'http://cnblogs.com'}

#使用代理服务器打开

r=urllib.urlopen(url1,proxies=proxies)

print r.info()

print r.getcode()

print r.geturl()

#打开本地文件

f=urllib.urlopen(url='file:/f:/from2.html')

#print f.read()

#print f.readline()

print f.readlines()

#打开ftp服务器

#f = urllib.urlopen(url = 'ftp://username:password@ftpaddress')

#保存网页显示进度

def urlabc(a,b,c):

"""

a:数量

b:大小

c:状态

"""

per=100.*a*b/c

if per>100:

per=100

print '%.2f%%'%per

url='http://www.oschina.net/news/55121/tiobe-2014-9'

local='oschina.net'

print  urllib.urlretrieve(url,local,urlabc)

#get方法

params=urllib.urlencode({'s':1,'b':2,'c':3})

f=urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)

print f.read()

print '*'*300

#post方法

params=urllib.urlencode({'s':1,'b':2,'c':3})

f=urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)

print f.read()

print '*'*300

#编码解码

data='name=~a+3'

data1=urllib.quote(data)

print data1

print urllib.unquote(data1)

data2=urllib.quote_plus(data)

print data2

print urllib.unquote_plus(data2)

data3 = urllib.urlencode({ 'name': 'dark-bull', 'age': 200 })

print data3

data4=urllib.pathname2url(r'F:\qtgui\netword1\oschina.net')

print data4

print urllib.url2pathname(data4)

python urllib基础学习的更多相关文章

  1. Python入门基础学习 三

    Python入门基础学习 三 数据类型 Python区分整型和浮点型依靠的是小数点,有小数点就是浮点型. e记法:e就是10的意思,是一种科学的计数法,15000=1.5e4 布尔类型是一种特殊的整形 ...

  2. Python入门基础学习 二

    Python入门基础学习 二 猜数字小游戏进阶版 修改建议: 猜错的时候程序可以给出提示,告诉用户猜测的数字偏大还是偏小: 没运行一次程序只能猜测一次,应该提供多次机会给用户猜测: 每次运行程序,答案 ...

  3. Python入门基础学习 一

    Python入门基础学习 一 Python下载及安装 下载地址:https://www.python.org/,选择最新的版本下载 稍等一会,安装完成. 简单语句 从idle启动Python:IDLE ...

  4. python函数基础学习

    函数的定义与调用: def 函数名(参数1,参数2): ‘’’函数注释’’’ print(‘函数体’) return 返回值 定  义:def关键字开关,空格之后接函数名和圆括号,最后冒号结尾 def ...

  5. Python入门基础学习(文件与异常处理)

    Python基础学习笔记(七) 捕获异常的语法格式: 文件的基本操作: 打开文件 读.写文件 关闭文件 read方法 --读取文件: open函数的第一个参数是要打开的文件名(文件名区分大小写) 如果 ...

  6. Python入门基础学习(时间模块,随机模块)

    Python基础学习笔记(六) time模块: 时间的三种表示方法: 1.格式化字符串 2.时间戳 用来表示和1970年的时间间隔,单位为s 3.元组 struct_time 9个元素 time的st ...

  7. Python入门基础学习(模块,包)

    Python基础学习笔记(五) 模块的概念:模块是python程序架构的一个核心概念 每个以拓展名py结尾的python源代码文件都是一个模块 模块名同样也是一个标识符,需要符合标识符的命名规则 在模 ...

  8. Python入门基础学习(面向对象)

    Python基础学习笔记(四) 面向对象的三个基本特征: 封装:把客观事物抽象并封装成对象,即将属性,方法和事件等集合在一个整体内 继承:允许使用现有类的功能并在无须重新改写原来的类情况下,对这些功能 ...

  9. Python入门基础学习(函数)

    Python基础学习笔记(三) 函数的概念: 所谓函数,就是把具有独立功能的代码块组织为一个小模块,在需要的时候调用 函数的使用包含两个步骤: 1.定义函数 --封装独立的功能 2.调用函数 --享受 ...

随机推荐

  1. 正则表达式获取URL参数

    使用到的正则表达式: [^\?&]?参数名=[^&]+ document.location.getURLPara = function (name) { var reg = new R ...

  2. C++类訪问控制及继承

    一.C++类的訪问控制有三类:public,protected和private. 类訪问控制符 类成员可被哪些对象訪问 public 1.类的成员函数.2.类对象.3.友元.4.子类成员函数 prot ...

  3. c/c++ 复习基础要点01-const指针、指针函数 函数指针、new/delete与malloc/free区别与联系

    1.      引用本身是有指针实现的:引用为只读指针 例子: int d=123; int& e=d;    //引用 int * const e=d; //只读指针,e指向d,不可修改e指 ...

  4. 安装sql server提示挂起报错

    在安装sql server时出现“以前的某个程序安装已在安装计算机上创建挂起的文件操作.运行安装程序之前必须重新启动计算机”错误.无法进行下去. 参考有关资料后,以下步骤基本可以解决: 1)添加/删除 ...

  5. [CSAPP笔记][第六章存储器层次结构]

    第六章 存储器层次结构 在简单模型中,存储器系统是一个线性的字节数组,CPU能够在一个常数访问每个存储器位置. 虽然是一个行之有效的模型,但没有反应现代系统实际工作方式. 实际上,存储器系统(memo ...

  6. exec与xargs区别

    区别描述: 两者都是对符合条件的文件执行所给的Linux 命令,而不询问用户是否需要执行该命令. -exec:{}表示命令的参数即为所找到的文件,以:表示comman命令的结束.\是转义符,因为分号在 ...

  7. flush();close();dispose()

    写一个写csv文件的程序,用streamwriter,觉得程序主体是没有问题的,但是一直写不进去,最后发现是因为没有调用flush(). msdn 对streamwriter.flush()的的说明是 ...

  8. .net中的特性

    本文来之:http://hi.baidu.com/sanlng/item/afa31eed0a383e0e570f1d3e 在一般的应用中,特性(Attribute,以称为属性)好像被使用的不是很多. ...

  9. 网页搜索功能 多表搜索sql

    SELECT ID, Title, FromTableFROM (SELECT ID, ArticleName AS Title, 'Article' AS FromTable        FROM ...

  10. android布局常用属性记录

    android布局常用属性记录   http://blog.csdn.net/xn4545945/article/details/7717086这里有一部分别人总结的其余的: align:对齐 par ...