python3 urllib

官方文档

官方文档：https://docs.python.org/3/library/urllib.html

获取页面内容

第一种方式

import urllib.request

url = 'https://www.baidu.com/'

r = urllib.request.urlopen(url)

print(r)  # <http.client.HTTPResponse object at 0x00000201E6C66CF8>

print(r.read().decode('utf-8'))

另一种方式

import urllib.request

url = 'http://www.cnblogs.com/0bug/'

req = urllib.request.Request(url)

res = urllib.request.urlopen(req)

print(res.read().decode('utf-8'))

发送内容

import urllib.request

import urllib.parse

url = 'http://httpbin.org/post'

data = bytes(urllib.parse.urlencode({'name': 'lcg'}), encoding='utf-8')

r = urllib.request.urlopen(url, data=data)

print(r.read().decode('utf-8'))

设置超时时间

import urllib.request

url = 'http://www.cnblogs.com/0bug/'

r = urllib.request.urlopen(url, timeout=1)  # 设置超时时间

print(r.read().decode('utf8'))

异常处理

import urllib.request

import urllib.error

import socket

url = 'http://www.cnblogs.com/0bug/'

try:

    r = urllib.request.urlopen(url, timeout=0.01)  # 设置超时时间

    print(r.read().decode('utf8'))

except urllib.error.URLError as e:

    if isinstance(e.reason, socket.timeout):

        print('请求超时')

响应码、响应头

import urllib.request

url = 'http://www.cnblogs.com/0bug/'

r = urllib.request.urlopen(url)

print(r.status)  # 200

print(r.getheaders())  # [(('Content-Type', 'text/html; charset=utf-8'),......]

print(r.getheader('Content-Type'))  # text/html; charset=utf-8

构造请求信息

import urllib.request

import urllib.parse

url = 'http://www.cnblogs.com/0bug/'

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36',

    'Host': 'www.cnblogs.com'

}

dic = {'name': 'lcg'}

data = bytes(urllib.parse.urlencode(dic), encoding='utf-8')

req = urllib.request.Request(url=url, data=data, headers=headers, method='POST')

res = urllib.request.urlopen(req)

print(res.read().decode('utf-8'))

另一种添加请求头的方式

import urllib.request

import urllib.parse

url = 'http://www.cnblogs.com/0bug/'

dic = {'name': 'lcg'}

data = bytes(urllib.parse.urlencode(dic), encoding='utf-8')

req = urllib.request.Request(url=url, data=data, method='POST')

req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/53...')

res = urllib.request.urlopen(req)

print(res.read().decode('utf-8'))

代理

import urllib.request

url = 'http://www.cnblogs.com/0bug/'

proxy_handler = urllib.request.ProxyHandler({

    'http': 'http://122.114.31.177:808',

    'https': 'https://124.133.75.183:8118'

})

opener = urllib.request.build_opener(proxy_handler)

r = opener.open(url)

print(r.read().decode('utf-8'))

python3 urllib的更多相关文章

爬虫小探-Python3 urllib.request获取页面数据
使用Python3 urllib.request中的Requests()和urlopen()方法获取页面源码,并用re正则进行正则匹配查找需要的数据. #forex.py#coding:utf-8 ' ...
【转】python3 urllib.request 网络请求操作
python3 urllib.request 网络请求操作基本的网络请求示例 ''' Created on 2014年4月22日 @author: dev.keke@gmail.com ''' im ...
Python3 urllib.request库的基本使用
Python3 urllib.request库的基本使用所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地. 在Python中有很多库可以用来抓取网页,我们先学习urlli ...
python3 urllib 类
urllib模块中的方法 1.urllib.urlopen(url[,data[,proxies]]) 打开一个url的方法,返回一个文件对象,然后可以进行类似文件对象的操作.本例试着打开google ...
python3 urllib.request 网络请求操作
python3 urllib.request 网络请求操作基本的网络请求示例 ''' Created on 2014年4月22日 @author: dev.keke@gmail.com ''' im ...
Python3 urllib.parse 常用函数示例
Python3 urllib.parse 常用函数示例 http://blog.51cto.com/walkerqt/1766670 1.获取url参数. >>> from url ...
python2 与 python3 urllib的互相对应关系
urllib Python2 name Python3 nameurllib.urlopen() Deprecated. See urllib.request.urlopen() which mirr ...
python3 urllib.request.urlopen() 地址打开错误
错误内容:UnicodeEncodeError: 'ascii' codec can't encode characters in position 28-29: ordinal not in ran ...
python3 urllib及requests基本使用
在python中,urllib是请求url连接的标准库,在python2中,分别有urllib和urllib,在python3中,整合成了一个,称谓urllib 1.urllib.request re ...
（转）python3 urllib.request.urlopen() 错误UnicodeEncodeError: 'ascii' codec can't encode characters
代码内容: url = 'https://movie.douban.com/j/search_subjects?type=movie'+ str(tag) + '&sort=recommend ...

随机推荐

python读写csv时中文乱码问题解决办法
https://www.cnblogs.com/shengulong/p/7097869.html 参考1 参考2 参考3 CSV是英文Comma Separate Values(逗号分隔值)的缩写, ...
HDU 3226 背包
转载自:http://www.cppblog.com/dango/archive/2010/08/26/124881.aspx 貌似是01背包的强化版.但是感觉这样写好理解些.就是01背包拓展了.
51nod1269Devu and Flowers
题解: 如果没有限制每一种花有多少,那么就是简单的排列组合问题. 那么我们强制让一些花一定都要选. 暴力搜索,然后组合数(逆元) 采用容斥原理来计算最后的答案代码: #include<bits ...
web项目中的路径问题
“/”表示根路径 1.“/”代表的意思不是固定的,是要根据具体的方法,才能知道在该方法中"/"所代表的含义,同样相对路径也不是固定的,需要根据具体的方法来判断具体是相对哪个路径的相 ...
iOS 9 通用链接（Universal Links）
什么是Universal Links? 在iOS9之前,对于从各种从浏览器.Safari中唤醒APP的需求,我们通常只能使用scheme.但是这种方式需要提前判断系统中是否安装了能够响应此scheme ...
DevExpress v17.2新版亮点—WPF篇（六）
用户界面套包DevExpress v17.2终于正式发布,本站将以连载的形式为大家介绍各版本新增内容.本文将介绍了DevExpress WPF v17.2 新的Hamburger Menu.Sched ...
ExceptionHandler 异常公共处理
异常的公共处理很多种,采用注解的方式,拦截器的方式等都可以,我采用的是继承 AbstractHandlerExceptionResolver 来实现, 上代码 package com.yun.util ...
Centos7 安装 MySQL5.7
Centos7 安装 MySQL5.7 一.环境介绍 1.安装包版本介绍 MySQL 有三种安装方式:RPM安装.二进制包安装.源码包安装.我们这篇文章以二进制方式安装MySQL 软件名称版本系统 ...
CentOS7安装OpenStack(Rocky版)-03.安装Glance镜像服务组件（控制节点）
上篇文章分享了keystone的安装配置,本文接着分享openstack的镜像服务glance. --------------- 完美的分割线 ---------------- 3.0.glance概 ...
shell 脚本实战笔记(8)--ssh免密码输入执行命令
前言: ssh命令, 没有指定密码的参数. 以至于在脚本中使用ssh命令的时候, 必须手动输入密码, 才能继续执行. 这样使得脚本的自动化执行变得很差, 尤其当ssh对应的机器数很多的时候, 会令人抓 ...

python3 urllib

官方文档

获取页面内容

第一种方式

另一种方式

发送内容

设置超时时间

响应码、响应头

构造请求信息

代理

python3 urllib的更多相关文章

随机推荐

热门专题