小白学 Python 爬虫（13）：urllib 基础使用（三）

from urllib import request, error

# 访问明显不存在的地址，报错：Not Found

try:

    response = request.urlopen('https://www.geekdigging.com/aa')

except error.URLError as e:

    print(e.reason)

# 访问超时，报错：timed out

try:

    response = request.urlopen('https://www.baidu.com', timeout=0.001)

except error.URLError as e:

    print(e.reason)

这里我们访问了一个明显不存在的链接和限定了极短的超时时间，这里会抛出异常，但是我们捕获了 URLError 这个异常，运行结果如下：

Not Found

timed out

程序没有直接抛出异常终止运行，而是输出了上面这个异常，通过这样的操作，我们可以避免程序异常终止，同时还可以对这个异常做出针对性的处理。

此外，异常捕捉抛出的异常不一定都是字符串类型，比如访问超时的报错，我们将打印结果的代码稍作改动：

from urllib import request, error

import socket

# 异常类型示例

try:

    response = request.urlopen('https://www.baidu.com', timeout=0.001)

except error.URLError as e:

    print(type(e.reason))

    if isinstance(e.reason, socket.timeout):

        print('TIME OUT')

结果如下：

<class 'socket.timeout'>

TIME OUT

HTTPError

它是 URLError 的子类，专门用来处理 HTTP 请求错误，比如认证请求失败等。它有如下 3 个属性。

code：返回HTTP状态码，比如404表示网页不存在，500表示服务器内部错误等。
reason：同父类一样，用于返回错误的原因。
headers：返回请求头。

还是先看一个最简单的示例：

from urllib import request, error

# 访问明显不存在的地址，使用 HTTPError 捕捉异常

try:

    response = request.urlopen('https://www.geekdigging.com/aa')

except error.HTTPError as e:

    print(e.reason, e.code, e.headers, sep='\n')

运行结果如下：

Not Found

404

Date: Sun, 01 Dec 2019 15:11:48 GMT

Content-Type: text/html

Content-Length: 49307

Connection: close

Server: tencent-cos

Last-Modified: Sun, 01 Dec 2019 15:03:24 GMT

X-NWS-UUID-VERIFY: c89959eb27b89a0fb1c0326d1b2e7171

Accept-Ranges: bytes

ETag: "1bb6cc2c28a5621cf0c3238107edc229"

x-cos-error-code: NoSuchKey

x-cos-error-detail-Key: aa

x-cos-error-message: The specified key does not exist.

x-cos-request-id: NWRlM2Q4MzRfMzNhNzAzMDlfYTljZl8yNGU1NTgx

x-cos-trace-id: OGVmYzZiMmQzYjA2OWNhODk0NTRkMTBiOWVmMDAxODc0OWRkZjk0ZDM1NmI1M2E2MTRlY2MzZDhmNmI5MWI1OTQ5YWUxMjNkYTk3NzdjZmZlMDQzOTgxOThkOTNlOWFkOGJiN2YzOGQ5MDdjNGY0ODQ1MGIzYjUyMzg2NjFhNzc=

X-Daa-Tunnel: hop_count=2

X-NWS-LOG-UUID: 7c3fe80b-af9a-4e59-969b-10c8b3963a1d

X-Cache-Lookup: Hit From Upstream

X-Cache-Lookup: Hit From Upstream

因为 URLError 是 HTTPError 的父类，所以可以先选择捕获子类的错误，再去捕获父类的错误，这样对异常的处理更具针对性。

注意： 捕捉异常一般先捕捉子类异常，再捕捉父类异常。

所以我们可以更改下前面的异常捕捉的代码进行一些优化：

# 优化异常捕捉代码

try:

    response = request.urlopen('https://www.geekdigging.com/aa')

except error.HTTPError as e:

    print(e.reason, e.code, e.headers, sep='\n')

except error.URLError as e:

    print(e.reason)

else:

    print('Request Success!')

示例代码

本系列的所有代码小编都会放在代码管理仓库 Github 和 Gitee 上，方便大家取用。

示例代码-Github

示例代码-Gitee

参考

https://www.cnblogs.com/zhangxinqi/p/9170312.html

小白学 Python 爬虫（13）：urllib 基础使用（三）的更多相关文章

小白学 Python 爬虫（14）：urllib 基础使用（四）
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（15）：urllib 基础使用（五）
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（11）：urllib 基础使用（一）
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（12）：urllib 基础使用（二）
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（16）：urllib 实战之爬取妹子图
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（17）：Requests 基础使用
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（30）：代理基础
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（32）：异步请求库 AIOHTTP 基础入门
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
小白学 Python 爬虫（33）：爬虫框架 Scrapy 入门基础（一）
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...

随机推荐

[考试反思]0922csp-s模拟测试50：谜朦
这辈子第5个rank1,是在长期状态低迷再度偶遇傻逼出题人然后总算在下午而不是晚上考了一场试然后莫名其妙选对了头铁的题把其它暴力打满之后发现sdfz没有参加之后竞争减弱的综合结果. 说是在的其实这套 ...
《吊打面试官》系列-Redis终章_凛冬将至、FPX_新王登基
你知道的越多,你不知道的越多点赞再看,养成习惯前言 Redis在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在Redis的使用和原理方面对小伙伴们进行360°的刁难.作为一个在互联 ...
利用DI实现级联删除 - xms跨平台基础框架 - 基于.netcore
一.引言所谓级联删除是指删除一条记录后,附带关联记录也一起删除,比如删除客户后,联系人也一起删除: 以往我们会依赖于数据库表的外键约束,但存在着明显的问题,增加数据库压力.提示不友好.职责越界.事务 ...
2019年10月13日 linux习题 wangqingchao
1. GUN的含义是: GNU's Not UNIX . 2. Linux一般有3个主要部分:内核.命令解释层.实用工具. 3.POSIX是可携式操作系统接口的缩写,重点在规范核心与应用程序之间的接口 ...
K8S入门系列之集群二进制部署-->node篇(三)
node节点组件 docker kubelet kube-proxy kubernetes-server-linux-amd64.tar.gz(相关的这里都能找到二进制文件!) falnnel 1. ...
Linux软件包管理和磁盘管理实践
一.自建yum仓库,分别为网络源和本地源本地yum仓库的搭建就是以下三个步骤: 创建仓库目录结构上传相应的包到目录下,或者直接挂载光盘也行,如果挂载光盘,第三步就可以省略,因为光盘默认里有repo ...
关于GDAL读写Shp乱码的问题总结
目录 1. 正文 1.1. shp文件本身的编码的问题 1.2. 设置读取的编码方式 1.2.1. GDAL设置 1.2.2. 解码方式 1.2.3. 其他 2. 参考 1. 正文最近在使用GDAL ...
Java设计模式(20)：命令模式
本文源码:GitHub·点这里 || GitEE·点这里一.生活场景 1.场景描述智能电脑的品牌越来越多,由此诞生了一款电脑控制的APP,万能遥控器,用户在使用遥控器的时候,可以切换为自家电视的品 ...
网站搭建-windows 系统本地网站搭建 - IIS
上一章有提到IIS安装,现在打开它: 点击浏览,如果没有启动的话,先点击启动. ip先选好,第一个吧,本机的(IIS自己提供了初始网页的东西). 然后可以自己去https://www.freemoba ...
Fuzzy模糊推导(Matlab实现)
问题呈述在模糊控制这门课程中,学到了与模糊数学及模糊推理相关的内容,但是并不太清楚我们在选择模糊规则时应该如何处理,是所有的规则都需要由人手工选择,还是仅需要选择其中的一部分就可以了.因此,在课程示 ...

小白学 Python 爬虫（13）：urllib 基础使用（三）

引言

URLError

HTTPError

示例代码

参考

小白学 Python 爬虫（13）：urllib 基础使用（三）的更多相关文章

随机推荐

热门专题