本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes

1 简介

　　我们在编写程序尤其是与网络请求相关的程序，如调用web接口、运行网络爬虫等任务时，经常会遇到一些偶然发生的请求失败的状况，这种时候如果我们仅仅简单的捕捉错误然后跳过对应任务，肯定是不严谨的，尤其是在网络爬虫中，会存在损失有价值数据的风险。

　　这类情况下我们就很有必要为我们的程序逻辑添加一些错误重试的策略，费老师我在几年前写过文章介绍过Python中的retry库，但它功能较为单一，只能应对基本的需求。

　　而今天我要给大家介绍的tenacity库，可能是目前Python生态中最好用的错误重试库，下面就让我们一睹其主要功能吧~

2 tenacity中的常用功能

　　作为一个第三方Python库，我们可以使用pip install tenacity对其进行安装，安装完成后，下面我们来学习一下tenacity的主要使用方法和特性：

2.1 tenacity的基础使用

　　tenacity的错误重试核心功能由其retry装饰器来实现，默认不给retry装饰器传参数时，它会在其所装饰的函数运行过程抛出错误时不停地重试下去，譬如下面这个简单的例子：

import random

from tenacity import retry

@retry

def demo_func1():

    a = random.random()

    print(a)

    if a >= 0.1:

        raise Exception

demo_func1()

　　可以看到，我们的函数体内每次生成0到1之间的随机数，当这个随机数不超过0.1时才会停止抛出错误，否则则会被tenacity捕捉到每次的错误抛出行为并立即重试。

2.2 设置最大重试次数

　　有些时候我们对某段函数逻辑错误重试的忍耐是有限度的，譬如当我们调用某个网络接口时，如果连续n次都执行失败，我们可能就会认为这个任务本身就存在缺陷，不是通过重试就能有朝一日正常的。

　　这种时候我们可以利用tenacity中的stop_after_attempt函数，作为retry()中的stop参数传入，从而为我们“无尽”的错误重试过程添加一个终点，其中stop_after_attempt()接受一个整数输入作为最大重试的次数：

from tenacity import retry, stop_after_attempt

@retry(stop=stop_after_attempt(3))

def demo_func2():

    print('函数执行')

    raise Exception

demo_func2()

　　可以看到，我们的函数在限制了最大重试次数后，经过3次重试，在第4次继续执行依然抛出错误后，正式地抛出了函数中对应的Exception错误结束了重试过程。

2.3 设置重试最大超时时长

　　我们除了像上一小节中那样设置最大错误重试的次数之外，tenacity还为我们提供了stop_after_delay()函数来设置整个重试过程的最大耗时，超出这个时长也会结束重试过程：

import time

from tenacity import retry, stop_after_delay

# 设置重试最大超时时长为5秒

@retry(stop=stop_after_delay(5))

def demo_func3():

    time.sleep(1)

    print(f'已过去 {time.time() - start_time} 秒')

    raise Exception

# 记录开始时间

start_time = time.time()

demo_func3()

2.4 组合重试停止条件

　　如果我们的任务同时需要添加最大重试次数以及最大超时时长限制，在tenacity中仅需要用|运算符组合不同的限制条件再传入retry()的stop参数即可，譬如下面的例子，当我们的函数执行重试超过3秒或次数大于5次时均可以结束重试：

import time

import random

from tenacity import retry, stop_after_delay, stop_after_attempt

@retry(stop=(stop_after_delay(3) | stop_after_attempt(5)))

def demo_func4():

    time.sleep(random.random())

    print(f'已过去 {time.time() - start_time} 秒')

    raise Exception

# 记录开始时间

start_time = time.time()

demo_func4()

　　可以看到，在上面的演示中，先达到了“最大重试5次”的限制从而结束了重试过程。

2.5 设置相邻重试之间的时间间隔

　　有些情况下我们并不希望每一次重试抛出错误后，立即开始下一次的重试，譬如爬虫任务中为了更好地伪装我们的程序，tenacity中提供了一系列非常实用的函数，配合retry()的wait参数，帮助我们妥善处理相邻重试之间的时间间隔，其中较为实用的主要有以下两种方式：

2.5.1 设置固定时间间隔

　　我们通过使用tenacity中的wait_fixed()可以为相邻重试之间设置固定的等待间隔秒数，就像下面的简单示例那样：

import time

from tenacity import retry, wait_fixed, stop_after_attempt

# 设置重试等待间隔为1秒

@retry(wait=wait_fixed(1), stop=stop_after_attempt(3))

def demo_func5():

    print(f'已过去 {time.time() - start_time} 秒')

    raise Exception

# 记录开始时间

start_time = time.time()

demo_func5()

2.5.2 设置随机时间间隔

　　除了设置固定的时间间隔外，tenacity还可以通过wait_random()帮助我们为相邻重试设置均匀分布随机数，只需要设置好均匀分布的范围即可：

import time

from tenacity import retry, wait_random, stop_after_attempt

# 设置重试等待间隔为1到3之间的随机数

@retry(wait=wait_random(min=1, max=3), stop=stop_after_attempt(5))

def demo_func6():

    print(f'已过去 {time.time() - start_time} 秒')

    raise Exception

# 记录开始时间

start_time = time.time()

demo_func6()

　　可以观察到，每一次重试后的等待时长都是随机的~

2.6 自定义是否触发重试

　　tenacity中retry()的默认策略是当其所装饰的函数执行过程“抛出任何错误”时即进行重试，但有些情况下我们需要的可能是对特定错误类型的捕捉/忽略，亦或是对异常计算结果的捕捉。

　　tenacity中同样内置了相关的实用功能：

2.6.1 捕捉或忽略特定的错误类型

　　使用tenacity中的retry_if_exception_type()和retry_if_not_exception_type()，配合retry()的retry参数，我们可以对特定的错误类型进行捕捉或忽略：

from tenacity import retry, retry_if_exception_type, retry_if_not_exception_type

@retry(retry=retry_if_exception_type(FileExistsError))

def demo_func7():

    raise TimeoutError

@retry(retry=retry_if_not_exception_type(FileNotFoundError))

def demo_func8():

    raise FileNotFoundError

2.6.2 自定义函数结果条件判断函数

　　我们可以编写额外的条件判断函数，配合tenacity中的retry_if_result()，实现对函数的返回结果进行自定义条件判断，返回True时才会触发重试操作：

import random

from tenacity import retry, retry_if_result

@retry(retry=retry_if_result(lambda x: x >= 0.1))

def demo_func9():

    a = random.random()

    print(a)

    return a

# 记录开始时间

demo_func9()

2.7 对函数的错误重试情况进行统计

　　被tenacity的retry()装饰的函数，我们可以打印其retry.statistics属性查看其历经的错误重试统计记录结果，譬如这里我们对前面执行过的示例函数demo_func9()的统计结果进行打印：

demo_func9.retry.statistics

　　除了上述的功能之外，tenacity还具有很多特殊的特性，可以结合logging模块、异步函数、协程等其他Python功能实现更高级的功能，感兴趣的朋友可以前往https://github.com/jd/tenacity了解更多。

　　以上就是本文的全部内容，欢迎在评论区与我进行讨论~

（数据科学学习手札135）tenacity：Python中最强大的错误重试库的更多相关文章

（数据科学学习手札32）Python中re模块的详细介绍
一.简介关于正则表达式,我在前一篇(数据科学学习手札31)中已经做了详细介绍,本篇将对Python中自带模块re的常用功能进行总结: re作为Python中专为正则表达式相关功能做出支持的模块,提供 ...
（数据科学学习手札126）Python中JSON结构数据的高效增删改操作
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在上一期文章中我们一起学习了在Python ...
（数据科学学习手札136）Python中基于joblib实现极简并行计算加速
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介我们在日常使用Python进行各种数据计算 ...
（数据科学学习手札53）Python中tqdm模块的用法
一.简介 tqdm是Python中专门用于进度条美化的模块,通过在非while的循环体内嵌入tqdm,可以得到一个能更好展现程序运行过程的提示进度条,本文就将针对tqdm的基本用法进行介绍. 二.基本 ...
（数据科学学习手札54）Python中retry的简单用法
一.简介 retry是一个用于错误处理的模块,功能类似try-except,但更加快捷方便,本文就将简单地介绍一下retry的基本用法. 二.基本用法 retry: 作为装饰器进行使用,不传入参数时功 ...
（数据科学学习手札90）Python+Kepler.gl轻松制作时间轮播图
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 Kepler.gl作为一款强大的开源地理信 ...
（数据科学学习手札49）Scala中的模式匹配
一.简介 Scala中的模式匹配类似Java中的switch语句,且更加稳健,本文就将针对Scala中模式匹配的一些基本实例进行介绍: 二.Scala中的模式匹配 2.1 基本格式 Scala中模式匹 ...
（数据科学学习手札109）Python+Dash快速web应用开发——静态部件篇（中）
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介这是我的系列教程Python+Dash快速web ...
（数据科学学习手札25）sklearn中的特征选择相关功能
一.简介在现实的机器学习任务中,自变量往往数量众多,且类型可能由连续型(continuou)和离散型(discrete)混杂组成,因此出于节约计算成本.精简模型.增强模型的泛化性能等角度考虑,我们常 ...

随机推荐

Note -「动态 DP」学习笔记
目录「CF 750E」New Year and Old Subsequence 「洛谷 P4719」「模板」"动态 DP" & 动态树分治「洛谷 P6021」洪水「S ...
Solution -「AGC 019F」「AT 2705」Yes or No
\(\mathcal{Description}\) Link. 有 \(n+m\) 个问题,其中 \(n\) 个答案为 yes,\(m\) 个答案为 no.每次你需要回答一个问题,然后得知这个 ...
Solution -「LOJ #6485」 LJJ 学二项式定理
\(\mathcal{Description}\) Link. 给定 \(n,s,a_0,a_1,a_2,a_3\),求: \[\sum_{i=0}^n\binom{n}is^ia_{i\bm ...
Redis 源码简洁剖析 15 - AOF
AOF 是什么 AOF 持久化的实现命令追加 AOF 文件的写入和同步 AOF 文件的载入和数据还原 AOF 重写为什么需要重写什么是重写如何重写 AOF 后台重写为什么需要后台重写带来的 ...
C# 复杂类实例的相等判断
在比较两个对象是否完全相同时,对于string, int等其他value object,可以直接通过"=="或者"Equals"来进行判断.但是对于复杂类,如下 ...
Oracle导出/导入数据方法--两种方法（pde格式/dmp格式）
转至:https://www.cnblogs.com/houbxblogs/articles/13365557.html?ivk_sa=1024320u 1.导出数据方法一(pde格式) 工具→ 导出 ...
yum报错， yum相关配置信息，yum重装
docker源的问题 yum有很多错,比如网络问题,dns问题,timeout 错,还有不知道什么错误网上有很多,网络问题,dns问题,但是我ping www.baidu.com通,所以不是这个问题 ...
oj教程--队列
队列是一种特殊的线性表,特殊之处在于它只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作,和栈一样,队列是一种操作受限制的线性表.进行插入操作的端称为队尾,进行删除操作的 ...
tomcat启动错误：Error running 'Tomcat 9.0.34': Address localhost:1099 is already in use
解决方法博客地址:https://blog.csdn.net/weixin_46697202/article/details/105782670
Activity跳转显式方法及隐式方法
1 public class AActivity extends AppCompatActivity { 2 private Button btnJump; 3 @Override 4 protect ...

（数据科学学习手札135）tenacity：Python中最强大的错误重试库