【python 爬虫】fake-useragent Maximum amount of retries reached解决方案

前言

　　在用fake-useragent的时候发生报错，fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached

解决方案

下载临时 Json 文件，也可以手动下载，代码如下：

# fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached

# 下载： https://fake-useragent.herokuapp.com/browsers/0.1.11 并另存为：fake_useragent_0.1.11.json

import requests

url = "https://fake-useragent.herokuapp.com/browsers/0.1.11"

rsp = requests.get(url, stream=True)

with open('fake_useragent_0.1.11.json', 'wb') as f:

    for i in rsp.iter_content(chunk_size=1024):  # 边下载边存硬盘, chunk_size 可以自由调整为可以更好地适合您的用例的数字

        f.write(i)

2.拷贝临时 Json 文件，也可以手工操作的，代码如下：

# 最后将文件拷贝到临时目录中即可

import tempfile

tempfile.gettempdir()  # '/var/folders/35/dtbb__ln5k77vv3y0zbsgp8r0000gn/T'

import os

os.system('cp fake_useragent.json {}'.format(tempfile.gettempdir()))

# cp fake_useragent_0.1.11.json /var/folders/35/dtbb__ln5k77vv3y0zbsgp8r0000gn/T

# 返回0，说明成功；再去查看，显示文件存在

3.再次验证，代码如下：

from fake_useragent import UserAgent

print(UserAgent(verify_ssl=False).random)

Out [1]:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2227.0 Safari/537.36

【python 爬虫】fake-useragent Maximum amount of retries reached解决方案的更多相关文章

fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached解决方法！
UserAgent 就是用户代理,又叫报头,是一串字符串,相当于浏览器的身份证号,在利用爬虫爬取网站数据时,频繁更换它可以避免触发相应的反爬机制. fake-useragent对频繁更换UserAge ...
FakeUserAgentError('Maximum amount of retries reached') 彻底解决办法
报错: FakeUserAgentError('Maximum amount of retries reached') 禁用服务器缓存: ua = UserAgent(use_cache_server ...
python爬虫之User-Agent用户信息
python爬虫之User-Agent用户信息爬虫是自动的爬取网站信息,实质上我们也只是一段代码,并不是真正的浏览器用户,加上User-Agent(用户代理,简称UA)信息,只是让我们伪装成一个浏览 ...
Python爬虫动态User-Agent
下载库fake_useragent 然后就可以随心所欲的使用不同UA了
Python爬虫之反爬虫---使用随机User-Agent
在编写爬虫时,大多数情况下,需要设置请求头.而在请求头中,随机更换User-Agent可以避免触发相应的反爬机制. 使用第三方库fake-useragent便可轻松生成随机User-Agent. 使用 ...
python爬虫之urllib库（一）
python爬虫之urllib库(一) urllib库 urllib库是python提供的一种用于操作URL的模块,python2中是urllib和urllib2两个库文件,python3中整合在了u ...
python爬虫之认识爬虫和爬虫原理
python爬虫之基础学习(一) 网络爬虫网络爬虫也叫网络蜘蛛.网络机器人.如今属于数据的时代,信息采集变得尤为重要,可以想象单单依靠人力去采集,是一件无比艰辛和困难的事情.网络爬虫的产生就是代替人 ...
python爬虫之如何随机更换User-Agent
python爬虫爬取网站内容时,如果什么也没带,即不带报头headers,往往会被网站管理维护人员认定为机器爬虫.因为,此时python默认的user-agent如Python-urllib/2.1一 ...
python爬虫之反爬虫（随机user-agent，获取代理ip，检测代理ip可用性）
python爬虫之反爬虫(随机user-agent,获取代理ip,检测代理ip可用性) 目录随机User-Agent 获取代理ip 检测代理ip可用性随机User-Agent fake_usera ...

随机推荐

mac OS 查看开机/关机/重启记录
last 查看最近的开关机.登录用户等记录以及操作时间节点. last | grep reboot 查看重启记录 last | grep shutdown 查看关机记录
Get on the CORBA
from: <The Common Object Request Broker: Architecture and Specification> Client To make a requ ...
phpsocket.io
https://github.com/walkor/phpsocket.io phpsocket.io A server side alternative implementation of sock ...
Android 讯飞语音听写SDK快速接入（附空指针解决和修改对话框文字方法）
1.账号准备工作首先要有一个讯飞的账号啦,为后面申请APPID.APPKey等东西做准备.顺带一提:讯飞对不同认证类型用户开放的SDK的使用次数是有不同的,详情如下图. 账号申请完成后,需要去你自 ...
CSS躬行记（9）——网格布局
网格布局(Grid Layout)也叫栅格布局,与表格布局类似,也依赖行和列.但与之不同的是,网格布局能直接控制HTML文档中元素的顺序.位置和大小等,而不用再借助辅助元素. 一.术语下图展示了CS ...
ssrf爆破mysql
php ssrf 代码<?php $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $_GET['url']); #curl_setopt($ch ...
EditPlus编辑java代码常规配置
LDheatmap | SNP连锁不平衡图（LD）可视化，自己数据实现版！
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/Gl6BChxSYbSHMo9oMpufPg 连锁不平衡图,用来可视化不同SNP之间的连锁程度,前同事间俗称“倒三角”图 ...
shell命令之巧用cut
需求:取出日志中ip字段,并进行统计排序 .一般用用awk命令假如ip地址为第一个字段那么 awk ‘{print $1}’ 文件名 |sort |uniq -c|sort-nr 那如果不是第一个 ...
201771010113 李婷华《面向对象程序设计（Java）》第十七周总结
一.理论知识部分 Java 的线程调度采用优先级策略:优先级高的先执行,优先级低的后执行:多线程系统会自动为每个线程分配一个优先级,缺省时,继承其父类的优先级: 任务紧急的线程,其优先级较高: 同优先 ...

【python 爬虫】fake-useragent Maximum amount of retries reached解决方案

【python 爬虫】fake-useragent Maximum amount of retries reached解决方案的更多相关文章

随机推荐

热门专题