Python随机UserAgent库，让你不再手动敲UA！

熊子q 2024-06-24 08:17:28 原文

前言

之前也懵懵懂懂写过python爬虫，但是经常被网站的反爬机制干趴下，然后手动写了个随机UA库，情况才好些。今天在互联网畅游时发现，有一个能够产生随机UA的第三方库！

安装第三方库

老生常谈啦，pip安装运行以下代码即可~

pip install fake-useragent

简单上手

简单上手很简单的，上代码~

from fake_useragent import UserAgent

ua = UserAgent()

print(ua.random)

# 输出：Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US) AppleWebKit/533.20.25 (KHTML, like Gecko) Version/5.0.3 Safari/533.19.4

ua.random就能产生一个随机UA了！这不禁让我想起了以前手动复制数个UA，然后再随机选择的代码...代码量蹭蹭的就下去了。

几十行->三行

正好体现了Python的简洁之美！

拓展（中文帮助文档）

fake-useragent： github

作者的信息概要也很精简：

Up to date simple useragent faker with real world database

帮助文档：

fake-useragent将会把收集到的数据存储在你的系统临时文件夹中，比如/temp

如果你想更新已有的数据库只需要这样：

from fake_useragent import UserAgent

ua = UserAgent()

ua.update()

如果你不想缓存数据库或者不生成写入文件：

from fake_useragent import UserAgent

ua = UserAgent(cache=False)

有时候， useragentstring.com or w3schools.com 更改他们的网址或者关闭网站，在这种情况下，fake-useragent 将会使用 heroku 的返回结果。

如果你不想使用托管缓存服务器：

from fake_useragent import UserAgent

ua = UserAgent(use_cache_server=False)

在非常罕见的情况下，如果托管的缓存服务器和源不可用，fake-useragent将无法下载数据:

from fake_useragent import UserAgent

ua = UserAgent()

# Traceback (most recent call last):

#   ...

# fake_useragent.errors.FakeUserAgentError

# You can catch it via

from fake_useragent import FakeUserAgentError

try:

    ua = UserAgent()

except FakeUserAgentError:

    pass

Python随机UserAgent库，让你不再手动敲UA！的更多相关文章

spider_使用随机User-Agent库，爬取笔趣阁万古天帝章节目录_(fake_useragent)
"""使用随机User-Agent库,爬取笔趣阁万古天帝章节目录"""import requestsfrom fake_useragent ...
python随机生成库faker库api详解
# -*- coding: utf-8 -*- # @Author : FELIX # @Date : 2018/6/30 9:49 from faker import Factory # zh_CN ...
Scrapy学习篇（十一）之设置随机User-Agent
大多数情况下,网站都会根据我们的请求头信息来区分你是不是一个爬虫程序,如果一旦识别出这是一个爬虫程序,很容易就会拒绝我们的请求,因此我们需要给我们的爬虫手动添加请求头信息,来模拟浏览器的行为,但是当我 ...
python爬虫之反爬虫（随机user-agent，获取代理ip，检测代理ip可用性）
python爬虫之反爬虫(随机user-agent,获取代理ip,检测代理ip可用性) 目录随机User-Agent 获取代理ip 检测代理ip可用性随机User-Agent fake_usera ...
Python爬虫之反爬虫---使用随机User-Agent
在编写爬虫时,大多数情况下,需要设置请求头.而在请求头中,随机更换User-Agent可以避免触发相应的反爬机制. 使用第三方库fake-useragent便可轻松生成随机User-Agent. 使用 ...
python3爬虫系列19之反爬随机 User-Agent 和 ip代理池的使用
站长资讯平台:python3爬虫系列19之随机User-Agent 和ip代理池的使用我们前面几篇讲了爬虫增速多进程,进程池的用法之类的,爬虫速度加快呢,也会带来一些坏事. 1. 前言比如随着我们爬虫 ...
python beautiful soup库的超详细用法
原文地址https://blog.csdn.net/love666666shen/article/details/77512353 参考文章https://cuiqingcai.com/1319.ht ...
Python 的 Numpy 库
Numpy: # NumPy库介绍 # NumPy的安装 #  NumPy系统是Python的一种开源的数值计算扩展 #  可用来存储和处理大型矩阵. #  因为不是Python的内嵌模块,因此 ...
设置随机 User-Agent
本文转载自以下网站: Scrapy 中设置随机 User-Agent 的方法汇总 https://www.makcyun.top/web_scraping_withpython14.html 一行代码 ...
Python爬虫—requests库get和post方法使用
目录 Python爬虫-requests库get和post方法使用 1. 安装requests库 2.requests.get()方法使用 3.requests.post()方法使用-构造formda ...

随机推荐

Python相关练习说明
Python练习情况说明 1.练习了在文件中进行统计的相关方法,基本操作其实差不多,步骤基本如下: # 1.打开相关文件,然后利用for循环进行按行读取的操作 # 2.读取的过程中,将读取到的数据加以 ...
VsCode里面在JavaWeb项目里面配置Maven环境详解
1.在之前已经新建完成一个JavaWeb项目的基础上开始 2.设置里面搜索Maven,找到这个,然后进行定位 3.将Tomcat Server配置进去(右上角有一个加号) (对于已经学过Java的并不 ...
J - Straight Master Gym - 101775J 差分
题意:纸牌顺子:连续的3张或连续的4张或连续的5张为顺子.手中的牌共有n个数字,每个数字是a[i]个,能不能把手中所有的牌都是属于顺子. 1 ≤ T ≤ 100. 1 ≤ N ≤ 2 × 105. 0 ...
利用selenium爬取前程无忧招聘数据
1.背景介绍 selenium通过驱动浏览器,模拟浏览器的操作,进而爬取数据.此外,还需要安装浏览器驱动,相关步骤自行解决. 2.导入库 import csv import random import ...
Mybatisplus----DML编程控制
乐观锁 (1)业务并发现象带来的问题:秒杀执行: 1.在类对象中添加version属性,在数据库表中添加version字段(默认值为1) package com.itheima.domain; im ...
vRealize Operations Manager 安全补丁修复
vRealize Operations Manager 安全补丁修复背景:记录一次安全同事在检测中发现 vRealize Operations Manager 存在安全漏洞,需要整改修复,于是到VM ...
Kafka 实现延迟队列、死信队列、重试队列
更多内容,访问 IT-BLOG Kafka中实现延迟队列在发送延时消息的时候并不是先投递到要发送的真实主题(real_topic)中,而是先投递到一些 Kafka 内部的主题(delay_topic ...
使用golang+antlr4构建一个自己的语言解析器（二）
Antlr4文件解析流程该图展示了一个语言应用程序中的基本流动过程输入一个字符流,首先经过词法分析,获取各个Token 然后经过语法分析,组成语法分析树 Antlr4语法书写规范语法关键字和使用 ...
[云计算]杂谈：SaaS与PaaS的产品经理，做产品设计时有什么区别？[摘]
本文摘自: 郝雨彤@碧岸久于 2022-09-20在社交平台中所表达的观点. 产品性质/类型服务领域服务对象(受众) 核心能力 SaaS 面向具体业务 (所属行业的)业务用户很看重对业务的理解 ...
[数据库]Oracle数据迁移至HIVE（待续）
step1 导出csv数据,并 call sql_to_csv('select * from BE_JJZKJCQKTJ', 'OUT_PATH', 'DA.BE_JJZKJCQKTJ.csv'); ...