urllib 库的代替品 requests 的用法

Requuests 官方的介绍时多么的霸气，之所以那么霸气，是因为 Requestts 相比于 urllib 在使用方面上会让开发者感到更加的人性化、更加简洁、更加舒适，并且国外的一些公司也在使用requests库。

看看他又那些特性：

　　。Keep-Alive & 连接池

　　。国际化域名和 URI

　　。带持久 Cookie 的会话

　　。浏览器式的 SSL认证

　　。自动内容解码

　　。基本/摘要式的身份认证

　　。优雅的key/value Cookie

　　。自动解压

　　。Unicode 响应体

　　。HTTP(S)代理支持

　　。文件分块上传

　　。流下载

　　。连接超时

·　　。分块请求

　　。支持.netrc

1、简单的专抓取页面

import requests

# 使用 get 请求方式

response = requests.get("https://tieba.baidu.com/")

print(response.text)

# 使用 post 方式请求
response = requests.post("https://tieba.baidu.com/")
print(response.text)

2、使用代理

　　有些网站做了浏览器频率限制。如果我们请求该网站频率过高，该网站会封掉我们的 IP，禁止我们的访问，所以我们需要使用代理来突破这“枷锁”。这里需要用到 proxies参数，proxies 也是一个字典类型。具体用法如下

imports

url = "http://tieba.baidu.com/"

proxies = {

       "http":"web-proxy.oa.com:8080",

        "https":"web-proxy.oa.com:8080"

       # 若你的代理需要使用 HTTP Basic Auth，可以使用 http：//password@host/语法

}

response = requests.get(url, proxies = proxies)

print(response.text)

print(response.url)

3、使用 Cookie

　　　想在响应结果中获取 cookie 的一些值，可以直接访问。

response。cookies['key'] # key 为 Cookie 字典中键

　　想发送 cookie 到服务器，可以使用 cookies 参数。同样该参数是字典类型

url = ‘http://httpin.org/cookies/'

cookies = {"domain":'httpin.org',}

response = requests.get(url, cookies = cookies)

print(response.text)

urllib 库的代替品 requests 的用法的更多相关文章

python爬虫---urllib库的基本用法
urllib是python自带的请求库,各种功能相比较之下也是比较完备的,urllib库包含了一下四个模块: urllib.request 请求模块 urllib.error 异常处理模块 u ...
一起学爬虫——urllib库常用方法用法总结
1.读取cookies import http.cookiejar as cj,urllib.request as request cookie = cj.CookieJar() handler = ...
Python爬虫入门之Urllib库的高级用法
1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...
Python爬虫Urllib库的高级用法
Python爬虫Urllib库的高级用法设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Head ...
Python3 urllib库和requests库
1. Python3 使用urllib库请求网络 1.1 基于urllib库的GET请求请求百度首页www.baidu.com ,不添加请求头信息: import urllib.requests d ...
Python爬虫入门（3-4）：Urllib库的高级用法
1.分分钟扒一个网页下来怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS.CS ...
Python爬虫入门四之Urllib库的高级用法
1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...
转 Python爬虫入门四之Urllib库的高级用法
静觅 » Python爬虫入门四之Urllib库的高级用法 1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我 ...
python关于urllib库与requests
对于这两个库来说个人推荐使用requests库下面用实例来说明 urllib库: requests库: 实现同样功能: 实现同样的功能下urllib比request步骤更复杂,这个对于我们编程来说是 ...

随机推荐

opencv编译静态库时选择MD模式无效的原因
在Cmake-gui上看到的明明是MD运行库依赖,生成MS项目时却变成了MT运行库依赖. 原因在于编译静态库时内部做了自动替换.
删除设备和驱动器中的PPS、百度云、360云盘图标
1.win+R,regedit打开注册表 2.找到 HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Explorer\MyCom ...
opencv python：直线检测与圆检测
霍夫直线变换介绍霍夫圆检测现实中: example import cv2 as cv import numpy as np # 关于霍夫变换的相关知识可以看看这个博客:https://blog.c ...
lucky 的时光助理（3）
今天lucky小姐哭笑不得的说, 昨天下班时跟经理一起走的时候, 地铁站手机被小偷偷走,那时一个人孤单单的,除了惊愕, 她不知道该去联系谁, 借了同事的手机,给家里打去电话. 她说,因为那是她唯一记得 ...
ELK日志分析系统部署
======================================================================================= 操作系统 IP地址主机 ...
最新版自动检测卡片类型工具软件版本(auto check card type v3.2.0)
自动检测卡片类型工具软件. 卡片放到读卡器上面自动识别卡片类型,不需老是按下按钮,好用,方便.支持自动识别NTAG213卡片,NTAG215卡片, NTAG216卡片,Ultralight芯片, Ul ...
「CF891C」Envy
传送门 Luogu 解题思路考虑最小生成树的几个性质: 所有最小生成树中边权相等的边的条数相等在任意一颗最小生成树中,边权相等的边所联通的点集一定那么我们考虑把边权相等的边单独拿出来考虑. 每次 ...
pikachu-搜索型注入 #手工注入
1.搜索型注入漏洞产生的原因: 在搭建网站的时候为了方便用户搜索该网站中的资源,程序员在写网站脚本的时候加入了搜索功能,但是忽略了对搜索变量的过滤,造成了搜索型注入漏洞,又称文本框注入. 2.搜索型注 ...
利用 systemd 实现 Clash 开机自启
利用 systemd 实现 Clash 开机自启首先准备 Clash 的服务脚本,并保存为/etc/systemd/system/clash.service.内容如下: [Unit] Descrip ...
Nmap工具用法详解
Nmap Network Mapper 是一款开放源代码的网络探测和安全审核工具 1.介绍

urllib 库的代替品 requests 的用法

urllib 库的代替品 requests 的用法的更多相关文章

随机推荐

热门专题