爬虫入门 requests库

写在最前的具体资料：

　　https://2.python-requests.org//zh_CN/latest/user/quickstart.html

　　https://www.liaoxuefeng.com/wiki/1016959663602400/1183249464292448

　　http://cn.python-requests.org/zh_CN/latest/

以下为个人理解：

首先先列举一下requests库的方法，具体有.get() .head() .post() .put() .patch() .delete()。这些方法都是和HTTP协议的方法一一对应的。

get()方法可以获取全部资源，而head()方法仅仅是获取头部信息，post,put,patch方法可以将自己的资源放入url对应的位置上，delete()方法可以删掉这个url对应的现有资源

put和patch方法的区别是，put方法要把所有对应的资源全部提交一遍，而patch只需要提交需要修改的那个资源，而不需要像put一样提交所有对应的资源。post方法可以向服务器提交新增数据

request

requests库还有一种方法是request方法，即requests.request(method,url,**kwargs)。其中还有三个参数，method表示请求方法，对应HTTP协议的七种方法，url则对应的是url链接，即网址。**kwargs就是13种控制访问的参数，即

　　params（字典或者字节序列，可以作为参数添加到url中），

　　data（作为向服务提交数据时使用），

　　json（json格式的数据），

　　headers（可以用改字段来定义自己发起访问时http的头字段，可以用来模拟任何我们想模拟的浏览器向url发起请求），

　　 cookies（用来解析http中的cookies），

　　auth(元组，支持http认证功能)，

　　files（字典类型，传输文件时使用的字段），

　　proxies（字典类型，设定访问代理服务器，可以增加登录认证，可以有效的隐藏自己ip地址信息），

　　allow_redirects

　　stream（获取内容立即下载）

　　verify

　　cert（本地ssl证书路径）

　　timeout(超时)

request.get(url,parpams,**kwargs)与request相同使用的最多也是最关键

request.head(url,**kwargs)同上

request.post(url,data,json,**kwargs)和request中相同

request.put（url,data,**kwargs）同上

request.petch（url,data,**kwargs）同

request.delete(url,**kwargs) 同上

代码框架

　　import requests

　　url = 'http://www.baidu.com'
　　try:
  　　 #模拟浏览器
    　　kv = {'user-agent':'Mozilla/5.0'}
   　　 r = requests.get(url , headers = kv)
   　　 #状态码检查
   　　 r.raise_for_status()
   　　 r.encoding = r.apparent_encoding
   　　 print(r.text)
　　except:
   　　 ("爬取失败")

爬虫入门 requests库的更多相关文章

【Python爬虫】爬虫利器 requests 库小结
requests库 Requests 是一个 Python 的 HTTP 客户端库. 支持许多 HTTP 特性,可以非常方便地进行网页请求.网页分析和处理网页资源,拥有许多强大的功能. 本文主要介绍 ...
Python爬虫之requests库介绍(一)
一:Requests: 让 HTTP 服务人类虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 ...
python爬虫之requests库
在python爬虫中,要想获取url的原网页,就要用到众所周知的强大好用的requests库,在2018年python文档年度总结中,requests库使用率排行第一,接下来就开始简单的使用reque ...
爬虫相关--requests库
requests的理想:HTTP for Humans 一.八个方法相比较urllib模块,requests模块要简单很多,但是需要单独安装: 在windows系统下只需要在命令行输入命令 pip ...
Python爬虫：requests 库详解，cookie操作与实战
原文第三方库 requests是基于urllib编写的.比urllib库强大,非常适合爬虫的编写. 安装: pip install requests 简单的爬百度首页的例子: response.te ...
Python爬虫之requests库的使用
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 "HTTP for ...
爬虫值requests库
requests简介简介 Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库 ,使用起来比urllib简洁很多因为是第三方库, ...
（爬虫）requests库
一.requests库简介 urllib库和request库的作用一样,都是服务器发起请求数据,但是requests库比urllib库用起来更方便,它的接口更简单,选用哪种库看自己. 如果没有安装过这 ...
【Python爬虫】Requests库的基本使用
Requests库的基本使用阅读目录基本的GET请求带参数的GET请求解析Json 获取二进制数据添加headers 基本的POST请求 response属性文件上传获取cookie 会 ...

随机推荐

A*模板（求K短路）（POJ2449）
A*是bfs的优化,IDA*是dfs的优化 A*算法: 为启发式算法中很重要的一种,被广泛应用在最优路径求解和一些策略设计的问题中.而A*算法最为核心的部分,就在于它的一个估值函数的设计上: f(n) ...
xlrd模块-读取Execl表格
#xlrd模块读取execl表格 import xlrd Execl = xlrd.open_workbook(r'Z:\Python学习\python26期视频\day76(allure参数.读e ...
sift代码实现详解
1.创建高斯金字塔第-1组 1.1.将源图片转成灰度图 void ConvertToGray(const Mat& src, Mat& dst) { cv::Size size = s ...
java面试记录二：spring加载流程、springmvc请求流程、spring事务失效、synchronized和volatile、JMM和JVM模型、二分查找的实现、垃圾收集器、控制台顺序打印ABC的三种线程实现
注:部分答案引用网络文章简答题 1.Spring项目启动后的加载流程 (1)使用spring框架的web项目,在tomcat下,是根据web.xml来启动的.web.xml中负责配置启动spring ...
mysql 连接权限
命令解释: . 第一个表示库,第二个表示表; .对全部数据库的全部表授权,so.ok 表示只对so这个库中的ok表授权 root 表示要给哪个用户授权,这个用户可以是存在的用户,也可以是不存在的 '% ...
Mybatis的解析和运行原理
Mybatis的解析和运行原理 Mybatis的运行过程大致分为两大步:第一步,读取配置文件缓存到Configuration对象,用以创建 SqlSessionFactory:第二步,SqlSessi ...
【翻译】Facebook全面推出Watch Party，可多人线上同看直播视频
今天, Facebook全面推出Watch Party——多人共同观看直播功能,用户可以同时查看和评论同一视频. Watch Party先前已在群组中推出,并且正在测试其他类型的帐户.但现在任何个人资 ...
【你不知道的javaScript 上卷笔记5】javaScript中的this词法
function foo() { console.log( a ); } function bar() { var a = 3; foo(); } var a = 2; bar(); 上面这段代码为什 ...
Vue ui创建项目
vue-cli 3.0 版本为我们提供了集创建.管理.分析为一体的可视化界面vue UI,一个可视化项目管理器一.打开终端,安装最新vue-cli npm install -g @vue/cli ...
Wannafly Camp 2020 Day 7H 游戏 - 欧拉筛,GCD
忘记特判 \(1\) ,血了一地听说 \(O(n^2 \log n)\) 能过? #include <bits/stdc++.h> #define int long long using ...

爬虫入门 requests库

爬虫入门 requests库的更多相关文章

随机推荐

热门专题