requests 介绍

一. requests 参数

- method:  提交方式

            - url:     提交地址

            - params:  在URL中传递的参数,GET

            - data:    在请求体里传递的数据

            - json     在请求体里传递的数据

            - headers  请求头

            - cookies  Cookies

            - files    上传文件

            - auth     基本认知(headers中加入加密的用户名和密码)

            - timeout  请求和响应的超市时间

            - allow_redirects  是否允许重定向

            - proxies  代理

            - verify   是否忽略证书

            - cert     证书文件

            - stream   村长下大片

            - session: 用于保存客户端历史访问信息

a. url

. 分析url

    - https://www.baidu.com/s?wd=美女 = https://www.baidu.com/s?wd=%E7%BE%8E%E5%A5%B3

    - 导入from urllib.parse import urlencode

. 分析请求头headers

    - User-Agent

. Get请求不需要考虑请求体

import requests

from urllib.parse import urlencode

search_input = input(">>: ")

keyword = urlencode({"wd":search_input},encoding="utf-8")

url = "url = https://www.baidu.com/s?" + keyword

requests.get(url,

             headers={

                "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"

             }

             )

b. params

# params 参数省去自己转换

import requests

from urllib.parse import urlencode

search_input = input(">>: ")

requests.get("https://www.baidu.com/s?",

             params={"wd":search_input},

             headers={

                "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"

             }

             )

c. headers

ddd

d. cookies

e. file 发送文件

import requests

requests.post(

    url='xxx',

    filter={

        'name1': open('a.txt','rb'),   #名称对应的文件对象

        'name2': ('bbb.txt',open('b.txt','rb'))     #表示上传到服务端的名称为 bbb.txt

    }

)

f. auth 认证

#配置路由器访问192.168.0.1会弹出小弹窗,输入用户名,密码 点击登录不是form表单提交,是基本登录框，这种框会把输入的用户名和密码 经过加密放在请求头发送过去

import requests

requests.post(

    url='xxx',

    filter={

        'name1': open('a.txt','rb'),   #名称对应的文件对象

        'name2': ('bbb.txt',open('b.txt','rb'))     #表示上传到服务端的名称为 bbb.txt

    }

)

g. stream 流

#如果服务器文件过大,循环下载

def param_stream():

    ret = requests.get('http://127.0.0.1:8000/test/', stream=True)

    print(ret.content)

    ret.close()

    # from contextlib import closing

    # with closing(requests.get('http://httpbin.org/get', stream=True)) as r:

    # # 在此处理响应。

    # for i in r.iter_content():

    # print(i)

h. session 和django不同事例：简化抽屉点赞

    import requests

    session = requests.Session()

    ### 1、首先登陆任何页面，获取cookie

    i1 = session.get(url="http://dig.chouti.com/help/service")

    ### 2、用户登陆，携带上一次的cookie，后台对cookie中的 gpsd 进行授权

    i2 = session.post(

        url="http://dig.chouti.com/login",

        data={

            'phone': "",

            'password': "xxxxxx",

            'oneMonth': ""

        }

    )

    i3 = session.post(

        url="http://dig.chouti.com/link/vote?linksId=8589623",

    )

    print(i3.text)

二. 登录事例

a. 查找汽车之家新闻标题链接图片写入本地

b. 抽屉点赞获取页面和登录都会获取gpsd 点赞会使用获取页面的gpsd 而不是登录的gpsd

c. 登录github 携带cookie登录

d. 登录github 演示

一. 先获取页面

	1.请求的url: https://github.com/login

	2.请求方法: GET

	3.请求头分析

		- 清除cookie，发现请求头里没有cookie，所以不要写

		- User-Aget

	4.服务端可能相应头带点东西

		- 例如规定提交表单时必须携带cookie

		- 有可能发送客户端一个csrftoken编码，第二次提交时必须携带csrftoken

二. 提交表单完成请求

	1.请求url: https://github.com/session

	2.请求方法: POST

	3.请求头分析

		- Referer: https://github.com/

		- User-Agent: "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"

		- cookies

	4.请求体

		commit: Sign in

		utf8: ✓

		authenticity_token: HIHg6UxhecIFqAGrHiGapG4y+8OShE6xJhJHU6wxg3mTo30JhYiENFu+JWtdFSj//5cCx6NaMEgcnsvF5MA8VQ==

		#分析authenticity_token数据，只可能是第一次访问，相应头或相应体发过来的数据

		login: 877252373@qq.com

		password: 123456

	5.分析第一次请求获取到的authenticity_token

		- 在相应头中找不到

		- 在相应体中找

	6.结果为最后的跳转结果

import requests

import re

# 第一次请求

response_get = requests.get("https://github.com/login",

                        headers={

                            "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"

                        })

authenticity_token = re.findall(r"authenticity_token.*?value=\"(.*?)\"",response_get.text,re.S)[]

response_cookie = response_get.cookies.get_dict()

# 第二次登录

response_post = requests.post("https://github.com/session",

            headers = {

                "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36",

                "Referer":"https://github.com/",

            },

            cookies = response_cookie,

            data={

                "commit": "Sign in",

                "utf8": "✓",

                "authenticity_token": authenticity_token,

                "login": "8772 @ qq.com",

                "password": ""

            })

print(response_post.text)

沛齐

requests 介绍的更多相关文章

Python requests介绍之接口介绍
Python requests介绍引用官网介绍 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. Requests 允许你发送纯天然,植物饲养的 HTTP/1. ...
1)requests模块
一:requests 介绍 requests 是使用 Apache2 Licensed 许可证的基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装, 从而使得Pyt ...
Python 网络请求模块 urllib 、requests
Python 给人的印象是抓取网页非常方便,提供这种生产力的,主要依靠的就是 urllib.requests这两个模块. urlib 介绍 urllib.request 提供了一个 urlopen 函 ...
python爬虫项目（新手教程）之知乎（requests方式）
-前言之前一直用scrapy与urllib姿势爬取数据,最近使用requests感觉还不错,这次希望通过对知乎数据的爬取为各位爬虫爱好者和初学者更好的了解爬虫制作的准备过程以及requests请求 ...
Python ImportError: No module named 'requests'解决方法
前言:最近在学习python,安装了python3.5的环境后,在网上下载了一个python文件运行的时候,提示ImportError: No module named 'requests'(找不到r ...
爬虫（1）：requests模块
requests介绍: reqeusts模块:python原生一个基于网络请求的模块,模拟浏览器发起请求. requests模块的优点: - 1.自动处理url编码 - 2.自动处理post请求的参数 ...
Python Requests 速通爆肝、这么牛逼的库你还不会用吗？
上网原理爬虫原理 Get.Post Requests 介绍安装常用方法 Http协议开发者工具网络界面 Response对象下载保存一张图片.一首音乐添加Headers发送请求判断HTT ...
Python爬虫的起点
第一章主要讲解爬虫相关的知识如:http.网页.爬虫法律等,让大家对爬虫有了一个比较完善的了解和一些题外的知识点. 今天这篇文章将是我们第二章的第一篇,我们从今天开始就正式进入实战阶段,后面将会有更多 ...
Python---网络爬虫初识
1. 网络爬虫介绍来自wiki的介绍: 网络爬虫(英语:web crawler),也叫网上蜘蛛(spider),是一种用来自动浏览万维网的网络机器人. 但是我们在写网络爬虫时还要注意遵守网络规则,这 ...

随机推荐

【BZOJ1391】Order（网络流，最小割）
[BZOJ1391]Order(网络流,最小割) 题面 BZOJ权限题... 良心洛谷题目描述有N个工作,M种机器,每种机器你可以租或者买过来. 每个工作包括若干道工序,每道工序需要某种机器来完成 ...
应用程序的日志通过rsyslog推送到syslog服务器
centos5系列系统自带为syslog1.4.1 centos6系列自带rsyslog版本为5.8.10 centos7系列自带rsyslog版本为7.4.7 目前最新版rsyslog为8.27.0 ...
【转载】 HDU 动态规划46题【只提供思路与状态转移方程】
1.Robberies 连接 :http://acm.hdu.edu.cn/showproblem.php?pid=2955 背包;第一次做的时候把概率当做背包(放大100000倍化为整数) ...
米勒罗宾素性测试（Miller–Rabin primality test）
如何判断一个素是素数效率很高的筛法打个表 (素数的倍数一定是合数) 就可以解决问题. 筛选法的效率很高,但是遇到大素数就无能为力了. 米勒罗宾素性测试是一个相当著名的判断是否是素数的算法核心为费 ...
django 自定义认证
在Django中自定义身份验证 Django 自带的认证系统足够应付大多数情况,但你或许不打算使用现成的认证系统.定制自己的项目的权限系统需要了解哪些一些关键点,即Django中哪些部分是能够扩展或替 ...
（二）SMO算法
11 SMO优化算法(Sequential minimal optimization) SMO算法由Microsoft Research的John C. Platt在1998年提出,并成为最快的二次规 ...
Canny边缘检测算法原理及其VC实现详解(一)
转自:http://blog.csdn.net/likezhaobin/article/details/6892176 图象的边缘是指图象局部区域亮度变化显著的部分,该区域的灰度剖面一般可以看作是一个 ...
Calculating and saving space in PostgreSQL
Q: I have a table in pg like so: CREATE TABLE t ( a BIGSERIAL NOT NULL, -- 8 b b SMALLINT, -- 2 b c ...
poj3421 X-factor Chains
X-factor Chains Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 7733 Accepted: 2447 D ...
Java的StringAPI的小练习
//-------------String类-------------- //求两个字符串的最大相同子串 /* 思路: 1.找出较短的那个字符串 2.找出短串的所有子串,使用contains函数判断是 ...

requests 介绍

一. requests 参数

二. 登录事例

requests 介绍的更多相关文章

随机推荐

热门专题