requests 后续1

发送带数据post请求

import requests

# 发送post请求

data = {

}

response = requests.post(url, data=data)

# 内网 需要 认证

auth = (user,pwd)

response = requests.get(url,auth=auth)

发送代理post请求

import requests

# 1.请求url

url = 'http://www.baidu.com'

headers = {

    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'

}

free_proxy = {'http': '27.17.45.90:43411'}

response = requests.get(url=url, headers=headers, proxies=free_proxy)

print(response.status_code)

发送带CA证书认证post请求

import requests

url = 'https://www.12306.cn/mormhweb/'

headers = {

    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'

}

# 因为hhtps  是有第三方 CA 证书认证的

# 但是 12306  虽然是https 但是 它不是 CA证书, 他是自己 颁布的证书

# 解决方法 是: 告诉 web 忽略证书 访问

response = requests.get(url=url, headers=headers, verify=False)

data = response.content.decode()

with open('03-ssl.html', 'w') as f:

    f.write(data)

# requests.exceptions.SSLError: HTTPSConnectionPool(host=

发送带cookie(字符串)post请求

import requests

# 请求数据url

member_url = 'https://www.yaozh.com/member/'

headers = {

    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'

}

#  cookies 的字符串

cookies = '_ga=GA1.2.1820447474.1535025127; MEIQIA_EXTRA_TRACK_ID=199Tty9OyANCXtHaSobJs67FU7J; WAF_SESSION_ID=7d88ae0fc48bffa022729657cf09807d; PHPSESSID=70kadg2ahpv7uuc8docd09iat4; _gid=GA1.2.133568065.1540383729; _gat=1; MEIQIA_VISIT_ID=1C1OdtdqpgpGeJ5A2lCKLMGiR4b; yaozh_logintime=1540383753; yaozh_user=381740%09xiaomaoera12; yaozh_userId=381740; db_w_auth=368675%09xiaomaoera12; UtzD_f52b_saltkey=ylH82082; UtzD_f52b_lastvisit=1540380154; UtzD_f52b_lastact=1540383754%09uc.php%09; UtzD_f52b_auth=f958AVKmmdzQ2CWwmr6GMrIS5oKlW%2BkP5dWz3SNLzr%2F1b6tOE6vzf7ssgZDjhuXa2JsO%2FIWtqd%2FZFelWpPHThohKQho; yaozh_uidhas=1; yaozh_mylogin=1540383756; MEIQIA_EXTRA_TRACK_ID=199Tty9OyANCXtHaSobJs67FU7J; WAF_SESSION_ID=7d88ae0fc48bffa022729657cf09807d; Hm_lvt_65968db3ac154c3089d7f9a4cbb98c94=1535025126%2C1535283389%2C1535283401%2C1539351081%2C1539512967%2C1540209934%2C1540383729; MEIQIA_VISIT_ID=1C1OdtdqpgpGeJ5A2lCKLMGiR4b; Hm_lpvt_65968db3ac154c3089d7f9a4cbb98c94=1540383761'

# 需要的是 字典类型

cook_dict = {}

cookies_list = cookies.split('; ')

for cookie in cookies_list:

    cook_dict[cookie.split('=')[0]] = cookie.split('=')[1]

# 字典推导式

cook_dict = {cookie.split('=')[0]:cookie.split('=')[1] for cookie in cookies.split('; ')}

response = requests.get(member_url, headers=headers, cookies=cook_dict)

data = response.content.decode()

with open('05-cookie.html','w') as f:

    f.write(data)

发送post请求(自动携带session)

import requests

# 请求数据url

member_url = 'https://www.yaozh.com/member/'

headers = {

    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'

}

# session 类 可以自动保存cookies === cookiesJar

session = requests.session()

# 1.代码登录

login_url = 'https://www.yaozh.com/login'

login_form_data = {

    'username':'aoa1',

    'pwd': 'l812',

    'formhash': '54AEE419',

    'backurl': 'https%3AF%2Fwww.yaozh.com%2F',

}

login_response = session.post(login_url,data=login_form_data,headers=headers)

print(login_response.content.decode())

# 2.登录成功之后 带着 有效的cookies 访问 请求目标数据

data = session.get(member_url,headers=headers).content.decode()

with open('05-cookie2.html','w') as f:

    f.write(data)

正则表达式

import re

# 贪婪模式  从开头匹配到结尾 默认  'm(.*)n'

# 非贪婪  'm(.*?)n'

one = 'mdfsdsfffdsn12345656n'

two = "a\d"

pattern = re.compile('a\b')

# pattern = re.compile('m(.*?)n')

result = pattern.findall(two)

print(result)

.匹配除换行符号\n 之外的

import re

# . 除了 换行符号\n 之外的 匹配

#   re.S忽略\n

#   re.I忽略大小写

one = """

    msfdsdffdsdfsn

    1234567778888N

"""

pattern = re.compile('m(.*)n', re.S | re.I)

result = pattern.findall(one)

print(result)

匹配数字

import re

# 纯数字的正则 \d 0-9之间的一个数

pattern = re.compile('^\d+$')

one = ''

# 匹配判断的方法

# match 方法 是否匹配成功 从头开始 匹配一次

result = pattern.match(one)

print(result.group())

范围匹配

import re

# 范围运算 [123] [1-9]

one = ''

pattern = re.compile('[1-9]')

result = pattern.findall(one)

print(result)

import re

one = 'abc 123'

patter = re.compile('\d+')

# match 从头匹配 匹配一次

result = patter.match(one)

# search 从任意位置 , 匹配一次

result = patter.search(one)

# findall  查找符合正则的 内容 -- list

result = patter.findall(one)

# sub  替换字符串

result = patter.sub('#',one)

# split  拆分

patter = re.compile(' ')

result = patter.split(one)

print(result)

requests 后续1的更多相关文章

selenium登录163邮箱,得到cookie,requests后续请求
1.场景很多时候登录操作是比较复杂的,因为存在各种反爆破操作,以及为了安全性提交数据都会存在加密.如果要完全模拟代码去实现登录操作是比较复杂,并且该网站后续更新了登录安全相关功能,那么登录的模拟操作 ...
OkHttp 官方Wiki【设计思想】
官方Wiki之Calls 原文位置:https://github.com/square/okhttp/wiki/Calls The HTTP client's job is to accept you ...
#2020征文-开发板# 用鸿蒙开发AI应用（三）软件篇
目录: 前言 HarmonyOS 简介 DevEco Device Tool(windows下) 获取源码(切换到ubuntu) 烧录程序(切换回windows) 前言上一篇,我们在 Win10 上用 ...
爬虫requests模块 1
让我们从一些简单的示例开始吧. 发送请求¶ 使用 Requests 发送网络请求非常简单. 一开始要导入 Requests 模块: >>> import requests 然后,尝试 ...
python Requests模块的简要介绍
Requests的安装: pip install Requests Requests的使用: import requests url = "http://www.mzitu.com" ...
requests高级用法
会话对象当你向同一主机发送多个请求时,session会重用底层的tcp连接,从而提升性能,同时session也会为所有请求保持 cookie. # _*_ coding: utf-8 _*_ imp ...
python非转基因HTTP请求库--Requests: 让 HTTP 服务人类
快速上手迫不及待了吗?本页内容为如何入门 Requests 提供了很好的指引.其假设你已经安装了 Requests.如果还没有,去安装一节看看吧. 首先,确认一下: Requests 已安装 Req ...
python+requests+unittest API接口测试
黑熊再网上查找了下接口测试相关的资料,大都重点是以数据驱动的形式,见用例维护在文本或表格中,而没有说明怎么样去生成想要的用例, 问题: 测试接口时,比如参数a,b,c,我要先测a参数,有(不传,为空, ...
requests和BeautifulSoup
一:Requests库 Requests is an elegant and simple HTTP library for Python, built for human beings. 1.安装 ...

随机推荐

c#可自定义码表的base64加密解密算法类
000 using System; using System.Collections.Generic; using System.Linq; using System.Text; using Syst ...
前端dom操作竟然使得http请求的时间延长了
最近在项目中遇到了一个奇怪的问题:在google浏览器的调试窗口network下看到一个请求的时间一直是2s多,但是当我把这个请求单独拿出来执行的时候发现根本用不了2s,100多毫秒就完成了.最后再不 ...
day19-1 迭代器,三元表达式,列表推导式,字典生成式,
目录迭代器可迭代对象迭代器对象总结三元表达式(三目表达式) 列表推导式字典生成式迭代器可迭代对象拥有iter方法的对象就是可迭代对象 # 以下都是可迭代的对象 st = '123'. ...
freeswitch mod_xml_curl
(猜想)调用htttp 进行动态用户注册流程用户通过客户端进行注册填写sip账号密码进入fs, fs发送http请求配置得地址,request中带着user,key 一些参数, 服务器返回xm ...
Flask入门系列（转载）
一.入门系列: Flask入门系列(一)–Hello World 项目开发中,经常要写一些小系统来辅助,比如监控系统,配置系统等等.用传统的Java写,太笨重了,连PHP都嫌麻烦.一直在寻找一个轻量级 ...
Python-基础-day6
1.二进制前言:计算机一共就能做两件事:计算和通信 2.字符编码生活中的数字要想让计算机理解就必须转换成二进制.十进制到二进制的转换只能解决计算机理解数字的问题,那么文字要怎么让计算机理解呢? 于 ...
Cygwin（类UNIX模拟环境）&CURL（强大的http命令行工具）
前言: 需要我用curl试下能否发送post请求调起公司的仿真系统(目前) 跟着大佬的脚步,亲测一把~ 感谢大佬的提供的博客和指导 @咩神个人博客园及来源地址 Cygwin(类UNIX模拟环境) 一 ...
JS冒泡排序方法
datalist标签输入框候选
H5的datalist标签,可以给input输入框提供下拉选择列表,或输入提示功能. 写如下的datalist标签 <datalist id="car"> <op ...
IntelliJ IDEA启动spring boot项目出现Failed to start component [StandardEngine[Tomcat].StandardHost[localhost].TomcatEmbeddedContext[]]
IntelliJ IDEA启动spring boot项目出现Failed to start component [StandardEngine[Tomcat].StandardHost[localho ...

requests 后续1

requests 后续1的更多相关文章

随机推荐

热门专题