kv = {'key1':'value1','key2':'value2'}
r = requests.request (' GET' , 'http://python123.io/ws' , params =kv)
print(r.url)

'''

requests.request(methid,url,**kwargs)

**kwargs:控制访问参数,均为可选项

params:字典或字节序列,作为参数增加到url中

'''

body = '主体内容'
r = requests.request('post','http://python123.io/ws' ,data=body) '''
**keargs:控制访问的参数,,均为可选项
data:字典、字节序列或文件对象,作为Request的内容
''' kv = {'key1':'valuel'}
r = requests.request('post','http://python123.io/ws',json=kv ) ''' **keargs:控制访问的参数,均为可选项
json:json格式的数据,作为request的内容
''' hd = {'user-agent':'Chrome/10'}
r = requests.request('post','http://python123.io/ws',headers=hd ) '''

**kwargs:控制访问参数,均为可选项

headers:字典,http定制头

作用:模拟任何想模拟的浏览器向服务器发起访问

'''

'''

其他**keargs

**kwargs:控制访问的参数,均为可选选项

cookies:字典或CookieJar,Request中的cookie

auth:元组,支持HTTP认证功能

'''

#**kwargs:控制访问参数,均为可选项

# files:字典类型,传输文件

#作用:向某一个链接 ,提交某一个文件,在特定条件下非常有用

fs = {'file':open('data.xls','rb')}

r = requests.request('POST','http://python123.io/ws',files = fs)

#**kwargs:控制访问参数,均为可选项

# timeout:设定超时时间,秒为单位

# 作用:再发起request请求时在设定时间内没有返回请求,将产生timeout的异常

r = requests.request('GET','http://www.baidu.com',timeout = 10)

#**kwargs:控制访问参数,均为可选项

#proxies:字典类型,设定访问代理服务器,可以增加登录认证

#作用:用代理服务器可以有效地隐藏用户,爬取网的原的ip地址信息,有效防止爬虫的逆追踪

pxs = {'http':'http:user:pass@10.10.10.1:1234'

    'http':'https:10.10.10.1:4321' }

r = requests.request('GET' , 'http://www.baidu.com',proxies=pxs)

'''

#**kwargs:控制访问参数,均为可选项

alloe_redirects:True/Fales,默认为True,重定向开关

stream:True/Fales, 默认为True,获取内容立即下载开关

verify:True/False,默认为True,认证SSL证书开关

cert:本地SSL证书路径

'''

'''

类比requests的方法

requests.get(url,params = None,**kwargs)

url:你获取页面的url链接

params:url中的额外参数,字典或字节流格式,可选

**kwargs:12个控制访问的参数

requests.head(url,**kwatgs)

url:拟获取页面的url链接

**kwargs:13个控制访问的参数

requests.post(url,data=None,json=None,**kwatgs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

json:JSON格式的数据,Request的内容

**kwargs:11个控制访问的参数

requests.put(url,data=None,**kwargs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

**kwargs:12个控制访问的参数

requests.patch(url,data=None,**kwargs)

url:拟更新页面的url链接

data:字典,字节序列或文件,Request的内容

**kwargs:12个控制访问的参数

requsets.delete(url,**kwargs)

url:拟删除页面的url链接

**kwatgs:13个控制访问的参数

'''

爬虫之request库主要解析---参照慕课北理工嵩天的更多相关文章

  1. 【学习笔记】PYTHON网络爬虫与信息提取(北理工 嵩天)

    学习目的:掌握定向网络数据爬取和网页解析的基本能力the Website is the API- 1 python ide 文本ide:IDLE,Sublime    Text集成ide:Pychar ...

  2. 转 #HTTP协议学习# (一)request 和response 解析

    http://www.cnblogs.com/bukudekong/p/3834020.html #HTTP协议学习# (一)request 和response 解析   注:本文转自:http:// ...

  3. 小白学 Python 爬虫(21):解析库 Beautiful Soup(上)

    小白学 Python 爬虫(21):解析库 Beautiful Soup(上) 人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前 ...

  4. 小白学 Python 爬虫(22):解析库 Beautiful Soup(下)

    人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前置准备(一)基本类库的安装 小白学 Python 爬虫(3):前置准备(二)Li ...

  5. 小白学 Python 爬虫(23):解析库 pyquery 入门

    人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前置准备(一)基本类库的安装 小白学 Python 爬虫(3):前置准备(二)Li ...

  6. 爬虫代码实现五:解析所有分页url并优化解析实现类

    如图,我们进入优酷首页,可以看到电视剧列表,我们称这个页面为电视剧列表页,而点击进入某个电视剧,则称为电视剧详情页.那么如何获取所有分页以及对应的详情页呢,通过下面的分页得到. 因此,首先,我们将St ...

  7. Scrapy爬虫入门Request和Response(请求和响应)

    开发环境:Python 3.6.0 版本 (当前最新)Scrapy 1.3.2 版本 (当前最新) 请求和响应 Scrapy的Request和Response对象用于爬网网站. 通常,Request对 ...

  8. python爬虫之request and BeautifulSoup

    1.爬虫的本质是什么? 模仿浏览器的行为,爬取网页信息. 2.requests 1.get请求 无参数实例 import requests ret = requests.get('https://gi ...

  9. 爬虫之request相关请求

    一.解析json格式数据 (1) # (1)解析json 对象数据 # import requests # 返回的数据进行解析 # response = requests.get('http://ht ...

随机推荐

  1. navicat for mysql ;连接数据库报错1251,解决办法。

    转载 改密码方式:用管理员身份打开cmd mysql -uroot -p(输入密码)            进入mysql执行下面三个命令 use mysql: ALTER USER 'root'@' ...

  2. Mybatis入门简版(补充)

    一.Mybatis 中$与#的区别 #相当于对数据 加上 双引号,$相当于直接显示数据 1. #将传入的数据都当成一个字符串,会对自动传入的数据加一个双引号.如:order by #user_id#, ...

  3. [Luogu3868] [TJOI2009]猜数字

    题目描述 现有两组数字,每组k个,第一组中的数字分别为:a1,a2,...,ak表示,第二组中的数字分别用b1,b2,...,bk表示.其中第二组中的数字是两两互素的.求最小的非负整数n,满足对于任意 ...

  4. [Tyvj Jan]青蛙跳荷叶

    题目限制 时间限制 内存限制 评测方式 题目来源 1000ms 131072KiB 标准比较器 Local 题目描述 从前,有一个小青蛙决定去荷叶上练习跳跃.现在有n个荷叶排成一排,小青蛙一开始在最左 ...

  5. Vulnhub靶场渗透练习(四) Acid

    利用namp 先进行扫描获取ip nmap  192.168.18.* 获取ip  没发现80端口 主机存活  猜测可以是个2000以后的端口 nmap -p1-65533 192.168.18.14 ...

  6. 面试必问:ACID/CAP

    转载: https://www.jdon.com/artichect/acid-cap.html ACID和CAP的详尽比较 事务机制ACID和CAP理论是数据管理和分布式系统中两个重要的概念,很不巧 ...

  7. Zookeeper - 什么是Zookeeper,以及zookeeper的安装(1)

    Zookeeper 什么是Zookeeper? 官网传送门 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的 ...

  8. 清理git仓库

    参考 https://harttle.land/2016/03/22/purge-large-files-in-gitrepo.html https://git-scm.com/docs/git-re ...

  9. OptimalSolution(7)--大数据和空间限制

    一.布隆过滤器 问题:不安全网页的黑名单包含100亿个黑名单网页,每个网页的URL最多占用64B.现在想要实现一种网页过滤系统,可以根据网页的URL判断该网页是否在黑名单上,如何设计该系统. 要求:允 ...

  10. OptimalSolution(1)--递归和动态规划(4)其他问题

    一.汉诺塔问题(包括chapter 1中的汉诺塔问题) 二. 三. 四. 五. 六. 七. 八.