爬虫2 urllib用法

from urllib import request,parse

# 1.    解析数据

# 解析一条

# response = request.urlopen(url='http://httpbin.org/get?username={}'.format(parse.quote('哈哈')))

# print(response.read())

# # 解析字典

# data1 = {

#     'username':'哈哈',

#     'pass' : 23564

# }

# res = parse.urlencode(data1)

# print(res)

# 2.    模拟请求头

# headers = {

#     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6721.400 QQBrowser/10.2.2243.400'，
#　　　　'Referer':'https://www.baidu.com/s?ie=utf-8&wd=%E5%9B%BE%E7%89%87'

# }

# req = request.Request(

#     url='http://img5.imgtn.bdimg.com/it/u=935292084,2640874667&fm=26&gp=0.jpg',

#     headers=headers

#     )

# response = request.urlopen(req)

# print(response.read())

# 3.    发送一个get请求

# response = request.urlopen(url='http://httpbin.org/get',timeout=0.1)

# 发送一个get请求

# response = request.urlopen(url='http://httpbin.org/get')

# print(response.getcode())         #返回码

# print(response.info())              #返回头部信息

# print(response.read())              #返回内容

# response2 = request.urlopen(url='http://httpbin.org/post',

#                             data = b'username=haha&password=12345'

爬虫2 urllib用法的更多相关文章

python爬虫之urllib库（一）
python爬虫之urllib库(一) urllib库 urllib库是python提供的一种用于操作URL的模块,python2中是urllib和urllib2两个库文件,python3中整合在了u ...
python 3.x 爬虫基础---Urllib详解
python 3.x 爬虫基础 python 3.x 爬虫基础---http headers详解 python 3.x 爬虫基础---Urllib详解前言爬虫也了解了一段时间了希望在半个月的时间内 ...
Python爬虫之urllib模块2
Python爬虫之urllib模块2 本文来自网友投稿作者:PG-55,一个待毕业待就业的二流大学生. 看了一下上一节的反馈,有些同学认为这个没什么意义,也有的同学觉得太简单,关于Beautiful ...
Python爬虫之urllib模块1
Python爬虫之urllib模块1 本文来自网友投稿.作者PG,一个待毕业待就业二流大学生.玄魂工作室未对该文章内容做任何改变. 因为本人一直对推理悬疑比较感兴趣,所以这次爬取的网站也是平时看一些悬 ...
python爬虫之urllib库（三）
python爬虫之urllib库(三) urllib库访问网页都是通过HTTP协议进行的,而HTTP协议是一种无状态的协议,即记不住来者何人.举个栗子,天猫上买东西,需要先登录天猫账号进入主页,再去 ...
python爬虫之urllib库（二）
python爬虫之urllib库(二) urllib库超时设置网页长时间无法响应的,系统会判断网页超时,无法打开网页.对于爬虫而言,我们作为网页的访问者,不能一直等着服务器给我们返回错误信息,耗费 ...
python爬虫之urllib库
请求库 urllib urllib主要分为几个部分 urllib.request 发送请求urllib.error 处理请求过程中出现的异常urllib.parse 处理urlurllib.robot ...
练手爬虫用urllib模块获取
练手爬虫用urllib模块获取有个人看一段python2的代码有很多错误 import re import urllib def getHtml(url): page = urllib.urlope ...
Python爬虫之urllib.parse详解
Python爬虫之urllib.parse 转载地址 Python 中的 urllib.parse 模块提供了很多解析和组建 URL 的函数. 解析url 解析url( urlparse() ) ur ...

随机推荐

LuoGu P2735 电网 Electric Fences
题目传送门这个东西,本来我是用求出两条一次函数解析式然后判断在x坐标下的y坐标值来做的首先因为没考虑钝角三角形,WA了然后又因为精度处理不好又WA了一气之下,只能去网上查了查那个皮克定理首先 ...
机器学习之SVD分解
一.SVD奇异值分解的定义假设是一个的矩阵,如果存在一个分解: 其中为的酉矩阵,为的半正定对角矩阵,为的共轭转置矩阵,且为的酉矩阵.这样的分解称为的奇异值分解,对角线上的元素称为奇异值,称为左奇异矩 ...
html table
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...
JavaScript利用键盘方向键（上下键）控制表格行选中
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8&qu ...
声明寄存器ROM
:] ROM [:] ; integer i; initial begin ;i<=;i=i+) begin ROM[i] <= {{'b0}}; end end 同时可以考虑双端口ROM ...
LeetCode（82）：删除排序链表中的重复元素 II
Medium! 题目描述: 给定一个排序链表,删除所有含有重复数字的节点,只保留原始链表中没有重复出现的数字. 示例 1: 输入: 1->2->3->3->4->4- ...
《剑指offer》跳台阶
本题来自<剑指offer> 跳台阶题目1: 一只青蛙一次可以跳上1级台阶,也可以跳上2级.求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果). 思路: 同上一篇. C ...
tail -f -n 0 /var/log/messages
<pre><font color="#CC0000"><b>root@kali</b></font>:<font ...
git无法pull仓库refusing to merge unrelated histories （拒绝合并不相关仓库）
原文地址 https://blog.csdn.net/lindexi_gd/article/details/52554159 本文讲的是把git在最新2.9.2,合并pull两个不同的项目,出现的问题 ...
java读取pdf和MS Office文档
有时候PDF中的文字无法复制,这可能是因为PDF文件加密了,不过使用PDFBox开源软件就可以把它读出来. 还有一个用于创建PDF文件的项目----iText. PDFBox下面有两个子项目:Font ...

爬虫2 urllib用法

爬虫2 urllib用法的更多相关文章

随机推荐

热门专题