1 这个是什么

整理Python中requests常用的API

2 代码

from bs4 import BeautifulSoup

import requests

import re

# 使用requests进行网络求解，用BeautifulSoup处理html网页

s_url = "https://www.baidu.com"

o_header = {

        'Accept': 'image/webp,image/apng,image/*,*/*;q=0.8',

        'Accept-Encoding': 'gzip, deflate',

        'Accept-Language': 'en-US,en;q=0.8',

        'Connection': 'keep-alive',

        'Referer': 'https://www.baidu.com',

        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'

}

n_timeout = 36 # 设置超时秒数

'''

处理资源文件, url返回一个图片、音频、视频

'''

s_local_url = "img.jpg"

resp_stream = requests.get(s_local_url, stream=True, headers=o_header, timeout=n_timeout) #进行图片下载   

with open(s_local_url, 'wb', buffering = 1024) as fp:

    fp.write(resp_stream.content)

    fp.flush()          

'''

处理html, url返回一个网页

'''

# 使用get命令得到请求

resp = requests.get(s_url, headers=o_header, timeout= n_timeout)

# 得到明显的编码

resp.encoding = resp.apparent_encoding

# 字符串html转为soup

soup__html = BeautifulSoup(resp, "lxml")   

# 找到所有的id属性为abc的h

soup__h = soup__html.find("a", id="h")

print(soup__h.text)

# 找到所有的class属性为abc的<img>

soup__img_s = soup__html.find("img", class_="abc")

for soup__img in soup__img_s:

    print(soup__img["src"], soup__img.text)

# 找到所有的abc属性为opq的a

soup__a = soup__html.find("a", attrs= {"abc" :"opq"})

print(soup__a.text)

# 找到所有的abc属性为opq 1, opq 2的a (正则找)

soup__a = soup__html.find("a", attrs= {"abc" :re.compile(r"opq(\s\w+)?")})

print(soup__a.text)

Python爬虫快速上手教程的更多相关文章

入门python:《Python编程快速上手让繁琐工作自动化》中英文PDF+代码
入门推荐学习<python编程快速上手>前6章是python的基础知识,通俗易懂地讲解基础,初学者容易犯错的地方,都会指出来.从第三章开始,每章都有一个实践项目,用来巩固前面所学的知识. ...
《Python编程快速上手 —让繁琐工作自动化》|百度网盘免费下载|Python自动化办公
Python编程快速上手—让繁琐工作自动化提取码:u8vj 如今,人们面临的大多数任务都可以通过编写计算机软件来完成. Python 是一种解释型.面向对象.动态数据类型的高级程序设计语言.通过 P ...
《Python爬虫学习系列教程》学习笔记
http://cuiqingcai.com/1052.html 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多.学习过程中我把一些学习的笔记总结下来,还记录了一些自己 ...
新浪SAE快速上手教程
新浪SAE快速上手教程[1]如何免费开通新浪云 2014-07-18 > 新浪SAE快速上手教程[2]如何创建.删除应用 2014-07-24 > 新浪SAE快速上手教程[3]如何上传应 ...
Airtest 快速上手教程
一.Airtest 简介: AirtestIDE 是一个跨平台的UI自动化测试编辑器,适用于游戏和App. 自动化脚本录制.一键回放.报告查看,轻而易举实现自动化测试流程支持基于图像识别的 Airt ...
Python编程快速上手-让繁琐工作自动化-第二章习题及其答案
Python编程快速上手-让繁琐工作自动化-第二章习题及其答案 1.布尔数据类型的两个值是什么?如何拼写? 答:True和False,使用大写的T和大写的F,其他字母是小写. 2.3个布尔操作符是什么 ...
Python requests快速上手
Python requests快速上手这里参考官方文档,在ide中写了一遍,加深一下印象,定义的函数只是为了方便区分不同的请求方式 #-*-coding:utf-8-*- # Time:2017/1 ...
Python爬虫框架Scrapy教程(1)—入门
最近实验室的项目中有一个需求是这样的,需要爬取若干个(数目不小)网站发布的文章元数据(标题.时间.正文等).问题是这些网站都很老旧和小众,当然也不可能遵守 Microdata 这类标准.这时候所有网页 ...
[转]《Python爬虫学习系列教程》
<Python爬虫学习系列教程>学习笔记 http://cuiqingcai.com/1052.html 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多. ...

随机推荐

数据分析师（Data Analyst），数据工程师（Data Engineer），数据科学家（Data Scientist）的区别
数据分析师(Data Analyst):负责从数据中提取出有用的信息,以帮助公司形成业务决策.工作内容包括:对数据进行提取,清洗,分析(用描述统计量,趋势分析,多维度分析,假设检验等统计常用方法对数据 ...
01-复杂度2 Maximum Subsequence Sum (25 分)
Given a sequence of K integers { N1, N2, ..., NK }. A continuous subsequence is defined to ...
Cobaltstrike与Metasploit会话转换
这里只做记录,不做详解 0x00 实验环境被控制机:192.168.126.129 Metasploit:192.168.126.128 Cobaltstrike:182...* 0x01 CS会话 ...
linux服务器磁盘挂载
1.先查看当前服务器挂载的磁盘个数 fdisk -l 2.将vdb磁盘挂载到/data目录下 mount /dev/vdb /data 3.df -h 检查磁盘挂载的情况
秒杀功能压测 jmeter--------重要！！！
线程组里面有三个接口请求,依次为:显示商品列表.登录秒杀平台账户.进行秒杀对线程组用5000个线程循环10次设置一下默认配置,之后就不用反复填写了设置配置文件这个具体功能就是读text文件并且设 ...
Python自动化脚本-运维人员宝典
文章地址: https://alanhou.org/basic-networking-socket-programming/ 第一章 Python脚本概述第二章 Python脚本调试和性能测试第三 ...
postman跳过登陆直接使用的办法
新版的postman不再是Chrome的插件,而是一个独立的app.下载安装后会提示你注册账户或者登陆.在私有环境,例如实验室,或者单机调试,或者其他VPN隔离的内部环境,无法完成登陆操作. 解决办法 ...
使用draw.io桌面版代替visio制作流程图
前言 draw.io是一款在github上的开源产品,由于需要构建在线文档,需要插入画图类型, 对比多款开源产品,最终选择了draw.io. draw.io图标资源非常的丰富,方便导入图标资源,基本上 ...
notepad++删除某关键字所在的行内容
例如,我要删除zhao这个字符串所在的行打开notepad++的ctrl+f窗口点击替换选项,在查找目标输入^.*bp.*$ 其中替换为那里留空,查找模式选择正则表达式,建议也勾选匹配大小写,同时 ...
[LeetCode] 557. Reverse Words in a String III 翻转字符串中的单词 III
Given a string, you need to reverse the order of characters in each word within a sentence while sti ...

Python爬虫快速上手教程

1 这个是什么

2 代码

Python爬虫快速上手教程的更多相关文章

随机推荐

热门专题