python接口自动化测试十八：使用bs4框架爬取图片

# 爬图片
# 目标网站：http://699pic.com/sousuo-218808-13-1.html
import requests
from bs4 import BeautifulSoup
import os
r = requests.get('http://699pic.com/sousuo-218808-13-1.html')

# r.content   # 返回的是字节流

soup = BeautifulSoup(r.content, 'html.parser')  # 用html解析器，查找r.content

# tu = soup.find_all('img')   # 查找所有的标签名字为“img”的对象
tu = soup.find_all(class_="lazy")   # 查找所有的标签名字为“class_="lazy"”的对象

for i in tu:
#    print(i)
# <img alt="洱海清晨的彩霞倒映水中高清图片" class="lazy" data-original="http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg" height="300" src="http://static.699pic.com/images/blank.png" title="洱海清晨的彩霞倒映水中图片下载" width="453.30915684497"/>
    print(i['data-original'])   # 获取所有的url地址

# 爬单张图片
url = 'http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg'
r = requests.get(url)
f = open('123.jpg', 'wb')   # 以二进制写入的方式打开一个名为123.jpg的文件 （后缀可随意改）
f.write(r.content)  # 把r传输的字节流写入到文件中
f.close()   # 关闭文件


# 批量写入：

# 创建路径,  创建一个名为“tupian”的文件夹
curpath = os.path.dirname(os.path.dirname(os.path.realpath(__file__)))
tupian = os.path.join(curpath, 'tupian')
if not os.path.exists(tupian):  # 判断名字为“tupian”的文件夹是否为不存在
    os.mkdir(tupian)        # 不存在，则创建名字为“tupian”的文件夹
# 批量写入图片并保存
for i in tu:
    try:
        jpg_url = i['data-original']    # 要获取的图片的地址
        name = i['alt']
        r = requests.get(jpg_url)
        # 写入内容，放到tupian文件夹下
        f = open(os.path.join(tupian, '%s.jpg'%name), 'wb')
        f.write(r.content)
        f.close()
    except:
        pass

python接口自动化测试十八：使用bs4框架爬取图片的更多相关文章

python接口自动化测试十七：使用bs4框架进行简单的爬虫
安装:beautifulsoup4 from bs4 import BeautifulSoup yoyo = open('yoyo.html', 'r') # 以读的方式打开“yoyo.html” ...
python接口自动化测试十九：函数
# 函数 a = [1, 3, 6, 4, 85, 32, 46]print(sum(a)) # sum,求和函数 def add(): a = 1, b = 2, return a + bprint ...
python接口自动化测试十六：unittest完成用例
import unittestimport requests def add(a, b): print('前置条件!!!!!:如登录') return a + b class TestAAA(unit ...
python接口自动化测试十五：解决密码动态，无法登录情况
解决问题:每次密码都是变化的,无法通过账号密码登录 (总不能每次去fiddler复制吧????) 解决思路: 1.先用selenium调用浏览器(不会selenium的自己想办法了), 2.登录后从浏 ...
python接口自动化测试十四：用正则表达式提取数据
import requests import re url = 'xxxx' r = requests.post(url) # 正则公式: postid = re.findall(r"(.+ ...
python接口自动化测试十二：对返回的json的简单操作
# 1.requests里面自带解析器转字典 print(r.json()) print(type(r.json())) # 取出json中的'result_sk_temp'字段 # {"r ...
python接口自动化测试十：字典、字符串、json之间的简单处理
# 字典 t = { # 键:值 '': '', '': '' } # 字典 # dict key: value key是唯一的,无序的 h = { ...
Python接口自动化测试框架实战从设计到开发
第1章课程介绍(不要错过)本章主要讲解课程的详细安排.课程学习要求.课程面向用户等,让大家很直观的对课程有整体认知! 第2章接口测试工具Fiddler的运用本章重点讲解如何抓app\web的htt ...
基于Python接口自动化测试框架+数据与代码分离(进阶篇)附源码
引言在上一篇<基于Python接口自动化测试框架(初级篇)附源码>讲过了接口自动化测试框架的搭建,最核心的模块功能就是测试数据库初始化,再来看看之前的框架结构: 可以看出testcase ...

随机推荐

saltstack 基本操作
一.常用操作 ①.模块查看 #查看全部模块 [root@k8s_master ~]# salt '*' sys.list_modules # "*"为所有node节点 (此处可以写 ...
学习windows编程 day3 之滚动条完善
1.不再使用setscrollrange,setscrollpos,getscrollrange,getscrollpos这些函数,这只是有助于理解其中运行原理 2.改用setscrollinfo,g ...
docker部署路飞学城
docker部署路飞学城blog来啦部署需求分析: 之前是将nginx.django.vue直接部署在服务器上,既然学了docker,试试怎么部署在docker中 1.环境准备一台linux服务器 ...
SQL语句（三）数据表的修改
数据表的修改 1. 创建实验表people people CREATE TABLE people ( name ), gender ), birthday ) ) 2.修改表 ALTER TABLE ...
Python异常处理和进程线程-day09
写在前面上课第九天,打卡: 最坏的结果,不过是大器晚成: 一.异常处理 - 1.语法错误导致的异常 - 这种错误,根本过不了python解释器的语法检测,必须在程序运行前就修正: - 2.逻辑上的异 ...
C# Winform中慎用Application.DoEvents
private void Add() { ; i < ; i++) { Button button = new Button(); button.Width = ; button.Height ...
Varish 缓存
varish 缓存 2013年06月17日,Varnish Cache 3.0.4 发布,为目前最新版本. varish是以内存作为共享容器的:内存的大小决定了它的缓存容量.相对于主要以硬盘为存储的s ...
apache - http
apahce 添加模块编译 httpd # so模块用来提供DSO支持的apache核心模块 # 如果编译中包含任何DSO模块,则mod_so会被自动包含进核心. # 如果希望核心能够装载DSO, ...
理解django框架中的MTV与MVC模式
1．Models:一个抽象层,用来构建和操作你的web应用中的数据,模型是你的数据的唯一的.权威的信息源.它包含你所储存数据的必要字段和行为.通常,每个模型对应数据库中唯一的一张表. from dja ...
深入解析Java AtomicInteger 原子类型
深入解析Java AtomicInteger原子类型在进行并发编程的时候我们需要确保程序在被多个线程并发访问时可以得到正确的结果,也就是实现线程安全.线程安全的定义如下: 当多个线程访问某个类时,不 ...

python接口自动化测试十八：使用bs4框架爬取图片

python接口自动化测试十八：使用bs4框架爬取图片的更多相关文章

随机推荐

热门专题