requests入门实践02_下载斗图拉最新表情包
新版本移步:https://www.cnblogs.com/zy7y/p/13376228.html
下载斗图拉最新表情包
要爬取的目标所在网址:http://www.doutula.com/photo/list/?page=1
需要用到的第三方库:requests(用于请求图片链接得到图片内容)
一点点正则表达式的应用:
(.*?):在代码中用来匹配图片链接地址,(.*):用来匹配图片对应的名称更多的正则表达式使用参见正则表达式re模块的使用,其中用到re.findall('匹配规则',字符串),将符合匹配规则从整个字符串从找出来,放在一个新的列表中,并返回这个列表(list),更多re模块使用参见菜鸟教程-Python正则表达式详细代码
# !usr/bin/env/python
# -*- coding:utf-8 -*-
"""
time: 2020/02/01 12:37
author: Tceo1
OS: windows10
"""
import re
import requests # url地址:http://www.doutula.com/photo/list/ 有页数之后:http://www.doutula.com/photo/list/?page=2
url = "http://www.doutula.com/photo/list/?page=1"
response = requests.get(url) # 返回一个响应类型
m = r'data-original="(.*?)" alt="(.*)" class'
# 查找符合的图片url,与图片名称
result_list = re.findall(m, response.text)
print(result_list)
for image in result_list:
image_url = image[0]
image_name = image[1]
# 通过切片获取到后缀名 如 .jpg
image_type = image[0][-4:]
# 请求图片url, 返回二进制响应
image_content = requests.get(image_url).content
save_path = r'E:/image/'
with open(save_path + image_name + image_type, 'wb') as f:
# 将二进制响应写入图片
f.write(image_content)
print("over")
代码地址:https://github.com/Tceo1/scriptTools/blob/master/dtl.py
最后
感谢那些给予我帮助的人!
requests入门实践02_下载斗图拉最新表情包的更多相关文章
- requests入门实践01_下载2560*1080的电脑壁纸
		
新版本移步:https://www.cnblogs.com/zy7y/p/13376228.html 附上代码 # !usr/bin/env python # -*- coding:utf-8 -*- ...
 - Python爬虫入门教程 13-100 斗图啦表情包多线程爬取
		
斗图啦表情包多线程爬取-写在前面 今天在CSDN博客,发现好多人写爬虫都在爬取一个叫做斗图啦的网站,里面很多表情包,然后瞅了瞅,各种实现方式都有,今天我给你实现一个多线程版本的.关键技术点 aioht ...
 - 爬虫之爬取豆瓣top250电影排行榜及爬取斗图啦表情包解读及爬虫知识点补充
		
今日内容概要 如何将爬取的数据直接导入Excel表格 #如何通过Python代码操作Excel表格 #前戏 import requests import time from openpyxl impo ...
 - requests-html库轻体验-HTMLSession下载表情包
		
requests-html实战,HTMLSession下载斗图啦最新表情包 前言 在这篇文章之前,我写了requests入门实践02_下载斗图拉最新表情包用正则表达式提取url,来下载斗图啦最新表情包 ...
 - python爬取斗图网中的 “最新套图”和“最新表情”
		
1.分析斗图网 斗图网地址:http://www.doutula.com 网站的顶部有这两个部分: 先分析“最新套图” 发现地址栏变成了这个链接,我们在点击第二页 可见,每一页的地址栏只有后面的pag ...
 - sass、less和stylus的安装使用和入门实践
		
刚 开始的时候,说实话,我很反感使用css预处理器这种新玩意的,因为其中涉及到了编程的东西,私以为很复杂,而且考虑到项目不是一天能够完成的,也很少是 一个人完成的,对于这种团队的项目开发,前端实践用c ...
 - 分布式学习系列【dubbo入门实践】
		
分布式学习系列[dubbo入门实践] dubbo架构 组成部分:provider,consumer,registry,monitor: provider,consumer注册,订阅类似于消息队列的注册 ...
 - Django入门实践(二)
		
Django入门实践(二) Django模板简单实例 上篇中将html写在了views中,这种混合方式(指Template和views混在一起)不适合大型开发,而且代码不易管理和维护,下面就用Djan ...
 - 全文搜索引擎Elasticsearch入门实践
		
全文搜索引擎Elasticsearch入门实践 感谢阮一峰的网络日志全文搜索引擎 Elasticsearch 入门教程 安装 首先需要依赖Java环境.Elasticsearch官网https://w ...
 
随机推荐
- HDFS读写流程(重点)
			
@ 目录 一.写数据流程 举例: 二.异常写流程 读数据流程 一.写数据流程 ①服务端启动HDFS中的NN和DN进程 ②客户端创建一个分布式文件系统客户端,由客户端向NN发送请求,请求上传文件 ③NN ...
 - day36 解决粘包问题
			
目录 一.tcp粘包问题出现的原因 二.解决粘包问题low的办法 三.egon式解决粘包问题 四.实现并发 1 tcp 2 udp 一.tcp粘包问题出现的原因 前引: tcp的客户端与服务端进行通信 ...
 - 如何让元素支持 height:100%效果
			
如何让元素支持 height:100%效果? 有两种方法.(1) 设定显式的高度值. 这个没什么好说的,例如,设置 height:600px,或者可以生效的百分比值高度.例如,我们比较常见的:html ...
 - [BSidesCF 2020]Had a bad day
			
[BSidesCF 2020]Had a bad day 测试 一些猫狗的图片加上url有传参,测试到文件包含时报错了. 使用php伪协议: php伪协议 php://fliter/read=conv ...
 - mongodb(二):数据库安装,部署(linux)
			
1.下载安装包 wget http://fastdl.mongodb.org/linux/mongodb-linux-i686-1.8.2.tgz 下载完成后解压缩压缩包 tar zxf mongod ...
 - vue 仿掘金评论列表
			
先来个最终效果 代码: template代码: <template> <div class="main"> <div class="titl ...
 - Apache Avro & Avro Schema简介
			
为什么需要schema registry? 首先我们知道: Kafka将字节作为输入并发布 没有数据验证 但是: 如果Producer发送了bad data怎么办? 如果字段被重命名怎么办? 如果数据 ...
 - Web Scraping using Python Scrapy_BS4 - Introduction
			
What is Web Scraping This is also referred to as web harvesting and web data extraction. This is the ...
 - 使用数据泵(expdp、impdp)迁移数据库流程
			
转载原文地址为:http://blog.itpub.net/26736162/viewspace-2652256/ 使用数据泵迁移数据库流程 How To Move Or Copy A Databas ...
 - RN开发杂记
			
获取屏幕尺寸const window = Dimensions.get('window');const screenHeight = Platform.OS === 'ios' ? window.he ...