Scrapy基础(八)————图片下载后将本地路径添加到Item中

前边讲到简单的图片下载，但是怎样将图片的本地路径和存储在Item中的数据对应起来，所以本篇博文讲解到如何将

本地的下载后的图片路径写入到Item中

思路：自定义pipline，多加个管道，该管道继承下载图片的类，并重写与Item 交互的方法，从众提取到本地路径，并返回这个Item交给下一个pipline管道

具体代码：

先导入

from scrapy.pipelines.images import ImagesPipeline

 #补充Item的字段，将文章列表页的图片下载下来,并将图片的路径添加到item

 class ArticalImagesPipeline(ImagesPipeline):

     def item_completed(self, results, item, info):

         for ok,value in results:                        #debuge得知：result是一个元组，（状态，{"path":"","url":"http://***"}）

             image_file_path = value["path"]

         item["front_image_path"] = image_file_path      #将提取到的path写入到Item中

         return item　　　　　　　　　　　　　　　　　　　　　　#将加工后的Item传递给下一个管道进行处理

将自定义的管道加入到setting的管道管理的设置

Scrapy基础(八)————图片下载后将本地路径添加到Item中的更多相关文章

第三百四十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—meta属性返回指定值给回调函数—Scrapy内置图片下载器
第三百四十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—meta属性返回指定值给回调函数—Scrapy内置图片下载器编写spiders爬虫文件循环 ...
二十 Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—meta属性返回指定值给回调函数—Scrapy内置图片下载器
编写spiders爬虫文件循环抓取内容 Request()方法,将指定的url地址添加到下载器下载页面,两个必须参数, 参数: url='url' callback=页面处理函数使用时需要yield ...
Bootstrap <基础八>图片
Bootstrap 提供了三个可对图片应用简单样式的 class: .img-rounded:添加 border-radius:6px 来获得图片圆角. .img-circle:添加 border-r ...
php图片采集后按原路径保存图片
php图片采集后按原路径保存图片. 代码: <?php $domain ='http://www.jbxue.com'; $url = '/newskin/images/v4/logo.jpg' ...
Scrapy基础(七)————图片的简单下载
scrapy 提供了自动下载图片到本地的功能,通过项目管道设置一: 在setting 文件中ITEM_PIPELINE添加: 'scrapy.pipelines.images.ImagesPipel ...
php将远程图片下载保存到本地
/* *功能:php完美实现下载远程图片保存到本地 *参数:文件url,保存文件目录,保存文件名称,使用的下载方式 *当保存文件名称为空时则使用远程文件原来的名称 */ function getIma ...
scrapy基础知识之下载中间件使用案例：
1. 创建middlewares.py文件. Scrapy代理IP.Uesr-Agent的切换都是通过DOWNLOADER_MIDDLEWARES进行控制,我们在settings.py同级目录下创建m ...
Xamarin for Visual Studio下载后的文件路径
Xamarin for Visual Studio的下载很纠结,在官网上不知道如何下载?现在找到一个办法:可以先在网上找一个低版本的之后安装,然后利用VS更新.利用VS更新这里也遇到了问题,下载成功之 ...
echarts彩虹柱状图每个bar显示不同颜色，标题在不同位置，工具中有可以直接保存为图片下载，平均线的添加
可以参考: https://echarts.baidu.com/echarts2/doc/example.html https://echarts.baidu.com/echarts2/doc/doc ...

随机推荐

Jmeter-JDBC Request参数化
一.参数化 1.选择Query Type(查询类型)为Prepared Select Statement 2.写好sql 3.在Parameter Values中输入参数,多个参数用‘,’隔开 4.P ...
MySQL慢查询 - 开启慢查询
一.简介开启慢查询日志,可以让MySQL记录下查询超过指定时间的语句,通过定位分析性能的瓶颈,才能更好的优化数据库系统的性能. 二.参数说明 slow_query_log 慢查询开启状态 slow_ ...
Python函数之递归函数
递归函数的定义:在这个函数里再调用这个函数本身最大递归深度默认是997或者998,python从内存角度做的限制优点:代码变简单缺点:占内存一:推导年龄问a的值是多少: a 比 b 小2,b ...
ActiveSync中的http内容组织
1. POST Request 数据格式 Request-line Request-headers CR/LF Request Body Request-line POST <URI> H ...
Tomcat使用
打开Tomcat官网在浏览器地址栏输入: tomcat.apache.org,按回车下载Tomcat 把目光移动至网页左边红匡处,点击Tomcat8 网页下移点击箭头所指的链接运行Tomcat ...
java.net.UnknownHostException: master
1:如果你报这个错误,第一反应应该是本地的host文件没有配置服务器名称和对应的ip地址,这个反应就对了.贴一下错误和解决方法: java.net.UnknownHostException: mast ...
BFC的形成和排版规则
何为bfc? BFC(Block Formatting Context)直译为“块级格式化范围”.是 W3C CSS 2.1 规范中的一个概念,它决定了元素如何对其内容进行定位,以及与其他元素的关系和 ...
python之PIL 二值图像处理和保存
0. 1.参考 http://pszpcl.baike.com/article-77327.htmlwindows 图片右键:属性详细信息位深度位深度用于指定图像中的每个像素可以使用的颜色信息数 ...
[转]通过Spring Boot三分钟创建Spring Web项目
来源:https://www.tianmaying.com/tutorial/project-based-on-spring-boot Spring Boot简介接下来我们所有的Spring代码实例 ...
docker-java Docker的java API
docker-java docker-java 是 Docker的 Java 版本API Docker 当前的实现基于 Jersey 2.x 因此 classpath 不兼容老版本的 Jersey 1 ...

Scrapy基础(八)————图片下载后将本地路径添加到Item中

思路：自定义pipline，多加个管道，该管道继承下载图片的类，并重写与Item 交互的方法，从众提取到本地路径，并返回这个Item交给下一个pipline管道

Scrapy基础(八)————图片下载后将本地路径添加到Item中的更多相关文章

随机推荐

热门专题