使用item来封装数据：

一、item和field类：

　　1、使用Item类：

　　　　创建了类Bookitem,然后就可以使用：

　　2、item_pipeline:

　　　　我们可以使用item_pipeline对爬取的数据进行处理。

　　　　步骤：

　　　　　　（1）在items.py文件中定义数据格式：

　　　　　　　　需要继承Item类。

 class BookItem(scrapy.Item):

     # define the fields for your item here like:

     # name = scrapy.Field()

     name=scrapy.Field()

     price=scrapy.Field()

　　　　　　　　（2）然后在pipelines.py文件夹中定义pipeline的类：

 class Toprice(object):

     def process_item(self,item,spider):

         price=item['price']

         title=item['name']

         exchange_rate=8.5309

         price=float(item['price'][1:])*exchange_rate

         item['price']='￥%.2f'%price

         return item

　　　　　　定义类时，不需要继承特殊的类，但需要实现一些特定的方法。

　　　　　　　　process_item(self,item,spider) 用于处理每一项由spider爬取到的数据。

　　　　　　　　open_spider(self,spider) 　　（处理数据前），回调这个方法。通常该方法用于处理所有数据之前完成某项初始化工作,如连接数据库。

　　　　　　　　close_spider(self,spider) （处理数据后）回调该方法，通常该方法用于在处理完所有的数据之后完成某项处理工作。

　　　　　　　　from_crawler(cls,crawler)　　创建itempipeline对象时回调该类方法。通常，在该方法中用过crawler.setting读取配置，根据配置创建itemPineline对象。

　　　　　　（3）启用itempineline:

　　　　　　　　需要在settings.py文件中进行配置：

　　　　　　　　　　优先级大小：0~100

ITEM_PIPELINES = {

   'book.pipelines.BookPipeline': 300,

   'book.pipelines.Toprice':400,

}

//后面的数字代表优先级，数字小的pipeline的优先级高，会先被调用

使用item来封装数据：的更多相关文章

Scrapy 使用 Item 封装数据、使用 Item Pipline处理数据
1.Item 和 Field Scrapy 提供一下两个类,用户可以使用它们自定义数据类,封装爬取到的数据: (1)Item类自定义数据类(如 BookItem)的基类 (2)Field 用来描述自 ...
json和xml封装数据、数据缓存到文件中
一.APP的通信格式之xml xml:扩展标记语言,可以用来标记数据,定义数据类型,是一种允许用户对自己标记语言进行定义的源语言.XML格式统一,扩平台语言,非常适合数据传输和通信,业界公认的标准. ...
xml方式封装数据方法
1.xml方式封装数据方法 2.demo <?php xml方式封装数据方法 /** * [xmlEncode description] * @param [type] $code [descr ...
JSP-07-使用JavaBean封装数据
7.1 常命包名 Dao 包中的接口(NewsDao)以及类(NewsDaoImpl)注意负责和数据操作相关的事情. Service 包中的接口和类对dao的方法进行封装和调用,注意负责和业务逻辑相关 ...
预先封装数据的思路.md
预先封装数据的思路.md python3 最近有两位同学开发开发了用程序在线竞猜数字的小游戏,可以通过以下两个网址去玩: bbaa的游戏 http://bbaass.tk/math/ codetige ...
Scrapy基础(十)———同步机制将Item中的数据写在Mysql
前面讲解到将Item中的所有字段都已经填写完成,那么接下来就是将他们存储到mysql数据库中,那就用到了pipeline项目管道了: 对项目管道的理解:做一个比喻,爬取好比是开采石油,Item装 ...
关于双重for循环封装数据问题
1.问题描述在使用双重for循环进行封装数据时出现一个问题,就是有的数据封装上了,有的数据未封装上,找了很久原因: for (A a:ListA) { for (B b: ListB) { if(a ...
http中使用json封装数据的性能测试
http中使用json封装数据的性能测试一个项目使用json封装数据,接口例如: 客户端发送: POST /list.do HTTP/1.1 Host: zoomi.com.cn ...
Programming With Objective-C---- Encapsulating Data ---- Objective-C 学习(三) 封装数据
Programming with Objective-C Encapsulating Data In addition to the messaging behavior covered in t ...

随机推荐

Android远程桌面助手之性能监测篇
<Android下获取FPS的几种方法>一文中提到了Gamebench工具,它不仅可以获取FPS,还可以获取CPU及内存占用率等系统状态信息.其局限性也非常明显,切换应用时需要重新选择监控 ...
Android 异步框架 RxJava2
观察者模式的概念 RxJava是android的异步框架,官方介绍是可观测的序列,组成异步基于事件程序的库.特点是观察者模式,基于事件流的链式调用,随着异步操作调度过程复杂的情况下,程序逻辑也变得越来 ...
AngularJS学习之旅—AngularJS Http(九)
1.AngularJS XMLHttpRequest $http 是 AngularJS 中的一个核心服务,用于读取远程服务器的数据. eg: // 简单的 GET 请求,可以改为 POST $htt ...
Linux学习历程——Centos 7 mkdir命令
一.命令介绍 mkdir 命令用于创建空白目录格式为“mkdir [选项] 目录”, 除了能够创建单个空白目录,还能结合 -p 参数来递归创建具有嵌套层叠关系的文件目录. -------------- ...
wxPython树控件
1.树控件树(tree)是一种通过层次结构展示信息的控件,如下图所示是树控件示例,左窗口中是树控件,在wxPython中树控件类是wx.TreeCtrl. wx.TreeCtrl中一个常用的方法有: ...
TypeScript——初步认识
JavaScript的痛点众所周知,前端开发“三剑客”分别是HTML.CSS以及JS,其中JS由于其灵活简单等特点获得了大家的青睐,但是成也萧何败萧何,由于JS设计初衷是浏览器的嵌入式脚本语言,作为 ...
【Python 18】BMR计算器2.0（数值类型转换与while循环）
1.案例描述基础代谢率(BMR):我们安静状态下(通常为静卧状态)消耗的最低热量,人的其他活动都建立在这个基础上. 计算公式: BMR(男) = (13.7*体重kg)+(5.0*身高cm)-(6. ...
Linux Swap交换分区探讨
Swap交换分区概念 Linux divides its physical RAM (random access memory) into chucks of memory called pages. ...
idea右键无法新建Java Class
项目中新建目录之后,要在该目录下新增java Class文件,右键——>New发现无对应选项. 原因:新建目录之后需要设置目录作用,从而让idea识别. 方法:File-Project Stru ...
idea maven无法热布署exploded
(原) 有时,你的idea可能会偶尔出现点小问题,特别是在用maven的时候,以前可以用的热布署发现没有了.就像这样: 少了一个选项,并且下面会有一个提示,no artifacts configure ...

使用item来封装数据：

使用item来封装数据：的更多相关文章

随机推荐

热门专题