scrapy 采集数据存入excel

# -*- coding: utf-8 -*-

# Define your item pipelines here

#

# Don't forget to add your pipeline to the ITEM_PIPELINES setting

# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html

import csv

import xlwt

class GanjiPipeline(object):

    def __init__(self):

        self.line = 1

        self.file_name = "赶集.xls"

        self.book = xlwt.Workbook(encoding="utf8")

        self.sheet = self.book.add_sheet("租房数据")

        self.sheet.col(0).width = 256 * 70  # Set the column w

        self.sheet.col(1).width = 256 * 10

        self.sheet.col(2).width = 256 * 10

        self.sheet.col(3).width = 256 * 10

        self.sheet.col(4).width = 256 * 50

        self.tall_style = xlwt.easyxf('font:height 300')

        first_row = self.sheet.row(0)

        first_row.set_style(self.tall_style)

        head = ["标题","价格","面积","朝向","地址"]

        for h in head:

            self.sheet.write(0,head.index(h),h)

    def process_item(self, item, spider):

        self.sheet.write(self.line, 0, item['title'])

        self.sheet.write(int(self.line), 1, item['price'])

        self.sheet.write(int(self.line), 2, item['size'])

        self.sheet.write(int(self.line), 3, item['chaoxiang'])

        self.sheet.write(int(self.line), 4, item['address'])

        self.sheet.row(self.line).set_style(self.tall_style)

        self.line = self.line + 1

    def close_spider(self,spider):

        self.book.save(self.file_name)

    def optimizeContent(self,res):

        res = res.replace('b\'', '')

        res = res.replace('\\n', '')

        res = res.replace('\'', '')

        res = res.replace('style', 'nouse')

        res = res.replace('\.', '')

        return res

scrapy 采集数据存入excel的更多相关文章

将txt文件数据存入excel表格
前言最近使用Appium自动化在测试设备配网的情况,需要记录每次成功与否和耗时时间. 由于App不是很稳定,执行一段时间会奔溃,因此数据只能通过追加的形式写入到txt文件. 实现过程存储在txt文 ...
python 抓取数据存入 excel
import requestsimport datetimefrom random import choicefrom time import timefrom openpyxl import loa ...
Pandas提取数据存入excel
import pandas as pd import pymysql def connect_db(): MYSQL_HOSTS = '127.0.0.1' MYSQL_USER = 'root' M ...
解析Excel文件并把数据存入数据库
前段时间做一个小项目,为了同时存储多条数据,其中有一个功能是解析Excel并把其中的数据存入对应数据库中.花了两天时间,不过一天多是因为用了"upload"关键字作为URL从而导致 ...
C#+HtmlAgilityPack+XPath带你采集数据(以采集天气数据为例子)
第一次接触HtmlAgilityPack是在5年前,一些意外,让我从技术部门临时调到销售部门,负责建立一些流程和寻找潜在客户,最后在阿里巴巴找到了很多客户信息,非常全面,刚开始是手动复制到Excel, ...
【asp.net】将GridView数据导出Excel
概要: 中午睡了一会,醒来的时候看到老师叫我去办公室,需求是这样的,把excel表中的每个同学,判断图片目录中是否有对应的照片(图片的名字用的学号或身份证号码) 没有对应图片的学生记录,存入自己的数据 ...
C# DataSet数据导入Excel 修正版- .net FrameWork 4.0以上
引入 Microsoft.Office.Interop.Excel.dll 格式:标题加了下划线,单元格内容居中 1 using System; using System.Data; using S ...
用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
爬取拉勾网招聘信息并使用xlwt存入Excel
xlwt 1.3.0 xlwt 文档 xlrd 1.1.0 python操作excel之xlrd 1.Python模块介绍 - xlwt ,什么是xlwt? Python语言中,写入Excel文件的扩 ...

随机推荐

oracle数据库备份、还原命令及常见问题（待补充）
1.oracle数据库的备份:先查空表——将结果全选复制为insert语句——将语句执行后导出先select 'alter table '||table_name||' allocate exten ...
[LeetCode] 221. 最大正方形(DP)
题目在一个由 0 和 1 组成的二维矩阵内,找到只包含 1 的最大正方形,并返回其面积. 示例: 输入: 1 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 0 0 1 0 输出: 4 ...
node进阶｜解决表单enctype="multipart/form-data" 时获取不到Input值的问题
今天在学习node踩到一个坑:form设置enctype="multipart/form-data"上传文件时,无法获取到表单其他input的值. 因为之前上传文件用的是 form ...
JVM学习（一）什么是JVM
一.初识JVM(虚拟机) JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功 ...
微服务实战系列（四）-注册中心springcloud alibaba nacos
1.场景描述因要用到微服务,关于注册中心这块,与同事在技术原型上做了讨论,初步定的方案是使用:阿里巴巴的nacos+springcloud gateway,下面表格是同事整理的注册中心对比,以前用的 ...
【Flutter 实战】大量复杂数据持久化
老孟导读:上一篇文章讲解了 Android 和 iOS 的文件目录系统,此篇文章讲解如何使用 SQLite 保存数据. 欢迎大家投稿:http://laomengit.com/plan/Contrib ...
pwnable.kr-lotto-witeup
执行分析题目代码,发现是输入值和十进制是1到45的ASCII码系统生成对应字母做比较:而比较方法是遍历输入值的所有位和系统生成字符串的每个位作比较,相同计数为6则爆出flag.漏洞啊,只要押中有一字母 ...
安装Angular CLI开发工具
目前,无论你使用什么前端框架,都必然要用到NodeJS工具,Angular也不例外,与其他框架不同的是,Angular一开始就使用"全家桶"式的设计思路,因此@angular/cl ...
GameObject的==的一个坑和一点GameObject的内部构造
一切都是因为==,才有了这篇博客目录测试结果和分析总结测试先放一段unity的一个普通的脚本 using UnityEngine; public class UnityEngineObje ...
IP地址的获取
//ip地址的获取:非原创,之前在其他地方看到,拿过来备份下: public static String getIPAddress(HttpServletRequest request) { Stri ...

scrapy 采集数据存入excel

scrapy 采集数据存入excel的更多相关文章

随机推荐

热门专题