scrapy管道MySQL简记

import pymysql
from scrapy.exceptions import DropItem
import time

class ErshouchePipeline(object):
    def __init__(self):
        self.conn = pymysql.connect(
            host = '127.0.0.1',
            port = 3306,
            user = 'root',
            passwd = 'mlpythonlmoi',
            db = 'ershouche',
            charset = 'utf8'
        )
        self.cusor = self.conn.cursor(cursor=pymysql.cursors.DictCursor)
        sql1 = "select 路由网址 from 二手车之家"
        result = self.cusor.execute(sql1)#读取已经爬取的数据url
        # print(result)
        temp = self.cusor.fetchall()#返回查询到的所有记录
        print('返回查询得到的记录：',temp)
        self.url_list = []
        for i in temp:
            self.url_list.append(i['路由网址'])
        print('存在的：',self.url_list)

    def process_item(self, item, spider):
        if item['car_url'] not in self.url_list:
            sql = "insert into 二手车之家 values(Null,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
            lst = (item['city'],item['trademark'],item['model'],item['colour'],item['price'],item['purpose'],
                   item['vehicle_condition'],item['drive_mode'],item['Truck_kilometer'],item['car_license'],
                   item['Stop_displacemen'],item['year_jian_due'],item['insurance_policy_matures'],item['assurance_due'],
                   item['emission_standard'],item['guohu_number'],item['maintenance'],item['car_url'])
            self.cusor.execute(sql,lst)
            self.conn.commit()
        else:
            raise DropItem('该item数据库中已经存在！')
        return item

    def close_spider(self, spider):
         self.cusor.close()
         self.conn.close()#关闭连接
         print("操作结束！")
         print('结束时间：' + time.strftime('%Y-%m-%d %H:%M:%S', time.localtime()))

scrapy管道MySQL简记的更多相关文章

scrapy 管道里面使用mysql插入数据库
# -*- coding: utf-8 -*- # Define your item pipelines here # # Don't forget to add your pipeline to t ...
scrapy 管道里面使用mysql插入数据库 python操作mysql
# -*- coding: utf-8 -*- # Define your item pipelines here # # Don't forget to add your pipeline to t ...
scrapy连接MySQL
Scrapy中连接MySQL所需要做的工作如下: 1.settings中需要设置的部分 # 启动管道组件 ITEM_PIPELINES = { 'QianChengWuYu.mongoDBPiplel ...
scrapy存储mysql
scrapy 数据存储mysql #spider.pyfrom scrapy.linkextractors import LinkExtractor from scrapy.spiders imp ...
scrapy 实现mysql 数据保存
开始用scrapy 爬取数据的时候开始用同步操作始终会报1064 的错误因为 mysql 语法和导入的字段不兼容尝试了 n 次之后开始用异步爬取虽然一路报错但是还是能把数 ...
scrapy操作mysql/批量下载图片
1.操作mysql items.py meiju.py 3.piplines.py 4.settings.py -------------------------------------------- ...
scrapy框架初识
一.scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍.所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)的具 ...
scrapy爬取猫眼电影排行榜
做爬虫的人,一定离不开的一个框架就是scrapy框架,写小项目的时候可以用requests模块就能得到结果,但是当爬取的数据量大的时候,就一定要用到框架. 下面先练练手,用scrapy写一个爬取猫眼电 ...
scrapy wiki资料汇总
See also: Scrapy homepage, Official documentation, Scrapy snippets on Snipplr Getting started If you ...

随机推荐

zTree 学习笔记之(一)
zTree 学习笔记之(一) 简介 zTree 是一个依靠 jQuery 实现的多功能 “树插件”.优异的性能.灵活的配置.多种功能的组合是 zTree 最大优点. 到底有哪些具体的优点,可以参见官网 ...
算法之冒泡排序(Java语言)
冒泡排序(英语:Bubble Sort) 是一种简单的排序算法.它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来.走访数列的工作是重复地进行直到没有再需要交换,也就是说 ...
Linux下部署配置Nginx
1.安装工具包 yum install -y wget 下载工具 yum install -y vim-enhanced vim编辑器 yum install -y make cmake gcc gc ...
asp.net session 保存实体类对象
存:User user=new User();session["USER"]=user; 取:User u= (User ) session["USER"];
微信开发——微信公众平台实现消息接收以及消息的处理（Java版）
本文主要讲述了如何在微信公众平台实现消息接收以及消息的处理,使用java语言开发,现在把实现思路和代码整理出来分先给兄弟们,希望给他们带来帮助. 温馨提示: 这篇文章是依赖前几篇的文章的. 第一篇:微 ...
os 模块模块与包的初始
os模块是与操作系统交互的模块之前我们也用过os模块就是更改文件的名字的时候我们如果用os求求文件夹是不行的可以求文件因为文件夹在python中最大就是4090个字节所以你必须求出文件夹内 ...
【Leetcode】【Easy】Compare Version Numbers
Compare two version numbers version1 and version2.If version1 > version2 return 1, if version1 &l ...
mysql在linux下的安装mysql-5.6.33
一.下载源码包 wget http://mirrors.sohu.com/mysql/MySQL-5.6/mysql-5.6.35-linux-glibc2.5-x86_64.tar.gz 二.解压源 ...
用windows公文包实现不同盘符两个文件文件夹文件同步
需求:磁盘D的文件夹A需同步到磁盘E 步骤: 1.在磁盘E中新建公文包B 2.将D盘的文件夹A复制到公文包B 3.修改文件夹A中的内容 4.选中公文包B,右键"全部更新"
掷骰子游戏窗体实现--Java初级小项目
掷骰子 **多线程&&观察者模式题目要求:<掷骰子>窗体小游戏,在该游戏中,玩家初始拥有1000的金钱,每次输入押大还是押小,以及下注金额,随机3个骰子的点数,如果3个骰 ...

scrapy管道MySQL简记

scrapy管道MySQL简记的更多相关文章

随机推荐

热门专题