从redis数据库取数据存放到本地mysql数据库

redis数据库属于非关系型数据库，数据存放在内存堆栈中，效率比较高。

其存储数据是以json格式字符串存储字典的，而类似的关系型数据库无法实现这种数据的存储。

在爬取数据时，将数据暂存到redis中，等数据采集完成后，在从redis里将数据读取，并写入mysql数据库中。

在数据采集方面不在多说，只需将项目settings文件下的pipelines管道文件里的本地数据管道注释，让redis来接收数据即可。

从redis写数据入mysql的代码实现：

其实就是一个独立的python脚本文件

import redis

import pymysql

import json,re

def table_exists(con, table_name):

    # 判断数据表是否已经创建

    sql = 'show tables;'

    con.execute(sql)

    tables = [con.fetchall()]

    table_list = re.findall('(\'.*?\')', str(tables))

    table_list = [re.sub("'", '', each) for each in table_list]  # 遍历并获得数据库表

    if table_name in table_list:

        return 1  # 创建了返回1

    else:

        return 0  # 不创建返回0

def process_item():

    #redis数据库创建连接池对象 并实例化一个连接

    pool=redis.ConnectionPool(host='127.0.0.1',port=6379,db=0,password='123456')

    redis_cli=redis.Redis(connection_pool=pool)

    #创建mysql数据库连接

    conn=pymysql.connect(user='root',  # 用户名

            password='1234',  # 密码

            db='lgweb',  # 数据库名

            host='127.0.0.1',  # 地址

            port=3306,

            charset='utf8')

    table_name = 'db_read'  # 数据库表

    # 没有对应数据库表则创建

    if (table_exists(conn.cursor(),table_name) != 1):

        sql = 'create table db_read(书名 VARCHAR (30),作者 VARCHAR (30),评分 VARCHAR (10),类型 VARCHAR (30),状态 VARCHAR (30),简介 VARCHAR (50),详情 VARCHAR (1000),最新章节 VARCHAR (50),封面 VARCHAR (100))'

        conn.cursor().execute(sql)  # 不存在则创建数据库表

    offset=0

    while True:

        #将数据从redis里pop出来

        source,data=redis_cli.blpop("read:items")

        #将redis字符串转为格式化的字典

        item=json.loads(data)

        #创建数据库游标

        cursor=conn.cursor()

        sql = "insert into db_read(书名,作者,评分,类型,状态,简介,详情,最新章节,封面)VALUES ('%s','%s','%s','%s','%s','%s','%s','%s','%s')" % (

            item['book_name'],item['author'],item['score'],item['type'],item['state'],item['about'],item['story'],item['news'],item['photo'])

        cursor.execute(sql)     #执行数据插入

        conn.commit()           #提交记录

        cursor.close()          #关闭游标

        offset+=1

        print("正在保存第："+str(offset)+"条记录")

if __name__ == '__main__':

    process_item()

redis数据库采用数据池连接的方式，更高效更方便。

从redis数据库取数据存放到本地mysql数据库的更多相关文章

pymysql 使用twisted异步插入数据库：基于crawlspider爬取内容保存到本地mysql数据库
本文的前提是实现了整站内容的抓取,然后把抓取的内容保存到数据库. 可以参考另一篇已经实现整站抓取的文章:Scrapy 使用CrawlSpider整站抓取文章内容实现本文也是基于这篇文章代码基础上实现 ...
在windows下，将mysql离线数据文件导入本地mysql数据库
1. 查看mysql路径 SELECT @@basedir AS basePath FROM DUAL 其实mysql5.6 的数据文件在 C:\ProgramData\MySQL\MySQL Ser ...
如何将redis中的数据导入到本地MongoDB和MySQL数据库
将redis中的数据导入到本地MongoDB数据库创建一个process_items_mongodb.py文件(文件名自定义): #!/usr/bin/env python # -*- coding ...
多线程查询数据，将结果存入到redis中，最后批量从redis中取数据批量插入数据库中【我】
多线程查询数据,将结果存入到redis中,最后批量从redis中取数据批量插入数据库中 package com.xxx.xx.reve.service; import java.util.ArrayL ...
C#程序中从数据库取数据时需注意数据类型之间的对应，int16\int32\int64
private void btn2_Click(object sender, RoutedEventArgs e) { using (SqlConnection ...
[saiku] 将saiku自带的H2嵌入式数据库迁移到本地mysql数据库
saiku数据库的表和用户默认创建是在启动项目的时候,通过初始化 saiku-beans.xml 中的 h2database 这个 bean 执行org.saiku.service.Database类 ...
一、初识MySQL数据库二、搭建MySQL数据库（重点）三、使用MySQL数据库四、认识MySQL数据库的数据类型五、操作MySQL数据库的数据（重点）
一.初识MySQL数据库 ###<1>数据库概述 1. 数据库长期存储在计算机内的,由组织的可共享的数据集合存储数据的仓库文件 ...
Holer实现外网访问本地MySQL数据库
外网访问内网MySQL数据库内网主机上安装了MySQL数据库,只能在局域网内访问,怎样从公网也能访问本地MySQL数据库? 本文将介绍使用holer实现的具体步骤. 1. 准备工作 1.1 安装并启 ...
忘记本地MySQL数据库密码的解决方案。
忘记本地MySQL数据库密码,解决方案,分以下10个步骤: 参考链接: https://blog.csdn.net/weidong_y/article/details ...

随机推荐

Qt信号槽机制理解
1. 信号和槽概述 > 信号槽是 Qt 框架引以为豪的机制之一.所谓信号槽,实际就是观察者模式(发布-订阅模式).当某个`事件`发生之后,比如,按钮检测到自己被点击了一下,它就会发出一个信号(s ...
支持向量机(SVM)之硬阈值
支持向量机 ( support vector machine, SVM ) 是使用超平面来对给定的 p 维向量进行分类的非概率二元线性分类器. 一.超平面 ( hyperplane ) 在一个p维的输 ...
Java并发之ReentrantLock源码解析（四）
Condition 在上一章中,我们大概了解了Condition的使用,下面我们来看看Condition再juc的实现.juc下Condition本质上是一个接口,它只定义了这个接口的使用方式,具体的 ...
Docker 优雅终止方案
作为一名系统工程师,你可能经常需要重启容器,毕竟Kubernetes的优势就是快速弹性伸缩和故障恢复,遇到问题先重启容器再说,几秒钟即可恢复,实在不行再重启系统,这就是系统重启工程师的杀手锏.然而现实 ...
Dockerfile优化方式
如今GitHub 仓库中已经包含了成千上万的Dockerfile,但并不是所有的Dockerfile都是高效的.本文将从四个方面来介绍Dockerfile的最佳实践,以此来帮助大家编写更优雅的Dock ...
Gerrit+replication 同步Gitlab
配置环境:gerrit 192.168.1.100gitlab 192.168.1.1011.创建秘钥 [root@gerrit ~]# ssh-keygen -m PEM -t rsa 2.添加ho ...
Redis 底层数据结构之String
文章参考:<Redis设计与实现>黄建宏 Redis 的 string 类型底层使用的是 SDS(动态字符串) 实现的, 具体数据结构如下: struct sdshdr { int len ...
mybatis 批量新增-批量修改-批量删除操作
mapper.xml  <insert id="saveBatch" parameterType="java.util.Lis ...
Python字符串格式方式 %s format()
p.p1 { margin: 0; font: 12px ".PingFang SC" } p.p2 { margin: 0; font: 12px "Helvetica ...
WPF教程十四：了解元素的渲染OnRender()如何使用
上一篇分析了WPF元素中布局系统的MeasureOverride()和ArrangeOverride()方法.本节将进一步深入分析和研究元素如何渲染它们自身. 大多数WPF元素通过组合方式创建可视化外 ...

从redis数据库取数据存放到本地mysql数据库

从redis数据库取数据存放到本地mysql数据库的更多相关文章

随机推荐

热门专题