csv格式的数据存储到mysql

python写的，有点冗余,先码出来~~~~

这是data_stored.py的代码

 # -*- coding:utf-8 -*-

 # 存数据到mysql (只存了时间数字）

 import pymysql

 import csv

 import datetime

 import settings

 from mysql import db

 import os,time

 import pandas as pd

 import numpy as np

 import threading

 from apscheduler.schedulers.blocking import BlockingScheduler

 from datetime import date

 import csv

 import utils

 # filename = 'may_origin.csv'

 # tablename = 'origin_data'

 class data_stored(object):

     def __init__(self):

         pass

     def data_stored(self,filename,tablename):

         csvfile = open(filename,'r')

         dict_reader = csv.DictReader(csvfile)

         db.connect()

         datas = []

         freq = 0

         for row in dict_reader:

              row = dict(row)

              if row['']:

                 del(row[''])

      #创建表

              columns =[]

              for i in row.keys():

                   columns.append(i)

              if (db.is_table_exist(tablename=tablename,dbname=settings.database) ==None and freq ==0 ):

                     db.create_table(tablename=tablename,columns=columns)

                     freq += 1

                     print("create is ok")

              else:

                   pass

     #插入数据

              row['time'] = int(time.mktime(time.strptime(row['time'], '%Y-%m-%d %H:%M:%S')))

              datas.append(row)

         db.insert_mysql_with_json(tablename, datas)

         print("insert is ok")

         db.disconnect()

     def data_to_csv(self,filename,tablename,starttime,endtime,readfile=None,sep=None):

         db.connect()

         fieldNames, results = db.find(tablename, starttime, endtime)

         data = []

         for fn in fieldNames:

             data.append(fn)

         #文件不存在

         if readfile == None:

            csvfile = open(filename, 'w')

            writer = csv.writer(csvfile, dialect=("excel"))

            # 插入列名

            data_1 = []

            data_1 = sorted(set(data), key=data.index)

            writer.writerow(data_1)

         #文件存在

         else:

             csvfile = open(filename, 'a')

             writer = csv.writer(csvfile, dialect=("excel"))

         # 插入data

         for info in results:

             data_2 = []

             # for m_2 in info:

             #     data_2.append(m_2)

             writer.writerow(info)

         csvfile.close()

         db.disconnect()

 # #

 # if __name__ == "__main__":

 #     filename='may_origin.csv'

 #     filename2='csvtest_05.csv'

 #     tablename = 'originData'

 #     st = 1462032004

 #     et = 1462032007

 #

 #     t = data_stored()

 #     starttime = datetime.datetime.now()

 #

 #     # t.data_stored(filename,tablename)

 #     t.data_to_csv(filename2,tablename, st,et)

 #     endtime =datetime.datetime.now()

 #

 #     print(endtime-starttime)

 ds = data_stored()

其中调用了mysql.py的代码就不码了，就是一些连接、断开数据库connect()、disconnect()，创建数据库create_table()，判断tablename是否存在is_table_exist，以及查列名find_columns()，查找数据find()，还有插入数据库数据insert_into_mysql()。

 import settings

 from mysql import db

 import os

 import csv

 import utils

 def time_main(start_time, end_time, tablename, columns=None):

         timespan = settings.timespan

         output_filename = 'sfhd_' + '_origin_' + utils.getDigitDay(start_time) + '.csv'

         db.connect()

         # 判断输出文件是否存在 ：False为不存在

         if os.path.isfile(output_filename) == False:

               pass

         else:

               end_time = start_time

               start_time = start_time -86400

               output_filename = 'sfhd_' + '_origin_' + utils.getDigitDay(start_time) + '.csv'

         # 隔一个时间段timespan存一次

         with open(output_filename, 'w') as csvfile:

             if columns == None:

                 columns = db.find_columns(tablename)

             data = list(columns)

             writer = csv.writer(csvfile, dialect=("excel"))

             data_1 = sorted(set(data), key=data.index)

             writer.writerow(data_1)

             temp_time = start_time + timespan

             current_time = start_time

             while temp_time <= end_time+3:

                 utils.log_easy('time_main', utils.getTimeDes(temp_time))

                 fieldNames, results = db.find(tablename, current_time, temp_time-1, columns)

                 # 插入data

                 for info in results:

                     writer.writerow(info)

                 current_time = temp_time

                 temp_time = current_time + timespan

         db.disconnect()

这是简化过后的mysql数据存到CSV文件中。

常见的mode取值组合

r或rt  默认模式，文本模式读

rb     二进制文件

w或wt 文本模式写，打开前文件存储被清空

wb    二进制写，文件存储同样被清空

a   追加模式，只能写在文件末尾

a+  可读写模式，写只能写在文件末尾

w+ 可读写，与a+的区别是要清空文件内容

r+ 可读写，与a+的区别是可以写到文件任何位置

在选择读文件的方式时，我发现 with open 打开文件并存数据，要比直接open打开存数据要快。因为前者可以在存好数据后就自动关闭文件，并且可以很好处理上下文的异常，还有清理工作。

csv格式的数据存储到mysql的更多相关文章

MYSQL导入CSV格式文件数据执行提示错误（ERROR 1290）： The MySQL server is running with the --secure-file-priv option so it cannot execute this statement.
MYSQL导入CSV格式文件数据执行提示错误(ERROR 1290): The MySQL server is running with the --secure-file-priv option s ...
导入CSV格式的数据
导入CSV格式的数据 (参见http://dev.mysql.com/doc/refman/5.6/en/load-data.html) 1.数据库表(st_pptn_r) CREATE TABLE ...
猫眼电影爬取(一)：requests+正则，并将数据存储到mysql数据库
前面讲了如何通过pymysql操作数据库,这次写一个爬虫来提取信息,并将数据存储到mysql数据库 1.爬取目标爬取猫眼电影TOP100榜单要提取的信息包括:电影排名.电影名称.上映时间.分数 2 ...
python3下scrapy爬虫(第十卷:scrapy数据存储进mysql）
上一卷中我将爬取的数据文件直接写入文本文件中,现在我将数据存储到mysql中,我依然用的是pymysql,这个很麻烦建表需要在外面建这次代码只需要改变pipyline就行来现在看下结果: 对比发 ...
使用MapReduce读取HBase数据存储到MySQL
Mapper读取HBase数据 package MapReduce; import org.apache.hadoop.hbase.Cell; import org.apache.hadoop.hba ...
Spring Boot 揭秘与实战（二）数据存储篇 - MySQL
文章目录 1. 环境依赖 2. 数据源3. 脚本初始化 2.1. 方案一使用 Spring Boot 默认配置 2.2. 方案二手动创建 4. 使用JdbcTemplate操作5. 总结 4.1. ...
第四天，同步和异常数据存储到mysql，item loader方法
github对应代码:伯乐在线文章爬取一. 普通插入方法 1. 连接到我的阿里云,用户名是test1,然后在navicat中新建数据库
将白码平台数据存储到MySQL数据库
概述: 此前在白码平台上搭建并使用系统,若想要将白码平台上搭建的系统的数据存储到自己本地的MySQL数据库中的话,需要将数据导出后再对数据进行处理.如今想要实现这一需求,直接通过使用白码的数据库对接功 ...
Python 抓取数据存储到Mysql中
# -*- coding: utf-8 -*- import os,sys import requests import bs4 import pymysql#import MySQLdb #连接MY ...

随机推荐

使用HDFS客户端java api读取hadoop集群上的信息
本文介绍使用hdfs java api的配置方法. 1.先解决依赖,pom <dependency> <groupId>org.apache.hadoop</groupI ...
IDEA Maven 三层架构 1、基本的Archetype 搭建
JDK:1.8 Maven:3.3.9 三层架构:基于 SpringMVC 的 UI 层.业务逻辑层以及数据访问层从对 Maven 的了解可以看出,三层架构的创建在于对文件夹的合理安排,他们通常是主 ...
SAP资产折旧，消息编号AA687：在上一年结算之后您只能记帐到新的一年
问题:公司****在2015年底没有固定资产,忽略了月结的必要步骤,在2016年1-5月份一直没有计提折旧,再进行折旧时提示"在上一年结算之后您只能记帐到新的一年" 原因: sap ...
JS中的类型识别
JS为弱类型语言,所以类型识别对JS而言尤为重要,JS中常用的类型识别方法有4种:typeof.Object.prototype.toString.constructor和instanceof. (1 ...
Java数据结构和算法总结-字符串及高频面试题算法
前言:周末闲来无事,在七月在线上看了看字符串相关算法的讲解视频,收货颇丰,跟着视频讲解简单做了一下笔记,方便以后翻阅复习同时也很乐意分享给大家.什么字符串在算法中有多重要之类的大路边上的客套话就不多说 ...
PyCharm 2017 免费破解注册激活教程（附 License Server 地址）（Python 编辑器 IDE 推荐）
许多朋友都在问如何破解 PyCharm 2017 Professional 专业版,咪博士对此是坚决反对的! 不到万不得已,请不要这样做.破解之前,请拖到文章末尾,思考几个问题,想明白你确实需要这样做 ...
Servlet 笔记-servlet实例
Servlet 是服务 HTTP 请求并实现 javax.servlet.Servlet 接口的 Java 类.Web 应用程序开发人员通常编写 Servlet 来扩展 javax.servlet.h ...
微信公众平台开发接口PHP SDK
以前没接触过微信公众平台开发,前几天刚找到实习公司就要求我做一个微信公众平台的应用,于是乎开始学习微信公众平台开发接口的调用,看开发文档之后还是不知道从何入手,只好上网找入门资料,终于在方倍工作室找到 ...
Windows7搭建Wamp环境
wamp:Windows + Apache + MySQL + PHP 首先,在D盘根目录下新建目录wamp,wamp下建目录www和bin,www目录作为网站文件入口目录,bin下建目录Apache ...
iOS之 git 简单使用
之前没有用过git管理代码, 现在公司要求使用git,咱就记记今天所学的东西.以后也好方便查阅和补充. 首先我描述一下我今天提交代码的情况. 同伴给了我一个从git库下来的2个项目的包. ...

csv格式的数据存储到mysql

csv格式的数据存储到mysql的更多相关文章

随机推荐

热门专题