python + docker, 实现天气数据 从FTP获取以及持久化(四)-- 数据准备
前情提要
在之前的文章里,我们已经掌握从FTP上面下载天气数据然后插入到数据库中。
但是如何将我们已有的数据放到生产环境中呢?

思考
首先,我们先简单的理一理现在的情况。
目前: FTP上面已有半个月的天气数;每天会有2个txt文件产生 (每个文件大小约为 50~60 kb),由天气供应商负责上传到FTP上。 如图所示:

思路1:
经过简单的测试,每次读取一个txt文件然后写入数据库的时间大约为1s, 因此,可以考虑写一个小工具,从FTP上依次读取所有的txt, 然后插入数据库。也就是利用小工具到现场后再准备数据。
思路2:
直接将数据库文件导出,然后到现场部署的时候导入。
想好了就是干
① 思路1的解决方案
由于之前已经写好了FTP读取以及数据库插入数据的方法,这里只需要简单封装一下,即可满足我们的功能。 ~~~show me the code ~~
def fetch_insert_all_data():
ftp = FTPUtil('xxx.xxx.xxx.xxx')
ftp.Login('xxxxxx', 'xxxxxx') # create database and tables
nRet = preparation()
if nRet != 0:
print "Connect MySQL DB error!"
return # fetach all data from FTP and insert into database
for file in ftp.listFiles():
remote_file = file
local_file = file
if ftp.DownLoadFile(local_file, remote_file):
print "Download file {0} from FTP ok.".format(remote_file)
list_weather_tumple = decode_weather_from_txt(local_file)
nRet2 = insert_or_update_weather_data(list_weather_tumple)
if nRet2 >= 0:
print "Insert or update weather {0} ok.".format(remote_file)
else:
print "Insert or update weather {0} error!".format(remote_file) delete_file(local_file)
else:
print "Download file {0} from FTP error!".format(remote_file) ftp.close();
② 思路2的解决方案
首先,不得不说,虽然这种办法不用撸代码,但是需要 play 数据库啊; 经过了不断地尝试以及查找 。。。总结如下:
1. 导出数据库表(在 terminal上输入)
# mysqldump -u root -p weather_db weather > /var/lib/mysql/weather.sql
按照提示,输入正确的password, 我们就可以看到导出的文件啦!

2. 导入数据库表
2.1 首先需要进入MySQL命令行
# mysql -u root -pxxxx
2.2 建立数据库
mysql> create database weather_db
mysql> use weather_db
这一点非常重要:因为我们的导出文件是基于数据库表的,数据库表需要依附于数据库
2.3 运行 SQL脚本
这里不得不吐槽一下,网上的童鞋说可以在terminal上面直接执行 SQL文件, 但是我这里一直出错!!!
当我 “不小心” (瞎尝试) 在MySQL的命令行中运行脚本, where amazing happend !!

OK, 让我们查看一下数据库表和数据,

~大功告成~
总结
总的来说,两种方法各有千秋:
方案1 需要花费更多的时间(收集 1天数据耗时约为 1s)。
方案2 需要我们将数据导入后,也许还需要再做一些插入操作(再插入几天的数据)。
Lastly, 感谢大家的收看,如果有更好建议也欢迎留言交流。
python + docker, 实现天气数据 从FTP获取以及持久化(四)-- 数据准备的更多相关文章
- python + docker, 实现天气数据 从FTP获取以及持久化(一)
前情提要 最近项目需要天气数据(预报和历史数据)来作为算法程序的输入. 项目的甲方已经购买了天气数据, 依照他们的约定,天气数据的供应商会将数据以"文本" (.TXT)的方式发到F ...
- python + docker, 实现天气数据 从FTP获取以及持久化(五)-- 利用 Docker 容器化 Python 程序
背景 不知不觉中,我们已经完成了所有的编程工作.接下来,我们需要把 Python 程序 做 容器化 (Docker)部署. 思考 考虑到项目的实际情况,“持久化天气”的功能将会是一个独立的功能模块发布 ...
- python + docker, 实现天气数据 从FTP获取以及持久化(二)-- python操作MySQL数据库
前言 在这一节中,我们主要介绍如何使用python操作MySQL数据库. 准备 MySQL数据库使用的是上一节中的docker容器 “test-mysql”. Python 操作 MySQL 我们使用 ...
- python + docker, 实现天气数据 从FTP获取以及持久化(三)-- python获取FTP数据
前言 经过前面两个小节的介绍,我们已经完成了MySQL数据库的搭建和数据库操作的事宜. 在本小节中,我们需要完成的任务是:使用python从FTP服务其上面获取文本文件. 搭建测试FTP服务器 LZ的 ...
- 学会python可以上天!20行代码获取斗鱼平台房间数据,就是这么牛逼!
Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象.直译式电脑编程语言,也是一种功能强大的通用型语言,已经具有近二十年的发展历史,成熟且稳定.它包含了一组完善而且容易理 ...
- 毕设之Python爬取天气数据及可视化分析
写在前面的一些P话:(https://jq.qq.com/?_wv=1027&k=RFkfeU8j) 天气预报我们每天都会关注,我们可以根据未来的天气增减衣物.安排出行,每天的气温.风速风向. ...
- python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
实例1.取得MYSQL版本 复制代码 代码如下: # -*- coding: UTF-8 -*-#安装MYSQL DB for pythonimport MySQLdb as mdbcon = Non ...
- Python爬虫入门教程 53-100 Python3爬虫获取三亚天气做旅游参照
爬取背景 这套课程虽然叫爬虫入门类课程,但是里面涉及到的点是非常多,十分检验你的基础掌握的牢固程度,代码中的很多地方都是可以细细品味的. 为什么要写这么一个小东东呢,因为我生活在大河北,那雾霾醇厚的很 ...
- [Python爬虫] 之一 : Selenium+Phantomjs动态获取网站数据信息
本人刚才开始学习爬虫,从网上查询资料,写了一个利用Selenium+Phantomjs动态获取网站数据信息的例子,当然首先要安装Selenium+Phantomjs,具体的看 http://www.c ...
随机推荐
- 51Nod 1557 两个集合(二分)
http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1557 题意: 小X有n个互不相同的整数: p1,p2,...,pn .他 ...
- Solidity 官方文档中文版 3_安装Solidity
基于浏览器的Solidity 如果你只是想尝试一个使用Solidity的小合约,你不需要安装任何东西,只要访问 基于浏览器的Solidity http://remix.ethereum.org/. 如 ...
- 使用javascript模拟常见数据结构(二)
四.链表 每种语言都实现了数组.这种数据结构非常方便,提供了一个便利的[]语法来访问它的元素.然而,这种数据结构有一个缺点:(在大多数语言中)数组的大小是固定的,从数组的起点或中间插入或移除项的成本很 ...
- [osgearth]通过API创建一个earth模型
通过API的方式大体需要以下几个步骤: 创建map对象—— 创建影像数据层—— 创建高程数据层—— 将影像数据层以及高程数据层加入到map对象—— 根据前面创建的map对象创建mapNode节点—— ...
- mysql explain extended 查看 执行计划
本文以转移至本人的个人博客,请多多关注! 本文以转移至本人的个人博客,请多多关注! 本文以转移至本人的个人博客,请多多关注! 本文以转移至本人的个人博客,请多多关注! 1. explain 可以查看 ...
- devdocs
https://devdocs.io/ docker run --rm -d --name devdocs -p 9292:9292 devdocs/devdocs
- UVALive-5095 Transportation (最小费用流+拆边)
题目大意:有n个点,m条单向边.要运k单位货物从1到n,但是每条道路上都有一个参数ai,表示经这条路运送x个单位货物需要花费ai*x*x个单位的钱.求最小费用. 题目分析:拆边.例如:u到v的容量为5 ...
- Linux中查看进程和杀掉进程
ps -A查看正在运行的所有进程 kill -9 xxx杀掉某个进程,xxx为进程ID.
- Hadoop/Spark入门学习笔记(完结)
Hadoop基础及演练 ---第1章 初识大数据 大数据是一个概念也是一门技术,是在以Hadoop为代表的大数据平台框架上进行各种数据分析的技术. ---第2章 Hadoop核心HDFS Hadoop ...
- BZOJ4978: [Lydsy1708月赛]泛化物品(乱搞)
4978: [Lydsy1708月赛]泛化物品 Time Limit: 5 Sec Memory Limit: 256 MBSubmit: 220 Solved: 70[Submit][Statu ...