mysql数据迁徙详解

数据迁徙是每个后端都会遇到的工作之一，本文介绍了一些常见的数据迁徙方法与工具

mysqldump：数据结构不变的数据迁徙

导出数据

mysqldump -u root -p DATABASE_NAME table_name > dump.sql

恢复数据

mysql -u root -p DATABESE_NAME < dump.sql

或者连接mysql客户端

mysql> source dump.sql

使用pymysql连接数据库

可以直接用用户名密码连接的数据库

class GeneralConnector:

    def __init__(self, config, return_dic=False):

        self.return_dic = return_dic

        self.config = config

    def __enter__(self):

        self.conn = pymysql.connect(**self.config, port=3306)

        if self.return_dic:

            # 一行数据会变成一个字典

            self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)

        else:

            self.cursor = self.conn.cursor()

        return self.cursor

    def __exit__(self, *args):

        self.cursor.close()

        self.conn.commit()

        self.conn.close()

使用：

# local_db = {

#     'user': 'root',

#     'passwd': '',

#     'host': '127.0.0.1',

#     'db': 'local_db'

#     }

with GeneralConnector(const.local_db, return_dic=True) as cursor:

    cursor.execute('SELECT `col1`, `col2` FROM test;')

    return cursor.fetchall()

连接处于需要SSH连接的服务器的数据库

class SSHConnector:

    def __init__(self, server, config, return_dic=False):

        self.return_dic=return_dic

        self.server = server

        self.config = config

    def __enter__(self):

        self.conn = pymysql.connect(**self.config, port=self.server.local_bind_port)

        if self.return_dic:

            # 一行数据会变成一个字典

            self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)

        else:

            self.cursor = self.conn.cursor()

        return self.cursor

    def __exit__(self, *args):

        self.cursor.close()

        self.conn.commit()

        self.conn.close()

使用：

# SERVER = SSHTunnelForwarder(

#         (remote_host, ssh_port),

#         ssh_username=USERNAME,

#         ssh_pkey=SSH_KEY,

#         ssh_private_key_password=SSH_KEY_PASSWD,

#         remote_bind_address=('127.0.0.1', 3306) # mysql服务位置

#     )

# server_db = {

#     'user': 'root',

#     'passwd': '',

#     'host': '127.0.0.1',

#     'db': 'server_db'

#     }

# 创建一个隧道将服务端的mysql绑定到本地3306端口

with const.SERVER as server:

    with SSHConnector(server, const.server_db) as cursor:

        cursor.execute('show tables;')

        data = cursor.fetchall()

        print(data)

cursor的各种操作

cursor.execute(sql_statement)

执行一条sql语句
cursor.fetchall()

获取cursor的所有结果，常跟在select语句后使用
cursor.fetchone()

获取cursor的第一条结果
cursor.lastrowid

最后一条数据的id

cursor.executemany(insert_statement, data_list)

批量插入一批数据，如

with const.SERVER as server:

    with connector.Connector(server, const.db_1) as cursor:

        cursor.execute('select * from preference')

        preferences = cursor.fetchall()

    with connector.Connector(server, const.db_2) as cursor:

        cursor.executemany('insert into preference (`id`,`theme`,`user_id`) values (%s,%s,%s)',preferences)

从cursor获取list类型的结果

cursor.execute('SELECT `name` FROM user;')

直接使用fetchall()，只能得到tuple包裹的数据

cursor.fetchall()

# (('Jack',), ('Ben'))

现在希望得到一个list结果集，做到像Django中flat=True那样的效果

有两种方法

列表解析式(list comprehension)
```
name_list = [x[0] for x in cursor.fetchall()]
```
这个方法的缺点在于会先使用fetchall()将结果集读到内存，再做列表转换，并不高效。
itertools工具
```
name_list = list(itertools.chain.from_iterable(cursor))
```
推荐使用这个方式，第一它不会将所有结果fetch到内存中，第二使用itertools生成列表比列表解析式要快

如何在数据迁徙中使用Django的model

需要拷贝Django的settings文件，删掉不需要的配置，并设置好迁徙目标数据库
需要拷贝用到此model的文件
需要在settings.INSTALLED_APPS中引入models.py文件所在的目录

在迁徙脚本头部启动Django

import os

import django

import sys

sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

os.environ.setdefault("DJANGO_SETTINGS_MODULE", "translate.settings")

django.setup()

通过SSH隧道的本地转发实现Django连接远程数据库

创建一个ssh隧道，将远程数据库映射到本地端口
```
ssh -L local_port:localhost:<remote mysql port> <username>@<remote host>
```
ssh连接进行时，可以通过访问本地端口来访问远程数据库

在Django的settings中配置数据库

DATABASES = {

    'default': {

        'ENGINE': 'django.db.backends.mysql',

        'NAME': db_name,

        'USER': remote_mysql_user, # 远程数据库账号密码

        'PASSWORD': remote_mysql_password,

        'HOST': "localhost",

        'PORT': local_port, # 远程数据库映射到本地的端口

        'OPTIONS': {'init_command': 'SET default_storage_engine=INNODB;'}

        }

}

至此，在使用Django的model时，将通过ssh隧道访问远程数据库

注意事项

事先了解迁徙数据量，并且取5%~10%的数据测试迁徙速度
由测试数据预估总迁徙用时，如果总迁徙用时大于一小时，一定要把迁徙脚本放到服务器运行，这样迁徙过程不易中断，且服务器性能远比个人电脑更优
尽量使用批量插入减少写数据库的次数，使用cursor.executemany或者Django的bulk_create
迁徙过程要写好log，这样能够知道数据迁徙到了哪一步，如意外终端也能找到断点继续运行
创建时间字段加上auto_add_now会自动记录数据的创建时间，在插入数据的时候对这个字段赋值无效

mysql数据迁徙详解的更多相关文章

MySQL 联合索引详解
MySQL 联合索引详解联合索引又叫复合索引.对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分.例如索引是key index (a,b,c ...
MySQL关闭过程详解和安全关闭MySQL的方法
MySQL关闭过程详解和安全关闭MySQL的方法 www.hongkevip.com 时间: -- : 阅读: 整理: 红客VIP 分享到: 红客VIP(http://www.hongkevip.co ...
【转】Nginx+php-fpm+MySQL分离部署详解
转:http://www.linuxidc.com/Linux/2015-07/120580.htm Nginx+php-fpm+MySQL分离部署详解 [日期:2015-07-26] 来源:Linu ...
Mysql加锁过程详解（8）-理解innodb的锁(record,gap,Next-Key lock)
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（9）-innodb下的记录锁，间隙锁，next-key锁
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（1）-基本知识
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（2）-关于mysql 幻读理解
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（3）-关于mysql 幻读理解
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（4）-select for update/lock in share mode 对事务并发性影响
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

随机推荐

详解http报文
摘要作为一个web开发者,每天都在使用者Http协议,却总是一知半解.本文参看Http RFC7230规范,梳理了http报文部分. http 报文构成 start-line: 起始行,描述请求或响 ...
redis-分片（转）
转:https://www.cnblogs.com/houziwty/p/5167075.html 分片(partitioning)就是将你的数据拆分到多个 Redis 实例的过程,这样每个实例将只包 ...
今天第一次解决了程序在未装VS和XP下运行的问题
http://www.cnblogs.com/zero5/p/3162948.html 一位素不相识的朋友做的代码雨屏保程序 - 残雪孤侠 - 博客园上面是我的BLOG 群共享里,有程序和代码 ...
ArchLinux安（重）装指南
说实话,我其实是不想要出这篇博客的.在我这一个月安装Arch的过程中,让我感触比较深的一点是: 没有谁比这个系统的官方更懂它. 尤其是这种比较复杂的系统,更是如此. 这几天,我经历了一次重装,系统坏了 ...
Go语言基础之net/http
Go语言基础之net/http 2017年6月26日 Go语言内置的net/http包十分的优秀,提供了HTTP客户端和服务端的实现. net/http介绍 Go语言内置的net/http包提供了HT ...
[以太坊源代码分析] I.区块和交易，合约和虚拟机
最近在看以太坊(Ethereum)的源代码, 初初看出点眉目. 区块链是近年热点之一,面向大众读者介绍概念的文章无数,有兴趣的朋友可自行搜索.我会从源代码实现入手,较系统的介绍一下以太坊的系统设计和协 ...
WebGL简易教程(十)：光照
目录 1. 概述 2. 原理 2.1. 光源类型 2.2. 反射类型 2.2.1. 环境反射(enviroment/ambient reflection) 2.2.2. 漫反射(diffuse ref ...
RocketMQ消息队列部署与可视化界面安装
MQ安装部署最新版本下载:http://rocketmq.apache.org/release_notes 修改配置 vi conf/broker.conf 添加brokerIP1 brokerIP ...
logback颜色
官网日志连接:https://logback.qos.ch/manual/layouts.html#coloring 举例 logging.pattern.console=%red(%d{yyyy-M ...
IntelliJ IDEA下载安装及破解(100%成功)教程
原文链接:http://www.studyshare.cn/software/details/1182/0 一.下载 1.IntelliJ IDEA下载网盘下载:https://pan.baidu. ...