mysql数据迁徙详解

数据迁徙是每个后端都会遇到的工作之一，本文介绍了一些常见的数据迁徙方法与工具

mysqldump：数据结构不变的数据迁徙

导出数据

mysqldump -u root -p DATABASE_NAME table_name > dump.sql

恢复数据

mysql -u root -p DATABESE_NAME < dump.sql

或者连接mysql客户端

mysql> source dump.sql

使用pymysql连接数据库

可以直接用用户名密码连接的数据库

class GeneralConnector:

    def __init__(self, config, return_dic=False):

        self.return_dic = return_dic

        self.config = config

    def __enter__(self):

        self.conn = pymysql.connect(**self.config, port=3306)

        if self.return_dic:

            # 一行数据会变成一个字典

            self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)

        else:

            self.cursor = self.conn.cursor()

        return self.cursor

    def __exit__(self, *args):

        self.cursor.close()

        self.conn.commit()

        self.conn.close()

使用：

# local_db = {

#     'user': 'root',

#     'passwd': '',

#     'host': '127.0.0.1',

#     'db': 'local_db'

#     }

with GeneralConnector(const.local_db, return_dic=True) as cursor:

    cursor.execute('SELECT `col1`, `col2` FROM test;')

    return cursor.fetchall()

连接处于需要SSH连接的服务器的数据库

class SSHConnector:

    def __init__(self, server, config, return_dic=False):

        self.return_dic=return_dic

        self.server = server

        self.config = config

    def __enter__(self):

        self.conn = pymysql.connect(**self.config, port=self.server.local_bind_port)

        if self.return_dic:

            # 一行数据会变成一个字典

            self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)

        else:

            self.cursor = self.conn.cursor()

        return self.cursor

    def __exit__(self, *args):

        self.cursor.close()

        self.conn.commit()

        self.conn.close()

使用：

# SERVER = SSHTunnelForwarder(

#         (remote_host, ssh_port),

#         ssh_username=USERNAME,

#         ssh_pkey=SSH_KEY,

#         ssh_private_key_password=SSH_KEY_PASSWD,

#         remote_bind_address=('127.0.0.1', 3306) # mysql服务位置

#     )

# server_db = {

#     'user': 'root',

#     'passwd': '',

#     'host': '127.0.0.1',

#     'db': 'server_db'

#     }

# 创建一个隧道将服务端的mysql绑定到本地3306端口

with const.SERVER as server:

    with SSHConnector(server, const.server_db) as cursor:

        cursor.execute('show tables;')

        data = cursor.fetchall()

        print(data)

cursor的各种操作

cursor.execute(sql_statement)

执行一条sql语句
cursor.fetchall()

获取cursor的所有结果，常跟在select语句后使用
cursor.fetchone()

获取cursor的第一条结果
cursor.lastrowid

最后一条数据的id

cursor.executemany(insert_statement, data_list)

批量插入一批数据，如

with const.SERVER as server:

    with connector.Connector(server, const.db_1) as cursor:

        cursor.execute('select * from preference')

        preferences = cursor.fetchall()

    with connector.Connector(server, const.db_2) as cursor:

        cursor.executemany('insert into preference (`id`,`theme`,`user_id`) values (%s,%s,%s)',preferences)

从cursor获取list类型的结果

cursor.execute('SELECT `name` FROM user;')

直接使用fetchall()，只能得到tuple包裹的数据

cursor.fetchall()

# (('Jack',), ('Ben'))

现在希望得到一个list结果集，做到像Django中flat=True那样的效果

有两种方法

列表解析式(list comprehension)
```
name_list = [x[0] for x in cursor.fetchall()]
```
这个方法的缺点在于会先使用fetchall()将结果集读到内存，再做列表转换，并不高效。
itertools工具
```
name_list = list(itertools.chain.from_iterable(cursor))
```
推荐使用这个方式，第一它不会将所有结果fetch到内存中，第二使用itertools生成列表比列表解析式要快

如何在数据迁徙中使用Django的model

需要拷贝Django的settings文件，删掉不需要的配置，并设置好迁徙目标数据库
需要拷贝用到此model的文件
需要在settings.INSTALLED_APPS中引入models.py文件所在的目录

在迁徙脚本头部启动Django

import os

import django

import sys

sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

os.environ.setdefault("DJANGO_SETTINGS_MODULE", "translate.settings")

django.setup()

通过SSH隧道的本地转发实现Django连接远程数据库

创建一个ssh隧道，将远程数据库映射到本地端口
```
ssh -L local_port:localhost:<remote mysql port> <username>@<remote host>
```
ssh连接进行时，可以通过访问本地端口来访问远程数据库

在Django的settings中配置数据库

DATABASES = {

    'default': {

        'ENGINE': 'django.db.backends.mysql',

        'NAME': db_name,

        'USER': remote_mysql_user, # 远程数据库账号密码

        'PASSWORD': remote_mysql_password,

        'HOST': "localhost",

        'PORT': local_port, # 远程数据库映射到本地的端口

        'OPTIONS': {'init_command': 'SET default_storage_engine=INNODB;'}

        }

}

至此，在使用Django的model时，将通过ssh隧道访问远程数据库

注意事项

事先了解迁徙数据量，并且取5%~10%的数据测试迁徙速度
由测试数据预估总迁徙用时，如果总迁徙用时大于一小时，一定要把迁徙脚本放到服务器运行，这样迁徙过程不易中断，且服务器性能远比个人电脑更优
尽量使用批量插入减少写数据库的次数，使用cursor.executemany或者Django的bulk_create
迁徙过程要写好log，这样能够知道数据迁徙到了哪一步，如意外终端也能找到断点继续运行
创建时间字段加上auto_add_now会自动记录数据的创建时间，在插入数据的时候对这个字段赋值无效

mysql数据迁徙详解的更多相关文章

MySQL 联合索引详解
MySQL 联合索引详解联合索引又叫复合索引.对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分.例如索引是key index (a,b,c ...
MySQL关闭过程详解和安全关闭MySQL的方法
MySQL关闭过程详解和安全关闭MySQL的方法 www.hongkevip.com 时间: -- : 阅读: 整理: 红客VIP 分享到: 红客VIP(http://www.hongkevip.co ...
【转】Nginx+php-fpm+MySQL分离部署详解
转:http://www.linuxidc.com/Linux/2015-07/120580.htm Nginx+php-fpm+MySQL分离部署详解 [日期:2015-07-26] 来源:Linu ...
Mysql加锁过程详解（8）-理解innodb的锁(record,gap,Next-Key lock)
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（9）-innodb下的记录锁，间隙锁，next-key锁
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（1）-基本知识
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（2）-关于mysql 幻读理解
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（3）-关于mysql 幻读理解
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...
Mysql加锁过程详解（4）-select for update/lock in share mode 对事务并发性影响
Mysql加锁过程详解(1)-基本知识 Mysql加锁过程详解(2)-关于mysql 幻读理解 Mysql加锁过程详解(3)-关于mysql 幻读理解 Mysql加锁过程详解(4)-select fo ...

随机推荐

Vue2.0+ElementUI实现表格翻页的实例
参考地址: https://www.cnblogs.com/zhouyifeng/p/7706815.html
Linux系统学习之Ln(软连接和硬链接)
可简单理解为,软连接:创建的软连接文件是源文件的快捷方式,删除创建的软连接文件,源文件不受影响,连接消失. 硬链接:两个连体的文件,修改其中一个文件,另外一个文件也会随之更改:删除其中一个文件,另外一 ...
python Django中的cookie和session
目录 Cookie 1.1获取Cookie 1.2设置Cookie Session 1.数据库Session 2.缓存Session 3.文件Session 4.缓存+数据库Session Cooki ...
一道短小精悍的JS小题目
看到题目你是不是以为我在开车,没错,我就不承认,你能咋的,你瞅啥,别瞅我,瞅题题目是这样式的结果是啥呀,这里我就不买关子了,结果是undefined,相信基础好一点的大佬们一眼就能看出来,像我这种 ...
python - json模块使用 / 快速入门
json基本格式 """ json格式 -> [{}, {}]: [{ "name": "Bob", "gende ...
netty源码解解析(4.0)-24 ByteBuf基于内存池的内存管理
io.netty.buffer.PooledByteBuf<T>使用内存池中的一块内存作为自己的数据内存,这个块内存是PoolChunk<T>的一部分.PooledByteBu ...
Git学习记录-基本命令篇
目录网页在线练习地址 https://learngitbranching.js.org/ 1.git commit Git 仓库中的提交记录保存的是你的目录下所有文件的快照,就像是把整个目录复制,然 ...
java IO、NIO、AIO详解
概述在我们学习Java的IO流之前,我们都要了解几个关键词同步与异步(synchronous/asynchronous):同步是一种可靠的有序运行机制,当我们进行同步操作时,后续的任务是等待当前调 ...
tp5中使用中间控制器代理路由，以避免创建过多的无用控制器方法
在写项目的时候偶尔会加载一些不需要传递参数的静态视图,例如 class Index extends Common { public function index() { return $this-&g ...
XGBoost: 你不能不知的机器学习算法
XGBoost作为一个非常常用的算法,我觉得很有必要了解一下它的来龙去脉,于是抽空找了一些资料,主要包括陈天奇大佬的论文以及演讲PPT,以及网络上的一些博客文章,今天在这里对这些知识点进行整理归纳,论 ...