1. 摘要

数据作为一家公司的重要资产,其重要程度不言而喻。数据库为数据提供存取服务,担任着重要的角色,如果因数据误删、服务器故障、病毒入侵等原因导致数据丢失或服务不可用,会对公司造成重大损失,所以数据库备份是数据系统中最为重要的一环。

MySQL备份按照类型分为逻辑备份、物理备份、快照备份,本文将通过图文方式对常见的逻辑备份工具的一致性备份流程进行说明,来进一步了解逻辑备份的整个流程是怎么实现的。

具体的信息可以看: 图解MySQL逻辑备份的实现流程

2. 概念

逻辑备份是数据库对象级的备份,其将数据库里的对象通过SQL查询出来并转储到文件中,包含了用于创建转储对象(数据库,表,触发器、自定义函数、存储过程等)的CREATE语句,和用于将数据加载到表中的INSERT语句。

一致性备份是指在某个时间点,导出的数据与导出的备份文件信息匹配,如果导出了多张表的数据,这些不同表之间的数据都是同一个时间点的数据,MySQL可以通过全局锁(FTWRL,锁表备份)和事务(single-transaction,一致性快照)实现。

锁表备份在Server层实现,备份期间该实例只能进行SELECT操作;事务的一致性快照备份在引擎层实现,支持MVCC引擎表(InnoDB)的备份,期间实例可以对任何表进行DML操作,DDL操作需要根据具体情况分析,本文会对该情况(一致性快照备份)进行说明。

 

常见的逻辑备份工具:MySQL官方的mysqldump、mysqlpump、mysqlshell的dump方法和第三方开源的mydumper

3. 工具说明

3.1 mysqldump

  • 说明

mysqldump使用单线程对表进行SELECT查询并转储到文件来达到备份的目的,作为MySQL最“古老”的备份工具,被广泛的使用在备份中。

  • 备份命令

mysqldump -udump_user -p -P3306 -h127.0.0.1 --master-data=2 --single-transaction --default-character-set=utf8 --all-databases --triggers --routines --events > all.sql
 
  • 备份流程

开启 general_log 查看备份流程,大致的备份流程如下图所示:

流程说明:

1. 连接数据库,设置当前变量,刷脏页并加一个全局读锁,此刻数据库实例只能SELECT,不能执行其他任何类型的操作(会影响到业务),再设置事务隔离级别和开启一致性快照,并获取BINLOG和GITD信息,此时所有的支持事务的表(INNODB)数据均来自同一时间点。最后再释放全局读锁,此刻数据库实例可以执行任何操作(正常情况下,加全局读锁和释放锁的时间很短)。

2. 获取备份对象的元数据信息并单线程导出表「SLEECT *」。导出表分3种情况:已经导出完成、还未导出和正在导出:

    • 对于已导出的表,可以做DDL操作(使用SAVEPOINT提前释放导出表的metadata lock);

    • 对还未导出的表,INNODB表的DDL操作,能否执行成功取决于DDL的操作方式:no-rebuild方式的DDL执行成功,rebuild方式的DDL执行失败(Table definition has changed),MyISAM引擎的表都能执行成功;

    • 对正在导出的表,DDL会出现MDL,此时对该表后续的查询都会出现MDL,导致业务不可用(时间根据备份时长决定),直到该表导出完成。

3. 获取除表外的其他对象:自定义函数、存储过程、VIEW等。

4. 获取当前的GTID信息,所有对象的导出均转储到一个文件,完成备份。

 

3.2 mysqlpump

  • 说明

mysqlpump并行导出功能的架构为:队列+线程,允许有多个队列,每个队列下有多个线程,一个队列可以绑定1个或者多个数据库。在mysqldump的基础上额外支持了:并行备份、延迟创建索引、备份用户、对象的通配符过滤、DEFINER忽略等特性。

mysqlpump的备份是基于表并行的,对于每张表的导出只能是单个线程的,如果一张表非常大,大部分的时间都是消耗在这个表的备份上,并行备份的效果可能就不明显。

  • 备份命令

    mysqlpump -udump_user -p -P3306 -h127.0.0.1 --set-gtid-purged=on --default-parallelism=2  --single-transaction --default-character-set=utf8 --exclude-databases=mysql,sys,information_schema,performance_schema > all.sql
  • 备份流程

开启 general_log 查看备份流程,大致的备份流程如下图所示:

流程说明:

1. 多线程连接数据库,设置当前变量,刷脏页并加一个全局读锁,此刻数据库实例只能SELECT,不能执行任何类型的操作(会影响业务),再设置事务隔离级别和开启一致性快照读并获取GITD 信息,此时所有的支持事务的表(INNODB)数据均来自同一时间点。最后再释放全局读锁,此刻数据库实例可以执行任何操作(正常情况下,加全局读锁和释放锁的时间很短)。

2. 获取除表外的其他对象:自定义函数、存储过程、VIEW等。

3. 获取备份对象的元数据信息并多线程导出表「SLEECT col1,col2,...」。导出表分3种情况:已经导出完成、还未导出和正在导出:

    • 对于已导出的表,不能做DDL操作(不支持SAVEPOINT);

    • 对还未导出的表,INNODB表的DDL操作,能否执行成功取决于DDL的操作方式:no-rebuild方式的DDL执行成功,rebuild方式的DDL执行失败(Table definition has changed),MyISAM引擎的表都能执行成功,但如果表结构先于DDL导出,再导出数据,则在还原的时候会报异常(表结构和导出的数据不一致);

    • 对正在导出的表,DDL会出现MDL,此时对该表后续的查询都会出现MDL,导致业务不可用(时间根据备份时长决定),直到该表导出完成。

4. 所有对象的备份均转储到一个文件,完成备份。备份文件中存储的表结构中只有主键,二级索引单独一行存储,目的是在恢复完数据后再添加二级索引,提高恢复效率(延迟创建索引)。

3.3 mydumper

  • 说明

mydumper利用INNODB的MVCC版本控制的功能,实现多线程并发获取一致性数据。特别是表以chunk的方式批量导出,即支持一张表多个线程以chunk的方式批量导出(基于行的多线程),备份的对象支持正则匹配。

  • 备份命令

mydumper -u dump_user -p -h 127.0.0.1 -P 3306 --use-savepoints --trx-consistency-only -r 100000 -t 2 -G -R -E -B sbtest -o /data/backup/

  --trx-consistency-only:如果不加,则FTWRL的锁在备份完成之后释放。加了会在获取到一致性快照读之后释放(UNLOCK TABLES)。

  --rows:-r,分片导出的行数。

  --use-savepoints 和 --rows互斥。

  • 备份流程

开启 general_log 查看备份流程,大致的备份流程如下图所示:

流程说明:

1. 连接数据库,设置当前变量,刷脏页并加一个全局读锁,此刻数据库实例只能SELECT,不能执行任何类型的操作(会影响业务),再获取BINLOG和GITD 信息并设置事务隔离级别和开启一致性快照,此时所有的支持事务的表(INNODB)数据均来自同一时间点。最后再释放全局读锁,此刻数据库实例可以执行任何操作(正常情况,加全局读锁和释放锁的时间很短)。

2. 获取备份对象的元数据信息并多线程导出表「SLEECT *」。导出表分3种情况:已经导出完成、还未导出和正在导出:

    • 对于已导出的表,可以做DDL操作(使用SAVEPOINT提前释放导出表的metadata lock,如果使用分片导出,SAVEPOINT将不可用);

    • 对还未导出的表,INNODB表的DDL操作,能否执行成功取决于DDL的操作方式:no-rebuild方式的DDL执行成功,rebuild方式的DDL执行失败(Table definition has changed),MyISAM引擎的表都能执行成功;

    • 对正在导出的表,DDL会出现MDL,此时对该表后续的查询都会出现MDL,导致业务不可用(时间根据备份时长决定),直到该表导出完成。

3. 所有表都导出完成后,再获取除表外的其他对象:自定义函数、存储过程、VIEW等

4. 所有对象的导出均转储到多个文件(将表数据分块导出成多个数据文件),完成备份。

3.4 mysqlshell

  • 说明

MySQL Shell 是Oracle官方提供的一个交互式工具,用于开发和管理MySQL的服务器。其中的util.dumpInstance、util.dumpSchemas、util.loadDump 等是对MySQL进行备份管理,使用zstd实时压缩算法,支持多线程备份,以chunk的方式批量导出,支持一张表多个线程以chunk的方式批量导出。

  • 备份命令

util.dumpSchemas(['sbtest'],'/data/backup',{"threads":1,"consistent":true})
  • 备份流程

流程说明:

1. 连接数据库,设置当前变量,刷脏页并加一个全局读锁,此刻数据库实例只能SELECT,不能执行任何类型的操作(会影响业务),再获取BINLOG、GITD和备份对象的元数据信息,接着设置事务隔离级别和启动一致性快照,此时所有的支持事务的表(INNODB)数据均来自同一时间点。最后再释放全局读锁,此刻数据库实例可以执行任何操作(正常情况,加全局读锁和释放锁的时间很短)。

2. 获取备份对象:自定义函数、存储过程、VIEW等。

3. 多线程导出表「SLEECT col1,col2,...」。导出表分3种情况:已经导出完成、还未导出和正在导出:

  • 对于已导出的表,不能做DDL操作(不支持SAVEPOINT);

  • 对还未导出的表,需要区分有没有PK或UK:

    • 没有PK和UK,还要根据DDL的操作方式:no-rebuild方式的DDL执行成功,rebuild方式的DDL执行失败(Table definition has changed),MyISAM引擎的表都能执行成功;

    • 有PK或UK,和正在导出的表情况一样,原因是在获取分片信息时需要查询表的最大最小值。

  • 对正在导出的表,DDL会出现MDL,此时对该表后续的查询都会出现MDL,导致业务不可用(时间根据备份时长决定),直到该表导出完成。

4. 所有对象的导出均转存到多个文件(将表数据分块导出成多个数据文件),完成备份。

3.5 小结

从上面各逻辑备份的流程中看到,在一致性备份下,所有表的DML操作不影响(除FTWRL短暂的时刻外),而DDL操作都存在一定的风险。所以在逻辑备份期间,要尽量避免DDL操作

各逻辑备份工具的参数可以看官方文档,对比各工具之后,如表所示:

推荐使用的逻辑备份,需要具备的条件:支持一致性备份、行级别的分片多线程导出、导出到多个文件(恢复快),延迟创建索引和savepoint能力。从上面表中看到,mydumpermysqlshell中的dump方法能满足较多的条件。

4. 总结

希望通过阅读本文,能让大家更清晰的了解逻辑备份的整个实现流程,在选择合适的逻辑备份时有帮助。

 

图解MySQL逻辑备份的实现流程的更多相关文章

  1. MySQL 逻辑备份工具

    简介: Mydumper.Myloader 是一个第三方的.开源的 MySQL 逻辑备份工具. 支持多线程,比起 mysqldump 要快很多,也能解决 innobackupex 备份工具对 MyIS ...

  2. (4.12)mysql备份还原——mysql逻辑备份之mysqldump

    关键词:mysql逻辑备份介绍,mysqldump,mysqldump最佳实践 我的相关文章:https://www.cnblogs.com/gered/p/9721696.html 正文 1.mys ...

  3. MySQL逻辑备份利器-mydumper

    关于mydumper的简介和下载请访问:https://launchpad.net/mydumper 简言之,mydumper是多线程逻辑备份,对于表和数据量很大的情况下,建议使用mydumper提高 ...

  4. MySQL 逻辑备份mysqldump&mysqlpump&mydumper原理解析

    目录 准备 mysqldump备份 mysqlpump备份 mydumper备份 想弄清除逻辑备份的原理,最好的办法是开启general_log,一探究竟 准备 创建用户 CREATE USER IF ...

  5. mysql逻辑备份与还原工具mysqldump

    (一)mysqldump介绍 mysqldump是MySQL自带的逻辑备份工具,类似于Oracle的expdp/impdp,mysqldump备份十分灵活,可以在以下级别对数据库进行备份: 实例下的所 ...

  6. mysql逻辑备份mydumper

      mydumper是一个针对MySQL的高性能多线程备份和恢复工具,它提供了并发备份功能,备份效率有很大提高. 安装mydumper yum安装 # rpm -ivh https://github. ...

  7. MySQL逻辑备份into outfile

    MySQL 备份之 into outfile 逻辑数据导出(备份) 用法: select xxx into outfile '/path/file' from table_name; mysql> ...

  8. MySQL逻辑备份mysqldump

    MySQL 备份之 mysqldump mysqldump mysqldump工具备份: 本质:导出的是SQL语句文件 优点:不论是什么存储引擎,都可以用mysqldump备成SQL语句 缺点:速度较 ...

  9. (十二)MySQL逻辑备份mysqldump

    (1)简介 语法 mysqldump -h服务器 -u用户名 -p密码 [-P端口号] [参数] 数据库名 >备份文件.sql 关于数据库: -A,--all-databases 所有库,会生成 ...

随机推荐

  1. 使用cookie/session实现简单的用户信息的保存

    cookie一般用来存储非关键信息 , 用户名和密码等敏感信息一般采用session 来存储:cookie和session的最大区别是当服务器端存储session 之后,用户再次请求时候只是请求了一个 ...

  2. javaScript设计模式:发布订阅模式

    发布订阅模式的思想是在观察者模式的基础上演变而来,在观察者模式中客户端监听到对象某个行为就触发对应任务程序.而在发布订阅模式中依然基于这个核心思想,所以有时候也会将两者认为是同一种设计模式.它们的不同 ...

  3. Java连接数据库报错:com.mysql.cj.jdbc.exceptions.CommunicationsException: Communications link failure

    解决方案 连接Mysql报错 The last packet sent successfully to the server was 0 milliseconds ago. The driver ha ...

  4. 安全市场迎来新挑战,FinClip助力车联网数据安全

    随着汽车工业的发展与电子技术的进步,智能汽车迎来了前所未有的蓬勃发展,随着汽车电动化.网联化.智能化交融发展,车辆运行安全.数据安全和网络安全风险交织叠加,安全形势更加复杂严峻......

  5. React 日常记录

    以下是学习重点 原文地址 浏览器环境 JS解析和执行.绘制.事件处理.静态资源加载和处理 GUI渲染线程和Javascript线程 调度策略 先到先得(FCFS) 对短进程不利 对I/O密集不利 单处 ...

  6. 计算机系统5-> 计组与体系结构2 | MIPS指令集(上)| 指令系统

    系列的上一篇计算机系统4-> 计组与体系结构1 | 基础概念与系统评估,学习了一些计算机的基础概念,将一些基本的计算机组成部分的功能和相互联系了解了一下,其中很重要的一个抽象思想就是软硬件的接口 ...

  7. thinkphp6事件监听event-listene

    事件系统可以看成是行为系统的升级版,相比行为系统强大的地方在于事件本身可以是一个类,并且可以更好的支持事件订阅者. 事件相比较中间件的优势是事件比中间件更加精准定位(或者说粒度更细),并且更适合一些业 ...

  8. CentOS 下 MySQL 服务搭建

    1. 卸载旧 MySQL 查看 rpm 包 rpm-qa | grep mysql 如果存在,使用如下命令卸载 rpm -e 查找是否存在mysql 相关目录 find / -name mysql 卸 ...

  9. 【报错解决】Uncaught TypeError: Failed to execute 'readAsDataURL' on 'FileReader': parameter 1 is not of type 'Blob'.

    项目开发日记-bug多多篇(2) 同时也是 实现一些功能(3) 真的痛苦,写一天代码遇到的bug够我写三天博客. 今天是为了做一个头像功能,具体说是用户上传头像文件并且预览的功能. <div c ...

  10. Java基础语法Day_06(面相对象和封装)

    第1节 描述类介绍与使用 day06_01_面向对象思想的概述 day06_02_面向对象思想的举例 day06_03_类和对象的关系 day06_04_类的定义 day06_05_对象的创建及其使用 ...