MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题

问题背景

在停服发版更新时,需对 200GB 大表(约 200 亿行数据)进行快速备份以预防操作失误。

因为曾经出现过有开发写的发版语句里,UPDATE语句的WHERE条件写错了,原本只需要更新几行数据,最终导致更新了半张表的数据。

MySQL版本是MySQL 8.0.X,为了预防这种情况,需要对某个重要的大表进行预先备份,以便可以及时回滚,及时恢复,及时回退,对于备份方法大概有下面几种:

方案 优点 缺点
mysqldump  导出 简单易用 大表导出耗时(200GB 可能需数小时)
CREATE TABLE...SELECT 直接 SQL 操作 数据复制慢,锁表风险高
表空间 传输 秒级备份 ,零数据复制 需操作系统权限,依赖文件拷贝
主从复制/延迟复制 无需停服,恢复灵活 需主从架构,维护成本高

这个场景的核心需求:停服更新的时间非常有限,比如1个小时之内要完成更新。

操作流程

前面两种都比较简单,通过导数据的方法来备份旧表,万一出现问题,可以使用导出来的数据进行快速恢复,第三种方法估计比较少人用,下面是具体操作方法

  1. 源表与备胎表结构

-- 源表(aa)
CREATE TABLE aa (
id int(11) DEFAULT NULL,
sname VARCHAR(100)
) ENGINE=InnoDB; -- 备胎表(bb)
CREATE TABLE bb (
id int(11) DEFAULT NULL,
sname VARCHAR(100)
) ENGINE=InnoDB; greatsql> INSERTINTO aa SELECT1,"nihao";

2、查看两个表的表ID和表空间ID,可以看到aa表的表ID是1081 表空间ID是13,bb表的表ID是1082 表空间ID是14

greatsql> select * from information_schema.innodb_tables where name='school/aa'\G
*************************** 1. row ***************************
TABLE_ID: 1081
NAME: school/aa
FLAG: 33
N_COLS: 6
SPACE: 13
ROW_FORMAT: Dynamic
ZIP_PAGE_SIZE: 0
SPACE_TYPE: Single
INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.01 sec) greatsql> select * from information_schema.innodb_tables where name='school/bb'\G
*************************** 1. row ***************************
TABLE_ID: 1082
NAME: school/bb
FLAG: 33
N_COLS: 6
SPACE: 14
ROW_FORMAT: Dynamic
ZIP_PAGE_SIZE: 0
SPACE_TYPE: Single
INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec)

3、备胎表卸载表空间:

greatsql> ALTER TABLE bb DISCARD TABLESPACE;  -- 加锁并生成配置文件

4、源表执行表空间导出:

greatsql> USE school;
greatsql> FLUSH TABLES aa FOR EXPORT;   

5、拷贝表空间文件(ibd和cfg文件),然后重新赋予权限,确保导入表空间时候不会出现问题

$ cd /data/mysql/mysql3306/data/school
$ cp aa.ibd  bb.ibd  
$ cp aa.cfg  bb.cfg
$ chown -R mysql:mysql /data/mysql/mysql3306/data/*

6、在相同数据库下,备胎表导入表空间

greatsql> USE school;
greatsql> UNLOCK TABLES;
greatsql> ALTER TABLE bb IMPORT TABLESPACE;

7、查询表数据,验证数据一致性

greatsql> USE school;
greatsql> SELECT * FROM bb;
greatsql> SELECT * FROM aa;

查询表数据正常,没有任何问题

greatsql> SELECT * FROM aa;
+------+-------+
| id   | sname |
+------+-------+
|    1 | nihao |
+------+-------+
1 row in set (0.01 sec) greatsql> SELECT * FROM bb;
+------+-------+
| id   | sname |
+------+-------+
|    1 | nihao |
+------+-------+
1 row in set (0.00 sec)

查看表的数据文件,没什么问题

$ ll
total 228
-rw-r----- 1 mysql mysql 114688 Mar  4 16:51 aa.ibd
-rw-r----- 1 mysql mysql    781 Mar  4 16:52 bb.cfg
-rw-r----- 1 mysql mysql 114688 Mar  4 16:52 bb.ibd

8、再次查看两个表的表ID和表空间ID,可以看到aa表的表ID是1081 表空间ID是13(没有变化),bb表的表ID是1083 表空间ID是14(表空间ID已经变了),bb表的表ID变了是防止与现有表冲突



mysql> select * from information_schema.innodb_tables where name='school/aa'\G
*************************** 1. row ***************************
TABLE_ID: 1081
NAME: school/aa
FLAG: 33
N_COLS: 6
SPACE: 13
ROW_FORMAT: Dynamic
ZIP_PAGE_SIZE: 0
SPACE_TYPE: Single
INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec) mysql> select * from information_schema.innodb_tables where name='school/bb'\G
*************************** 1. row ***************************
TABLE_ID: 1083
NAME: school/bb
FLAG: 33
N_COLS: 6
SPACE: 14
ROW_FORMAT: Dynamic
ZIP_PAGE_SIZE: 0
SPACE_TYPE: Single
INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec)

9、发版更新与回滚

-- 发版操作(示例)
greatsql> UPDATE aa SET sname = 'new_value' WHERE id > 1;

10、如果发版有问题,直接交换表名,最快速度恢复整个表的数据

-- 回滚操作(交换表名)
greatsql> ALTER TABLE aa RENAME TO aa_temp; 
greatsql> ALTER TABLE bb RENAME TO aa; 

总结

整个操作最重要的是第4步,操作系统级别的拷贝就完成了整个表的备份,相比于数据倒来倒去在速度上要快不少。另外,第5步的备胎表也可以不用导入,只有当发现发版出现问题时候,再导入也可以。

这种方法的关键优势如下

  • 直接拷贝 .ibd 文件,无需逐行复制数据。
  • 零锁表时间:FLUSH TABLES tablename FOR EXPORT 仅短暂加锁(秒级)。
  • 快速恢复:通过表名交换实现秒级回滚。

特别适合于这几种场景:无主从架构的单实例环境、大表快速备份、停服时间敏感。

当然,如果有主从架构的话,则更加推荐使用第四种方法,在操作上也更加可控,短时间也能保证能够完成。

本文版权归作者所有,未经作者同意不得转载。

MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题的更多相关文章

  1. 【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化(转载)

    原文地址:http://blog.csdn.net/zwan0518/article/details/11972853 目录(?)[-] 一查询优化 1创建索引 2缓存的配置 3slow_query_ ...

  2. WebService下实现大数据量的传输

    设置RemotingFormat = SerializationFormat.Binary;再序列化,通过WebService传输,客户端接收,再反序列化,确实效果大大的优于直接传送DataSet,不 ...

  3. mysql innobackupex xtrabackup 大数据量 备份 还原

    大数据量备份与还原,始终是个难点.当MYSQL超10G,用mysqldump来导出就比较慢了.在这里推荐xtrabackup,这个工具比mysqldump要快很多. 一.Xtrabackup介绍 1, ...

  4. mysql innobackupex xtrabackup 大数据量 备份 还原(转)

    原文:http://blog.51yip.com/mysql/1650.html 作者:海底苍鹰 大数据量备份与还原,始终是个难点.当MYSQL超10G,用mysqldump来导出就比较慢了.在这里推 ...

  5. Mysql千万级大表优化

    Mysql的单张表的最大数据存储量尚没有定论,一般情况下mysql单表记录超过千万以后性能会变得很差.因此,总结一些相关的Mysql千万级大表的优化策略. 1.优化sql以及索引 1.1优化sql 1 ...

  6. [20170623]利用传输表空间恢复部分数据.txt

    [20170623]利用传输表空间恢复部分数据.txt --//昨天我测试使用传输表空间+dblink,上午补充测试发现表空间设置只读才能执行impdp导入原数据,这个也很好理解.--//这样的操作模 ...

  7. 如何优化MySQL千万级大表

    很好的一篇博客,转载 如何优化MySQL千万级大表 原文链接::https://blog.csdn.net/yangjianrong1985/article/details/102675334 千万级 ...

  8. 【优化】MySQL千万级大表优化解决方案

    问题概述 使用阿里云rds for MySQL数据库(就是MySQL5.6版本),有个用户上网记录表6个月的数据量近2000万,保留最近一年的数据量达到4000万,查询速度极慢,日常卡死.严重影响业务 ...

  9. 简单实现TCP下的大文件高效传输

    简单实现TCP下的大文件高效传输 在TCP下进行大文件传输不象小文件那样直接打包个BUFFER发送出去,因为文件比较大所以不可能把文件读到一个BUFFER发送出去.主要有些文件的大小可能是1G,2G或 ...

  10. MySQL系统表的利用姿势(浅探)

    MySQL数据库文件读写 权限要求: 具备读写权限并且目标文件为可读内容 目标内容具有完整路径且目录可访问 目标内容是否具备文件读写操作权限 查看是否有文件读写权限 show variables li ...

随机推荐

  1. python:公共操作

    运算符 公共方法 range """ 1 2 3 4 5 6 7 8 9 """ # 不包含 end# 如果不写开始,默认从零开始# 如果不 ...

  2. LinkedList可以同时作为堆栈和队列使用

    Java里的LinkedList可以同时作为堆栈和队列使用,因此在使用的时候总是会弄混他们的方法,此文就简单总结一下作为不同数据结构使用时的用法. 作为队列   方法 声明 任意两种方法: 一是直接声 ...

  3. C# Newtonsoft.Json JObject常用方法

    1.创建-用匿名对象创建 JObject JObject ob = JObject.FromObject(new { RPT_ID = "getList", pageSize = ...

  4. .net core使用Nacos注册中心

    一.前言 好久不见~复工第一更 本文仅参考Nacos快速开始,实现Windows本机单节点测试部署Nacos服务,不适用于生产环境. Nacos是实现动态服务发现.配置管理和服务管理平台的项目,由阿里 ...

  5. WitAwards 2024荣耀登榜!AOne载誉而归!

    近日,FCIS 2024网络安全创新大会在上海举办.本次大会以"迈向安全服务化时代"为主题,邀请来自全球的网安精英.技术专家.CISO/CSO.白帽子.创业者等展开深度对话,分享与 ...

  6. FreeSql学习笔记——12.执行Sql

    前言   FreeSql支持通过Sql语句配合ISelect生成最终的Sql语句,也可以执行原生自定义Sql语句,使操作更灵活:通过sql语句与Iselect配合使用更好控制sql语句: 简单查询 _ ...

  7. 正权图的 Dijkstra 最短路算法

    最短路径问题是图论中最经典且重要的应用问题之一.它的目标是找到一个图中从起点到终点的最短路径,即在所有可能的路径中,选择一条边权和最小的路径.该问题广泛存在于多个实际场景中,比如交通运输.通信网络.导 ...

  8. Arduino语法--数据类型

    Arduino与C语言类似,有多种数据类型.数据类型在数据结构中的定义是一个值的集合,以及定义在这个值集上的一组操作,各种数据类型需要在特定的地方使用.一般来说,变量的数据类型决定了如何将代表这些值的 ...

  9. MySQL Q&A - [01] root密码忘记了怎么办

    题记部分 Windows 场景下 1.先使用管理员身份打开两个命令提示符窗口(winA和winB) 2.在命令提示符窗口winA中将MySQL服务停掉net stop mysql Microsoft ...

  10. Avalanche公链深度解析:创新共识、亚秒级最终性与生态竞争力

    摘要:Avalanche定位为一个高性能.可扩展的Layer 1区块链平台,但它并不是一个新公链,其主网于2020年9月21日正式上线,有Ava Labs开发.Ava Labs成立于2018年,总部位 ...