MySQL下200GB大表备份，利用传输表空间解决停服发版表备份问题

问题背景

在停服发版更新时，需对 200GB 大表（约 200 亿行数据）进行快速备份以预防操作失误。

因为曾经出现过有开发写的发版语句里，UPDATE语句的WHERE条件写错了，原本只需要更新几行数据，最终导致更新了半张表的数据。

MySQL版本是MySQL 8.0.X，为了预防这种情况，需要对某个重要的大表进行预先备份，以便可以及时回滚，及时恢复，及时回退，对于备份方法大概有下面几种:

方案	优点	缺点
`mysqldump` 导出	简单易用	大表导出耗时（200GB 可能需数小时）
`CREATE TABLE...SELECT`	直接 SQL 操作	数据复制慢，锁表风险高
表空间传输	秒级备份，零数据复制	需操作系统权限，依赖文件拷贝
主从复制/延迟复制	无需停服，恢复灵活	需主从架构，维护成本高

这个场景的核心需求：停服更新的时间非常有限，比如1个小时之内要完成更新。

操作流程

前面两种都比较简单，通过导数据的方法来备份旧表，万一出现问题，可以使用导出来的数据进行快速恢复，第三种方法估计比较少人用，下面是具体操作方法

源表与备胎表结构



-- 源表（aa）

CREATE TABLE aa (

id int(11) DEFAULT NULL,

  sname VARCHAR(100)

) ENGINE=InnoDB;

-- 备胎表（bb）

CREATE TABLE bb (

id int(11) DEFAULT NULL,

  sname VARCHAR(100)

) ENGINE=InnoDB;

greatsql> INSERTINTO aa SELECT1,"nihao";

2、查看两个表的表ID和表空间ID，可以看到aa表的表ID是1081 表空间ID是13，bb表的表ID是1082 表空间ID是14

greatsql> select * from information_schema.innodb_tables where name='school/aa'\G

*************************** 1. row ***************************

          TABLE_ID: 1081

              NAME: school/aa

              FLAG: 33

            N_COLS: 6

             SPACE: 13

        ROW_FORMAT: Dynamic

     ZIP_PAGE_SIZE: 0

        SPACE_TYPE: Single

      INSTANT_COLS: 0

TOTAL_ROW_VERSIONS: 0

1 row in set (0.01 sec)

greatsql> select * from information_schema.innodb_tables where name='school/bb'\G

*************************** 1. row ***************************

          TABLE_ID: 1082

              NAME: school/bb

              FLAG: 33

            N_COLS: 6

             SPACE: 14

        ROW_FORMAT: Dynamic

     ZIP_PAGE_SIZE: 0

        SPACE_TYPE: Single

      INSTANT_COLS: 0

TOTAL_ROW_VERSIONS: 0

1 row in set (0.00 sec)

3、备胎表卸载表空间：

greatsql> ALTER TABLE bb DISCARD TABLESPACE;  -- 加锁并生成配置文件

4、源表执行表空间导出：

greatsql> USE school;

greatsql> FLUSH TABLES aa FOR EXPORT;

5、拷贝表空间文件（ibd和cfg文件），然后重新赋予权限，确保导入表空间时候不会出现问题

$ cd /data/mysql/mysql3306/data/school

$ cp aa.ibd  bb.ibd  

$ cp aa.cfg  bb.cfg

$ chown -R mysql:mysql /data/mysql/mysql3306/data/*

6、在相同数据库下，备胎表导入表空间

greatsql> USE school;

greatsql> UNLOCK TABLES;

greatsql> ALTER TABLE bb IMPORT TABLESPACE;

7、查询表数据，验证数据一致性

greatsql> USE school;

greatsql> SELECT * FROM bb;

greatsql> SELECT * FROM aa;

查询表数据正常，没有任何问题

greatsql> SELECT * FROM aa;

+------+-------+

| id   | sname |

+------+-------+

|    1 | nihao |

+------+-------+

1 row in set (0.01 sec)

greatsql> SELECT * FROM bb;

+------+-------+

| id   | sname |

+------+-------+

|    1 | nihao |

+------+-------+

1 row in set (0.00 sec)

查看表的数据文件，没什么问题

$ ll

total 228

-rw-r----- 1 mysql mysql 114688 Mar  4 16:51 aa.ibd

-rw-r----- 1 mysql mysql    781 Mar  4 16:52 bb.cfg

-rw-r----- 1 mysql mysql 114688 Mar  4 16:52 bb.ibd

8、再次查看两个表的表ID和表空间ID，可以看到aa表的表ID是1081 表空间ID是13（没有变化），bb表的表ID是1083 表空间ID是14（表空间ID已经变了），bb表的表ID变了是防止与现有表冲突



mysql> select * from information_schema.innodb_tables where name='school/aa'\G

*************************** 1. row ***************************

          TABLE_ID: 1081

              NAME: school/aa

              FLAG: 33

            N_COLS: 6

             SPACE: 13

        ROW_FORMAT: Dynamic

     ZIP_PAGE_SIZE: 0

        SPACE_TYPE: Single

      INSTANT_COLS: 0

TOTAL_ROW_VERSIONS: 0

1 row in set (0.00 sec)

mysql> select * from information_schema.innodb_tables where name='school/bb'\G

*************************** 1. row ***************************

          TABLE_ID: 1083

              NAME: school/bb

              FLAG: 33

            N_COLS: 6

             SPACE: 14

        ROW_FORMAT: Dynamic

     ZIP_PAGE_SIZE: 0

        SPACE_TYPE: Single

      INSTANT_COLS: 0

TOTAL_ROW_VERSIONS: 0

1 row in set (0.00 sec)

9、发版更新与回滚

-- 发版操作（示例）

greatsql> UPDATE aa SET sname = 'new_value' WHERE id > 1;

10、如果发版有问题，直接交换表名，最快速度恢复整个表的数据

-- 回滚操作（交换表名）

greatsql> ALTER TABLE aa RENAME TO aa_temp; 

greatsql> ALTER TABLE bb RENAME TO aa;

总结

整个操作最重要的是第4步，操作系统级别的拷贝就完成了整个表的备份，相比于数据倒来倒去在速度上要快不少。另外，第5步的备胎表也可以不用导入，只有当发现发版出现问题时候，再导入也可以。

这种方法的关键优势如下

直接拷贝 .ibd 文件，无需逐行复制数据。
零锁表时间：FLUSH TABLES tablename FOR EXPORT 仅短暂加锁（秒级）。
快速恢复：通过表名交换实现秒级回滚。

特别适合于这几种场景：无主从架构的单实例环境、大表快速备份、停服时间敏感。

当然，如果有主从架构的话，则更加推荐使用第四种方法，在操作上也更加可控，短时间也能保证能够完成。

本文版权归作者所有，未经作者同意不得转载。