MySQL 高可用集群搭建(GTID 模式 + 自动故障转移)


一、环境规划

角色

IP 地址

说明

主库 (Master)

192.168.1.100

运行 MySQL + Keepalived/MHA

从库1 (Slave1)

192.168.1.101

运行 MySQL + Keepalived/MHA

从库2 (Slave2)

192.168.1.102

运行 MySQL

虚拟 IP (VIP)

192.168.1.200

客户端访问入口


二、配置 GTID 主从同步

1. 所有节点配置 MySQL

# 编辑配置文件(MySQL 8.0)

sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf

[mysqld]

# 通用配置

server-id = 1                 # 主库设为 1,从库依次递增(2, 3...)

log_bin = /var/log/mysql/mysql-bin.log

binlog_format = ROW

expire_logs_days = 7

# GTID 配置

gtid_mode = ON                # 启用 GTID

enforce_gtid_consistency = ON # 强制 GTID 一致性

log_slave_updates = ON        # 从库记录 binlog(级联复制必需)

# 重启 MySQL

sudo systemctl restart mysql

2. 主库操作

-- 创建复制专用用户

CREATE USER 'repl'@'192.168.1.%' IDENTIFIED BY 'SecurePass123!';

GRANT REPLICATION SLAVE ON *.* TO 'repl'@'192.168.1.%';

FLUSH PRIVILEGES;

-- 查看 GTID 状态

SHOW MASTER STATUS\G

-- 输出示例:

-- File: mysql-bin.000001

-- Position: 154

-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5

3. 从库操作

-- 配置主库信息(所有从库执行)

CHANGE MASTER TO

MASTER_HOST = '192.168.1.100',

MASTER_USER = 'repl',

MASTER_PASSWORD = 'SecurePass123!',

MASTER_AUTO_POSITION = 1;  -- GTID 模式自动同步位置

-- 启动复制

START SLAVE;

-- 检查复制状态

SHOW SLAVE STATUS\G

-- 关键指标:

-- Slave_IO_Running: Yes

-- Slave_SQL_Running: Yes

-- Retrieved_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5

-- Executed_Gtid_Set: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5


三、自动故障转移方案


方案 1:Keepalived + VIP(快速切换)

1. 安装 Keepalived(主库和从库1)

# Ubuntu/Debian

sudo apt install keepalived

# CentOS/RHEL

sudo yum install keepalived

2. 主库 Keepalived 配置

sudo vim /etc/keepalived/keepalived.conf

vrrp_script chk_mysql {

script "/usr/bin/pgrep mysqld"  # 检查 MySQL 进程

interval 2

weight 2

}

vrrp_instance VI_1 {

state MASTER

interface eth0

virtual_router_id 51

priority 100                   # 主库优先级更高

advert_int 1

authentication {

auth_type PASS

auth_pass 1234

}

virtual_ipaddress {

192.168.1.200/24            # 虚拟 IP

}

track_script {

chk_mysql

}

}

3. 从库 Keepalived 配置

sudo vim /etc/keepalived/keepalived.conf

vrrp_instance VI_1 {

state BACKUP

interface eth0

virtual_router_id 51

priority 50                    # 优先级低于主库

advert_int 1

authentication {

auth_type PASS

auth_pass 1234

}

virtual_ipaddress {

192.168.1.200/24

}

track_script {

chk_mysql

}

}

4. 启动并验证

sudo systemctl restart keepalived

sudo systemctl enable keepalived

# 检查 VIP 绑定

ip addr show eth0 | grep 192.168.1.200


方案 2:MHA(智能故障转移)

1. 所有节点配置 SSH 免密登录

# 在 MHA Manager 节点执行

ssh-keygen -t rsa

ssh-copy-id root@192.168.1.100

ssh-copy-id root@192.168.1.101

ssh-copy-id root@192.168.1.102

2. 安装 MHA Node(所有 MySQL 节点)

# Ubuntu/Debian

sudo apt install mha4mysql-node

# CentOS/RHEL

sudo yum install https://github.com/yoshinorim/mha4mysql-node/releases/download/v0.58/mha4mysql-node-0.58-0.el7.noarch.rpm

3. 安装 MHA Manager(管理节点)

# Ubuntu/Debian

sudo apt install mha4mysql-manager

# CentOS/RHEL

sudo yum install https://github.com/yoshinorim/mha4mysql-manager/releases/download/v0.58/mha4mysql-manager-0.58-0.el7.noarch.rpm

4. 配置 MHA

sudo mkdir -p /etc/mha

sudo vim /etc/mha/app1.cnf

[server default]

manager_workdir=/var/log/mha/app1

manager_log=/var/log/mha/app1/manager.log

ssh_user=root

repl_user=repl

repl_password=SecurePass123!

ping_interval=3

[server1]

hostname=192.168.1.100

candidate_master=1

[server2]

hostname=192.168.1.101

candidate_master=1

[server3]

hostname=192.168.1.102

5. 启动 MHA

masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover

# 检查状态

masterha_check_status --conf=/etc/mha/app1.cnf


四、数据备份与恢复(GTID 模式)

1. 全量备份

# 使用 mysqldump(主库执行)

mysqldump -u root -p --all-databases --single-transaction --set-gtid-purged=ON > full_backup_$(date +%Y%m%d).sql

2. 增量备份

-- 定期记录 GTID 集合

SHOW GLOBAL VARIABLES LIKE 'gtid_executed';

-- 示例输出:3E11FA47-71CA-11E1-9E33-C80AA9429562:1-1000

-- 增量备份时导出新增 GTID 区间

mysqlbinlog --include-gtids='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001-2000' /var/log/mysql/mysql-bin.00000* > incremental_backup.sql

3. 数据恢复

# 全量恢复

mysql -u root -p < full_backup_20231001.sql

# 增量恢复

mysql -u root -p < incremental_backup.sql


五、主从切换操作

1. 手动切换(GTID 模式)

-- 在目标从库执行

STOP SLAVE;

RESET SLAVE ALL;

-- 提升为新主库

SET GLOBAL read_only = OFF;

-- 其他从库指向新主库

CHANGE MASTER TO

MASTER_HOST='192.168.1.101',

MASTER_USER='repl',

MASTER_PASSWORD='SecurePass123!',

MASTER_AUTO_POSITION=1;

START SLAVE;


六、验证与监控

1. 检查 GTID 一致性

-- 所有节点执行

SHOW GLOBAL VARIABLES LIKE 'gtid_executed';

-- 确保所有节点 GTID 集合相同

2. 监控复制延迟

SHOW SLAVE STATUS\G

-- 关注 Seconds_Behind_Master

3. 日志检查

# Keepalived 日志

journalctl -u keepalived

# MHA 日志

tail -f /var/log/mha/app1/manager.log


七、故障排查命令

1. 主从复制中断

-- 查看错误原因

SHOW SLAVE STATUS\G

-- 跳过错误(谨慎操作)

STOP SLAVE;

SET GTID_NEXT='3E11FA47-71CA-11E1-9E33-C80AA9429562:1001';

BEGIN; COMMIT;

SET GTID_NEXT='AUTOMATIC';

START SLAVE;

2. VIP 未漂移

# 检查 Keepalived 进程

ps aux | grep keepalived

# 手动释放 VIP

systemctl restart keepalived


八、关键注意事项

  1. GTID 限制
    • 禁止直接修改 gtid_purged,可能导致数据冲突。
    • 所有事务必须通过 GTID 复制,禁用非 GTID 操作(如 CHANGE MASTER TO MASTER_LOG_FILE)。
  2. 备份策略
    • 全量备份每日一次,增量备份每小时一次。
    • 使用 Percona XtraBackup 替代 mysqldump 支持热备份:

xtrabackup --backup --target-dir=/backup/xtrabackup/full

  1. 安全加固
    • 限制复制用户 IP 范围(如 repl'@'192.168.1.%')。
    • 加密备份文件并存储到远程服务器。

通过以上步骤,您将获得一个基于 GTID + Keepalived/MHA 的高可用 MySQL 集群,支持自动故障转移、数据一致性保障和快速恢复。

MySQL 高可用集群搭建部署的更多相关文章

  1. .Net Core2.1 秒杀项目一步步实现CI/CD(Centos7.2)系列一:k8s高可用集群搭建总结以及部署API到k8s

    前言:本系列博客又更新了,是博主研究很长时间,亲自动手实践过后的心得,k8s集群是购买了5台阿里云服务器部署的,这个集群差不多搞了一周时间,关于k8s的知识点,我也是刚入门,这方面的知识建议参考博客园 ...

  2. 实现CI/CDk8s高可用集群搭建总结以及部署API到k8s

    实现CI/CD(Centos7.2)系列二:k8s高可用集群搭建总结以及部署API到k8s 前言:本系列博客又更新了,是博主研究很长时间,亲自动手实践过后的心得,k8s集群是购买了5台阿里云服务器部署 ...

  3. 部署MYSQL高可用集群

                                                  mysql-day08     部署MYSQL高可用集群 u 集群架构                   ...

  4. Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建

    目录 目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...

  5. ProxySQL Cluster 高可用集群环境部署记录

    ProxySQL在早期版本若需要做高可用,需要搭建两个实例,进行冗余.但两个ProxySQL实例之间的数据并不能共通,在主实例上配置后,仍需要在备用节点上进行配置,对管理来说非常不方便.但是Proxy ...

  6. MHA 高可用集群搭建(二)

    MHA 高可用集群搭建安装scp远程控制http://www.cnblogs.com/kevingrace/p/5662839.html yum install openssh-clients mys ...

  7. MySQL高可用集群方案

    一.Mysql高可用解决方案 方案一:共享存储 一般共享存储采用比较多的是 SAN/NAS 方案. 方案二:操作系统实时数据块复制 这个方案的典型场景是 DRBD,DRBD架构(MySQL+DRBD+ ...

  8. MongoDB 3.4 高可用集群搭建(二)replica set 副本集

    转自:http://www.lanceyan.com/tech/mongodb/mongodb_repset1.html 在上一篇文章<MongoDB 3.4 高可用集群搭建(一):主从模式&g ...

  9. kubeadm部署k8s1.9高可用集群--4部署master节点

    部署master节点 kubernetes master 节点包含的组件: kube-apiserver kube-scheduler kube-controller-manager 本文档介绍部署一 ...

  10. HDFS-HA高可用集群搭建

    HA高可用集群搭建 1.总体集群规划 在hadoop102.hadoop103和hadoop104三个节点上部署Zookeeper. hadoop102 hadoop103 hadoop104 Nam ...

随机推荐

  1. 痞子衡嵌入式:恩智浦i.MX RT1180系列MCU启动那些事(2)- Boot配置(BOOT Pin/eFUSE)

    大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦i.MX RT118x系列MCU的Boot配置. 痞子衡旧文 <RT四位数Boot简介> 里为大家介绍了 Boot 基 ...

  2. Atcoder ABC390F Double Sum 3 题解 [ 绿 ] [ 贡献思维 ] [ 计数 ]

    Double Sum 3:简单计数题. 思路 首先考虑单个区间的 \(f\) 值如何计算,显然等于值域上连续段的个数.那么我们进一步观察值域上连续段的性质,发现一个连续段的开头一定满足比开头小 \(1 ...

  3. JavaScript 之 高级程序设计 基础篇 (一)

    导读 此篇文章为作者拜读JavaScrpit 第四版(红宝石)的笔记内容.适用于有经验的程序员阅读:作者 java开发出身.在之前前后端不分离的时代 使用esayUI JQuery的时代 经常写 js ...

  4. Sqoop - 使用场景

    Oracle >> HDFS sqoop import --connect jdbc:oracle:thin:@<oracle_host>:<oracle_port> ...

  5. 探秘Transformer系列之(7)--- embedding

    探秘Transformer系列之(7)--- embedding 0x00 概要 在Transformer中,把每个 Token(对应离散的输入数据,如单词或符号)映射到高维稠密向量空间的工作是由嵌入 ...

  6. Pycharm pull 报错“Pull Failed: refusing to merge unrelated histories”

    分析: 在github已将建立仓库 pycharm clone到本地 pycharm pull 在第3步报错 "Pull Failed: refusing to merge unrelate ...

  7. 朝花夕拾,帮三年前的自己改bug

    三年前,滨海之边马上毕业的老少年 经过几天半死不活的思考之后决定干前端 那个时候为了面试各种css属性js API背的是滚瓜烂熟 然后投简历,企业要项目经验, 我没有工作我哪来的项目经验啊 没人会管你 ...

  8. AI大模型的崛起:从技术突破到行业变革

    在人工智能技术飞速发展的今天,AI大模型作为新一代的智能工具,正逐步渗透到各行各业,引领着数字化转型的新浪潮.前瞻产业研究院发布的一份关于AI大模型场景应用的报告显示,2023年,我国AI大模型行业规 ...

  9. Go Module使用 六大场景讲解示例

    前言 通过学习Go是怎么解决包依赖管理问题的?.go module基本使用,我们掌握了 Go Module 构建模式的基本概念和工作原理,也初步学会了如何通过 go mod 命令,将一个 Go 项目转 ...

  10. EmlBuilder:一款超轻量级的EML格式电子邮件阅读和编辑工具

    EmlBuilder 是一款超轻量级的电子邮件阅读和编辑工具,针对EML格式的文件具有非常强大的解析和容错能力,可实现超文本邮件的编写,并具备内嵌图片的编辑功能.该工具内部使用EmlParse对电子邮 ...