高可用mysql之MHA源码剖析

* MHA的整个故障（离线）切换过程

	-　检测主库的状态，确认是否崩溃。

	- 确认服务崩溃，保存binlog，推送到主控机，并可以强制关闭主库避免脑裂。

	- 找出数据最新的从库（也就是read_master_log_pos最大的），确定下新主库。

	- 从最新从库上生成差异的relaylog，再加上未读取的binlog，应用到新主库，记下偏移。

	- （并发）的为其他从库生成差异的relaylog和binlog，应用到各个从库。

	- 从库指向新主库的偏移处，开始复制。

	
*　　源码部分关键逻辑

	**	读取配置

	**	检查配置

		-	检查apply_diff_relay_log的版本号

		-	连接所有服务器并读取状态（得知老主库）

		-	检查参数传进来的崩溃主库是否与老主库地址一致，否则终止切换

		-	检查老主库是否在离线主机列表中，不在的话就终止切换

		-	检查是否真的连接不上mysql服务

		-	检查所有在线从库，是否都指向老主库

		-	检查是否有些不该忽略失败的从库已经离线

		-	检查上次切换是否失败

		-	检查上次切换发生时间与本次切换的时间间隔，太短则终止

		-	从所有从库获取“切换锁”

		-	保证所有从库的slave sql线程已经启动

	**	如果支持gtid自动定位但未启用，那么应该强制apply_diff_relay_log禁用log_bin？？

	**	强制关闭

		-	（并发）强制停止所有从库的slave io线程

		-	探测从主控机到崩溃主库所在主机的ssh可达性

		-	执行master_ip_failover_script，保证崩溃主库所在主机的ip失活防脑裂，否则终止切换

		-	只要有一个在线从库的salve io线程停止失败，那么就终止切换

	**	探测出复制延迟最小的从库、复制延迟最大的从库

	**	根据最新从库的slave io线程的读头，保存老主库的binlog。

		-	如果崩溃主库所在主机不可达，那么就会丢失binlog（Read_Master_Log_Pos to the tail）

		-	如果可达，ssh连接上去，然后执行save_binary_logs --command=save，将保存后的binlog拷贝到主控机，这步称呼read_to_tail。

	**	根据最新、最老从库的读头以及某些从库的可忽略失败，来决定哪个从库作为relaylog、binlog补偿的基准

		-	如果所有从库的读头一致，跳过

		-	ssh逐一连接最新从库，执行apply_diff_relay_logs --command=find，看是否realylog包含了最老从库的读头。

		-	如果没有用来补偿的基准从库，终止切换

	**	选择新主库（新主库不一定是最新从库，参照“在线切换”中的描述）

	**	恢复新主库

		-	若果新主库的读头落后于最新从库，那么ssh连接上最新从库，执行apply_diff_relay_logs --command=generate_and_send，

			从最新从库的relaylog中提取新主库读头直到最新从库读头处的二进制日志，这步称呼为read_to_latest,

			$latest_slave->{Master_Log_File}:$latest_slave->{Read_Master_Log_Pos}

		-	将主控机保存好的最新从库读头到主库binlog尾部的日志（read_to_tail），拷贝到新主库

		-	如果不是最新从库或者有保存过read_to_tail，那么就应用差异日志。

			--	首先等待新主库上已经有的relaylog都重放完毕，停止slave sql线程

			--	读取最新复制状态

			--	ssh执行save_binary_logs --command=save， 从自身relaylog中恢复exec_to_read

			--	ssh执行apply_diff_relay_logs --command=apply，将前面生成的3部分补偿日志全部导入。

		-	执行主控机上的master_ip_failover --command=start脚本，激活新主库的ip。

		-	关闭新主库的只读，开启可写模式。

	**	恢复所有从库（类似单独恢复主库的过程）

		-	（并发）中继补偿，生成read_to_latest

		-	（并发）将早生成的read_to_tail部分，拷贝到各个从库，应用差异日志，指向新主库，启动复制

		-	新主库执行reset slave

*	MHA(在线)主库切换过程

	sudo /usr/bin/masterha_master_switch --master_state=alive --conf=/etc/masterha/app1.cnf --new_master_host=192.168.128.130  --new_master_port=3309 --orig_mast\

er_is_new_slave 

	**	识别老主库。

		-	读取配置MHA配置文件；

		-	连接并读取所有的数据库服务状态；

			-	（并发）连接所有从库，看mysql服务是否在运行，如果机器都宕机了，那就终止本次切换。

			-	遍历每台从库，获取所有能获取的信息，比如：msyql服务版本号、是否开启了gtid、是否开启了log-bin、

				是否只读、复制相关系统变量和状态变量。

			-	统计服务器信息：离线服务器、在线服务器、在线从库、失败从库等。

			-	比较所有从库的mysql服务版本，找出最老和最新的版本。

			-	验证当前真正的主库是谁？

				-	统计在线服务器中的“非从库”（not_slave）标记，只能为1，否则终止本次切换过程。

				-	根据从库的指向来找出存在哪些主库（支持3层复制结构（主-从-从的从））。

					真正的主库必须是在“线并且可写”，如果没有一台主库可写或者存在两台可写，那么终止切换。

			-	判断本次切换是否支持gtid。

		-	检查所有在线从库上是否有复制账户并有相应的REPLICATION SLAVE权限；

		-	必要时在老主库上进行flush tables操作；

		-	从老主库获取“监视锁”；

		-	从所有从库获取“切换锁”；

		-	检查所有在线从库的复制健康状况；

			-	读取当前的复制状态；

			-	判断是否有问题（IO、SQL线程是否在运行，数据延迟多久）

	**	识别新主库。

		-	识别数据最新的从库；

			-	比较master_log_file:read_master_log_pos。

		-	选择新主库；

			- 识别优先从库，在线的并带有candidate_master标记。

			-	识别应该忽略的从库，带有no_master标记、或者未开启log_bin、或者mysql服务版本不是最老、与最新从库相比数据延迟比较大。

			-	选择优先级依次为：优先列表、最新从库列表、所有从库列表，但一定要排除忽略列表。

		-	检查新老主库的复制过滤规则是否一致；

			-	Binlog_Do_DB、Binlog_Ignore_DB、Replicate_Do_Table等。

	**	拒绝更新，防止脑裂。

		-	调用master_ip_online_change脚本，stop子命令。新主库上，设置为只读；

			老主库上，禁止会话级别的log_bin、优雅等待所有sql线程退出、设置为只读、

		-	必要时，在老主库，锁住所有表，并检查binlog是否已经停止前进。

			binlog停止前进后，记下偏移位置。

	**	重新读取所有在线从库的运行状态。

	**	新主库从老主库应用完所有的事件日志。

		-	新主库上，执行master_pos_wait，然后记下新主库binlog的file:pos。

		-	调用master_ip_online_change脚本，start。新主库上，设置为只读。

	** （并发）从库应用完老主库所有的事件日志并指向新主库。

		-	master_pos_wait

		-	change_master_and_start_slave

高可用mysql之MHA源码剖析的更多相关文章

高可用mysql之MHA的原理
MHA 如何工作的? MHA是如何工作的? ============================================================================== ...
分布式架构高可用架构篇_06_MySQL源码编译安装（CentOS-6.7+MySQL-5.6）
redhat: 下载:http://dev.mysql.com/downloads/mysql/ 选择5.6 source包解压 cmake . -DCMAKE_INSTALL_PREFIX=/us ...
（升级版）Spark从入门到精通（Scala编程、案例实战、高级特性、Spark内核源码剖析、Hadoop高端）
本课程主要讲解目前大数据领域最热门.最火爆.最有前景的技术——Spark.在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战.课 ...
(转)MySQL高可用架构之MHA
MySQL高可用架构之MHA 原文:http://www.cnblogs.com/gomysql/p/3675429.html 简介: MHA(Master High Availability)目前 ...
MySQL高可用集群MHA方案
MySQL高可用集群MHA方案爱奇艺在用的数据库高可用方案 MHA 是目前比较成熟及流行的 MySQL 高可用解决方案,很多互联网公司正是直接使用或者基于 MHA 的架构进行改造实现 MySQL 的 ...
mysql实现高可用架构之MHA
一.简介 MHA(Master HA)是一款开源的 MySQL 的高可用程序,它为 MySQL 主从复制架构提供了 automating master failover 功能.MHA 在监控到 mas ...
MySQL系列：高可用架构之MHA
前言从11年毕业到现在,工作也好些年头,入坑mysql也有近四年的时间,也捣鼓过像mongodb.redis.cassandra.neo4j等Nosql数据库.其实一直想写博客分享下工作上的零零碎碎 ...
mysql高可用架构之MHA，haproxy实现读写分离详解
MySQL高可用架构之MHA 一.运维人员需要掌握的MySQL技术: 1.基本SQL语句 2.基本的管理[库表数据的管理权限的管理] 3.容灾保证数据不丢失. 二.工作中MySQ ...
MySQL高可用系列之MHA（二）
一.參数说明 MHA提供了一系列配置參数.深入理解每一个參数的详细含义,对优化配置.合理使用MHA非常重要.非常多高可用性也都是通过合理配置一些參数而实现的. MHA包含例如以下配置參数,分别说明例如 ...

随机推荐

Ubuntu15.04安装不完全指南
0x00. 烧盘使用UltraISO(破解版)烧录到U盘里,设置电脑从U盘启动,即可安装. 安装时可能出现not COM32R image的命令行,“boot:” 后面直接输入live即可解决问题. ...
python爬虫学习(5) —— 扒一下codeforces题面
上一次我们拿学校的URP做了个小小的demo.... 其实我们还可以把每个学生的证件照爬下来做成一个证件照校花校草评比另外也可以写一个物理实验自动选课... 但是出于多种原因,,还是绕开这些敏感话题 ...
破解 Windows 下Markdown 编辑器 MarkdownPad 2
MarkdownPad 是 Windows 平台下一款优秀的 Markdown 编辑器,本文简单介绍 Markdown 以及使用一种方法破解 MarkdownPad 使其升级到专业版.该方法仅限于教育 ...
从BSP模型到Apache Hama
一.什么是BSP模型概述 BSP(Bulk Synchronous Parallel,整体同步并行计算模型)是一种并行计算模型,由英国计算机科学家Viliant在上世纪80年代提出.Google发布 ...
list<T> 的使用方法。
首先讲一个经常用到的Contains( )方法,用来测试一个元素是否在List内.这个功能跟SQL里面的" like % %"类似. 这个方法在数组中也存在,因为集合其实就是动态数 ...
jquery each函数 break和continue功能
jquery each函数 break和continue功能幸运的是另一个突破,持续一个jQuery循环方式.你可以打破在函数返回一个jQuery参数虚假循环.一个可以继续执行只是在做不指定返回值或返 ...
[LeetCode] Rising Temperature 上升温度
Given a Weather table, write a SQL query to find all dates' Ids with higher temperature compared to ...
MongoDB的备份和恢复
1.导出数据库/备份: @echo off F: cd F:\software1\mongdb\mongodb-win32-x86_64-\bin start mongodump.exe -h -d ...
ES6深入学习记录(一)class方法相关
今天学习class相关的一些使用方法,着重在于class extends class之间可以通过extends关键字实现继承,这比ES5的通过修改原型链实现继承,要清晰和方便很多. 上面的代码定义了一 ...
podfile The dependency `` is not used in any concrete target
内容提要: podfile升级之后到最新版本,pod里的内容必须明确指出所用第三方库的target,否则会出现The dependency `` is not used in any concrete ...

高可用mysql之MHA源码剖析

高可用mysql之MHA源码剖析的更多相关文章

随机推荐

热门专题