使用Percona Toolkit解决Mysql主从不同步问题【备忘】
由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类
- 1:备库写数据
- 2:执行non-deterministic query
- 3:回滚掺杂事务表和非事务表的事务
- 4:binlog或者relay log数据损坏
数据不同步给应用带来的危害是致命的,当出现主从数据不一致的情况,常见的应对方法是先把从库下线,然后找个半夜三更的时间把应用停掉,重新执行同步,如果数据库的体积十分庞大,那工作量可想而知,会让人崩溃。本文介绍使用percona-toolkit工具对mysql主从数据库的同步状态进行检查和重新同步。
一:安装percona-toolkit
- # yum -y install perl-Time-HiRes
- # wget
- http://www.percona.com/downloads/percona-toolkit/2.2.13/tarball/percona-toolkit-2.2.13.tar.gz
- # tar -zxvpf percona-toolkit-2.2.13.tar.gz
- # cd percona-toolkit-2.2.13
- # perl Makefile.PL
- # make
- # make install
二:修改mysql 的binlog格式binlog_format参数为row格式
mysql binlog日志有三种格式,分别为Statement, Mixed,以及ROW!
1.Statement:
每一条会修改数据的sql都会记录在binlog中。
优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)
缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
2.Row
不记录sql语句上下文相关信息,仅保存哪条记录被修改。
优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题
缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。
3.Mixed
是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。
主从数据库分别修改my.cnf文件相关配置项如下:
- binlog_format=ROW
三:使用pt-table-checksum工具检查数据一致性情况
用法参考:
假设192.168.1.205是主库,192.168.1.207是它的从库,端口在3306。
1. 先校验
- # pt-table-checksum --user=root --password=123456 \
- --host=192.168.1.205 --port=3306 \
- --databases=test --tables=t2 --recursion-method=processlist \
- --no-check-binlog-format --nocheck-replication-filters \
- --replicate=test.checksums
2. 根据校验结果,只修复192.168.1.207从库与主库不一致的地方:
- # pt-table-sync --execute --replicate \
- test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456
3. 修复后,再重新校验一次。执行第一步的语句即可。
4. 检查修复结果: 登陆到192.168.1.207,执行如下sql语句返回若为空,则说明修复成功:
- SELECT
- *
- FROM
- test.checksums
- WHERE
- master_cnt <> this_cnt
- OR master_crc <> this_crc
- OR ISNULL(master_crc) <> ISNULL(this_crc)
各参数含义
- --nocheck-replication-filters:不检查复制过滤器,建议启用。后面可以用--databases来指定需要检查的数据库。
- --no-check-binlog-format:不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
- --replicate-check-only:只显示不同步的信息。
- --replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
- --databases=:指定需要被检查的数据库,多个则用逗号隔开。
- --tables=:指定需要被检查的表,多个用逗号隔开
- h=127.0.0.1:Master的地址
- u=root:用户名
- p=123456:密码
- P=3306:端口
下面我们来模拟下主从数据库不同步情况下的pt-table-checksum,为了方便,这里我们采用test schema
1: 主库上建表,插入测试数据
- mysql> create table t2 (id int primary key,name varchar(100) not null,salary int);
- mysql> CREATE PROCEDURE test_insert ()
- BEGIN
- DECLARE i INT DEFAULT 0;
- WHILE i<10000
- DO
- INSERT INTO t2
- VALUES
- (i,CONCAT('员工',i), i);
- SET i=i+1;
- END WHILE ;
- END;;
- mysql> CALL test_insert();
从库上校验当前数据的同步情况为正常。
从库上删除一半的数据
- mysql> delete from t2 where id > 5000;
- Query OK, 4999 rows affected (0.14 sec)
- mysql> select count(*) from t2;
- +----------+
- | count(*) |
- +----------+
- | 5001 |
- +----------+
- 1 row in set (0.01 sec)
2:使用pt-table-checksum工具进行校验:
- # pt-table-checksum --user=root --password=123456 \
- --host=192.168.1.205 --port=3306 \
- --databases=test --tables=t2 --recursion-method=processlist \
- --no-check-binlog-format --nocheck-replication-filters \
- --replicate=test.checksums
3:登陆从库进行查询checksum表
- mysql> SELECT
- *
- FROM
- test.checksums
- WHERE
- master_cnt <> this_cnt
- OR master_crc <> this_crc
- OR ISNULL(master_crc) <> ISNULL(this_crc)
4:使用pt-table-sync工具进行数据重新同步
- # pt-table-sync --execute --replicate \
- test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456
5:从库上验证数据,中文“员工”变成了“??”
检查主库,发现出现一样的情况,中文“员工”变成了“??”,猜想和字符集设置相关。
于是检查数据库字符集设置,发现test库字符集非utf8
主从库my.cnf文件添加如下配置项后重启数据库实例
- character_set_client=utf8
- character_set_server=utf8
重新执行以上1-4步,发现一切正常!关键第4步要加--charset=utf8 参数
- # pt-table-sync --execute --replicate \
- test.checksums --charset=utf8 \
- --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456
使用Percona Toolkit解决Mysql主从不同步问题【备忘】的更多相关文章
- 解决mysql 主从数据库同步不一致的方法
接着上文 配置完Mysql 主从之后,在使用中可能会出现主从同步失败的情况. mysql> show slave status\G Slave_IO_Running: Yes Slave_SQL ...
- MySQL主从数据库同步延迟问题解决(转)
最近在做MySQL主从数据库同步测试,发现了一些问题,其中主从同步延迟问题是其中之一,下面内容是从网上找到的一些讲解,记录下来以便自己学习: MySQL的主从同步是一个很成熟的架构,优点为:①在从服务 ...
- 配置MySQL主从双向同步
原文地址:http://www.cnblogs.com/zhongshengzhen/ 原主数据库:192.168.137.33 原从数据库:192.168.137.197 需要先阅读并操作:ht ...
- MYSQL主从库同步配置过程
MYSQL主从库同步配置过程 为了实现网站数据库的异地备份,采用了MySQL数据库主从同步配置,需要两台服务器分别作为主从库,当主库发生增删改等操作,会实时反映到从库,我的个人服务器配置如下: 主库为 ...
- Centos 配置 Mysql 主从双向同步
配置之前,请先阅读mysql主从复制: Mysql-主从复制 原: 主从环境: 主服务器:192.168.153.130 从服务器:192.168.153.131 1.从数据库创建同步用户,将主数据 ...
- 如何实现 MySQL 的读写分离?MySQL 主从复制原理的是啥?如何解决 MySQL 主从同步的延时问题?
如何实现 MySQL 的读写分离? 其实很简单,就是基于主从复制架构,简单来说,就搞一个主库,挂多个从库,然后我们就单单只是写主库,然后主库会自动把数据给同步到从库上去. MySQL 主从复制原理的是 ...
- MySQL主从数据同步延时分析
一.MySQL数据库主从同步延迟 要了解MySQL数据库主从同步延迟原理,我们 ...
- 减少mysql主从数据同步延迟
网上给出的解决办法: 基于局域网的master/slave机制在通常情况下已经可以满足'实时'备份的要求了.如果延迟比较大,就先确认以下几个因素:1. 网络延迟2. master负载3. slave负 ...
- MySQL主从双向同步复制
本文介绍了mysql主从,实现mysql的双向同步复制. MySQL支持单向.异步复制,复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器.主服务器将更新写入二进制日志文件,并维护日 ...
随机推荐
- Jquery.Datatables 基本设置的中文注解
$(document).ready(function() { $('#example').dataTable({ "sScrollX": "100%", //表 ...
- Delphi编译dll时出错"Cannot debug project unless a host application is defined.use the run|parameters...dialog box."
问题: 在编写DLL程序的时候,按下F9或者按下那个绿色的箭头,会报错,如下 原因: 是因为你按下的F9或者那个绿色箭头是表示“Run”这个程序,但是DLL不是可执行文件,所以当然不能够运行,所以就会 ...
- Pyqt 打包资源文件
用打包工具将做好的Pyqt程序打包成exe后发现引用的资源图片都显示不了? 是否遇到了和我一样的问题呢.google之后找到了方法,一种方法是在程序中引用外部资源,另外一种方法是将资源文件转换为py文 ...
- PHP5中使用PDO连接数据库的方法
PDO(PHP Data Object) 是PHP 中加入的东西,是PHP 5新加入的一个重大功能,因为在PHP 5以前的php4/php3都是一堆的数据库扩展来跟各个数据库的连接和处理,php_my ...
- zzy:java采用的是16位的Unicode字符集作为编码方式------理解
java语言使用16位的Unicode字符集作为编码方式,是疯狂Java中的原话. 1,编码方式只是针对字符类型的(不包括字符串类,数值类型int等,这些只是在解释[执行]的时候放到Jvm的不同内存块 ...
- 同一个项目,项目名称不一致,这两个项目同时在Eclipse中出现
在Eclispse中,实际同一个项目,项目名称不一致,这两个项目同时在Eclipse中出现. ①打开项目文件夹,找到“.cproject”文件 ② 在<name>节点重命名 ③ 导入Ecl ...
- 纯window下VMware 安装 OS X El Capitan 原版映像【未完待续】
一.所需软件1.下载OS X El Capitan 10.11.2 15C50链接:http://pan.baidu.com/s/1skuLgAx 密码:u2jf 2.下载VMware Worksta ...
- nginx日志中文变成类似\xE9\xA6\x96\xE9\xA1\xB5-\xE6\x8E\xA8\xE8\x8D\x90的东西,治本方案
这里:https://groups.google.com/forum/#!topic/openresty/NcRSb5gTmVU 主要是: 这与 ngx_lua 无关,是较新的 nginx 核心引入的 ...
- DSP using Matlab 示例Example2.2
a. n = -2:10; x = [1:7,6:-1:1]; % generate x(n) [x11,n11] = sigshift(x,n,5); [x12,n12] = sigshift(x, ...
- css随记02布局
布局 二栏布局 利用absolute, margin .container { position: relative; } nav { position: absolute; left: 0px; w ...