由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类

  • 1:备库写数据
  • 2:执行non-deterministic query
  • 3:回滚掺杂事务表和非事务表的事务
  • 4:binlog或者relay log数据损坏

数据不同步给应用带来的危害是致命的,当出现主从数据不一致的情况,常见的应对方法是先把从库下线,然后找个半夜三更的时间把应用停掉,重新执行同步,如果数据库的体积十分庞大,那工作量可想而知,会让人崩溃。本文介绍使用percona-toolkit工具对mysql主从数据库的同步状态进行检查和重新同步。

一:安装percona-toolkit

  1. # yum -y install perl-Time-HiRes
  2. # wget
  3. http://www.percona.com/downloads/percona-toolkit/2.2.13/tarball/percona-toolkit-2.2.13.tar.gz
  4. # tar -zxvpf percona-toolkit-2.2.13.tar.gz
  5. # cd percona-toolkit-2.2.13
  6. # perl Makefile.PL
  7. # make
  8. # make install

二:修改mysql 的binlog格式binlog_format参数为row格式

mysql binlog日志有三种格式,分别为Statement, Mixed,以及ROW!

1.Statement:

每一条会修改数据的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).

2.Row

不记录sql语句上下文相关信息,仅保存哪条记录被修改。

优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题

缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。

3.Mixed

是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。

主从数据库分别修改my.cnf文件相关配置项如下:

  1. binlog_format=ROW

三:使用pt-table-checksum工具检查数据一致性情况

用法参考:

假设192.168.1.205是主库,192.168.1.207是它的从库,端口在3306。

1. 先校验

  1. # pt-table-checksum --user=root --password=123456 \
  2. --host=192.168.1.205 --port=3306 \
  3. --databases=test --tables=t2 --recursion-method=processlist \
  4. --no-check-binlog-format --nocheck-replication-filters \
  5. --replicate=test.checksums

2. 根据校验结果,只修复192.168.1.207从库与主库不一致的地方:

  1. # pt-table-sync --execute --replicate \
  2. test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

3. 修复后,再重新校验一次。执行第一步的语句即可。

4. 检查修复结果: 登陆到192.168.1.207,执行如下sql语句返回若为空,则说明修复成功:

  1. SELECT
  2. *
  3. FROM
  4. test.checksums
  5. WHERE
  6. master_cnt <> this_cnt
  7. OR master_crc <> this_crc
  8. OR ISNULL(master_crc) <> ISNULL(this_crc)

各参数含义

  • --nocheck-replication-filters:不检查复制过滤器,建议启用。后面可以用--databases来指定需要检查的数据库。
  • --no-check-binlog-format:不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
  • --replicate-check-only:只显示不同步的信息。
  • --replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
  • --databases=:指定需要被检查的数据库,多个则用逗号隔开。
  • --tables=:指定需要被检查的表,多个用逗号隔开
  • h=127.0.0.1:Master的地址
  • u=root:用户名
  • p=123456:密码
  • P=3306:端口

下面我们来模拟下主从数据库不同步情况下的pt-table-checksum,为了方便,这里我们采用test schema

1: 主库上建表,插入测试数据

  1. mysql> create table t2 (id int primary key,name varchar(100) not null,salary int);
  2. mysql> CREATE PROCEDURE test_insert ()
  3. BEGIN
  4. DECLARE i INT DEFAULT 0;
  5. WHILE i<10000
  6. DO
  7. INSERT INTO t2
  8. VALUES
  9. (i,CONCAT('员工',i), i);
  10. SET i=i+1;
  11. END WHILE ;
  12. END;;
  13. mysql> CALL test_insert();

从库上校验当前数据的同步情况为正常。

从库上删除一半的数据

  1. mysql> delete from t2 where id > 5000;
  2. Query OK, 4999 rows affected (0.14 sec)
  3. mysql> select count(*) from t2;
  4. +----------+
  5. | count(*) |
  6. +----------+
  7. | 5001 |
  8. +----------+
  9. 1 row in set (0.01 sec)

2:使用pt-table-checksum工具进行校验:

  1. # pt-table-checksum --user=root --password=123456 \
  2. --host=192.168.1.205 --port=3306 \
  3. --databases=test --tables=t2 --recursion-method=processlist \
  4. --no-check-binlog-format --nocheck-replication-filters \
  5. --replicate=test.checksums

3:登陆从库进行查询checksum表

  1. mysql> SELECT
  2. *
  3. FROM
  4. test.checksums
  5. WHERE
  6. master_cnt <> this_cnt
  7. OR master_crc <> this_crc
  8. OR ISNULL(master_crc) <> ISNULL(this_crc)

4:使用pt-table-sync工具进行数据重新同步

  1. # pt-table-sync --execute --replicate \
  2. test.checksums --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

5:从库上验证数据,中文“员工”变成了“??”

检查主库,发现出现一样的情况,中文“员工”变成了“??”,猜想和字符集设置相关。

于是检查数据库字符集设置,发现test库字符集非utf8

主从库my.cnf文件添加如下配置项后重启数据库实例

  1. character_set_client=utf8
  2. character_set_server=utf8

重新执行以上1-4步,发现一切正常!关键第4步要加--charset=utf8 参数

  1. # pt-table-sync --execute --replicate \
  2. test.checksums --charset=utf8 \
  3. --sync-to-master h=192.168.1.207,P=3306,u=root,p=123456

使用Percona Toolkit解决Mysql主从不同步问题【备忘】的更多相关文章

  1. 解决mysql 主从数据库同步不一致的方法

    接着上文 配置完Mysql 主从之后,在使用中可能会出现主从同步失败的情况. mysql> show slave status\G Slave_IO_Running: Yes Slave_SQL ...

  2. MySQL主从数据库同步延迟问题解决(转)

    最近在做MySQL主从数据库同步测试,发现了一些问题,其中主从同步延迟问题是其中之一,下面内容是从网上找到的一些讲解,记录下来以便自己学习: MySQL的主从同步是一个很成熟的架构,优点为:①在从服务 ...

  3. 配置MySQL主从双向同步

    原文地址:http://www.cnblogs.com/zhongshengzhen/ 原主数据库:192.168.137.33 原从数据库:192.168.137.197   需要先阅读并操作:ht ...

  4. MYSQL主从库同步配置过程

    MYSQL主从库同步配置过程 为了实现网站数据库的异地备份,采用了MySQL数据库主从同步配置,需要两台服务器分别作为主从库,当主库发生增删改等操作,会实时反映到从库,我的个人服务器配置如下: 主库为 ...

  5. Centos 配置 Mysql 主从双向同步

    配置之前,请先阅读mysql主从复制: Mysql-主从复制 原:  主从环境: 主服务器:192.168.153.130 从服务器:192.168.153.131 1.从数据库创建同步用户,将主数据 ...

  6. 如何实现 MySQL 的读写分离?MySQL 主从复制原理的是啥?如何解决 MySQL 主从同步的延时问题?

    如何实现 MySQL 的读写分离? 其实很简单,就是基于主从复制架构,简单来说,就搞一个主库,挂多个从库,然后我们就单单只是写主库,然后主库会自动把数据给同步到从库上去. MySQL 主从复制原理的是 ...

  7. MySQL主从数据同步延时分析

    一.MySQL数据库主从同步延迟                                                              要了解MySQL数据库主从同步延迟原理,我们 ...

  8. 减少mysql主从数据同步延迟

    网上给出的解决办法: 基于局域网的master/slave机制在通常情况下已经可以满足'实时'备份的要求了.如果延迟比较大,就先确认以下几个因素:1. 网络延迟2. master负载3. slave负 ...

  9. MySQL主从双向同步复制

    本文介绍了mysql主从,实现mysql的双向同步复制. MySQL支持单向.异步复制,复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器.主服务器将更新写入二进制日志文件,并维护日 ...

随机推荐

  1. jquery文件上传控件 Uploadify 问题记录

    Uploadify v3.2.1 首先引用下面的文件 <!--上传控件 uploadify--> <script type="text/javascript" s ...

  2. Delphi如何处理不同类型的文件

    参考:http://www.cnblogs.com/railgunman/articles/1800318.html 程序设计当中,我们时常遇到需要处理文件.目录及驱动器的情况,这里将对如何处理不同类 ...

  3. Acdream 1111:LSS(水题,字符串处理)

    LSS Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 128000/64000 KB (Java/Others) SubmitStati ...

  4. 【sicily】卡片游戏

    卡片游戏  Time Limit: 1sec    Memory Limit:32MB Description 桌上有一叠牌,从第一张牌(即位于顶面的牌)开始从上往下依次编号为1~n.当至少还剩两张牌 ...

  5. CentOS版本选择说明

    官方下载站http://www.centos.org/download/ 所有版本下载地址http://vault.centos.org/ 首先对一些镜像文件做个简单的介绍: LiveCD一般用来修复 ...

  6. tornado使用(Mac)

    安装需求 Tornado 在 Python 2.5, 2.6, 2.7 中都经过了测试.要使用 Tornado 的所有功能,你需要安装 PycURL (7.18.2 或更高版本) 以及 simplej ...

  7. Java Hour 62 J2EE App 服务器

    目前略微瓶颈了,准备换工作. tomcat.weblogic.jboss的区别,容器的作用 Apache 是一个http 服务器. Tomcat 是一web 应用程序服务器,支持部分的j2ee. Jb ...

  8. C#从Image上读取文本

    今天通过C#来实现一个读取Image上文本的功能. 1. 环境准备: 1). 下载 Microsoft Office SharePoint Designer 2007. 2). 安装请参考KB:htt ...

  9. 关于ICE

    转自:http://wenda.chinabaike.com/b/38322/2013/1103/614756.html 一.ICE产生的背景 基于信令协议的多媒体传输是一个两段式传输.首先,通过信令 ...

  10. Win7系统怎么开启远程桌面?Win7远程桌面怎么用(转)

    远程桌面服务开启之后,可以方便的远程管理服务器或计算机.为生活和工作带来不少便利呢,很多小伙伴还不知道怎么开启win7远程桌面吧(下面咗嚛以内网远程桌面为例)   工具/原料 Win7 Win7远程桌 ...