MySQL数据库同步工具的设计与实现

一、背景

　　在测试过程中，对于不同的测试团队，出于不同的测试目的，我们可能会有多套测试环境。在产品版本迭代过程中，根据业务需求，会对数据库的结构进行一些修改，如：新增表、字段、索引，修改表、字段索引等操作，在一些流程不规范的公司，开发人员不按照规范操作，不及时将这些修改数据库的 SQL 提交到 SVN/Git，当修改后的业务代码部署到新环境时就会引起错误，从而影响测试效率。换个角度再说，就算流程规范的大公司，核心业务都采取分库分表的架构，上千张表难道我们都采用手工执行 SQL 的方式去添加和修改字段吗？这样当然不妥，也许会有同学想到，我们可以采取使用脚本语言的方式批量更新和修改对应数据库，这样也是一种方式，但这种情况的前提是执行人员非常清楚两个数据库的差异，如果执行人员自己也不清楚两个数据库之间的差异呢？可能有的同学又想到可以把源数据库的结构和数据都导入到目标数据库当中，这样就解决了。这样看似可行，但实际不妥。前面我们说了，有多套测试环境，他们的作用可能不一样，举个例子：测试环境用于内部测试，联调环境用于和外部系统的联调，如果我们把测试环境的数据库结构和所有数据都导入联调环境，那么联调环境原有的数据不存在了，无法再和外部进行联调了，所以这也不是一种好的方式。

　　基于以上种种原因，一个数据库结构同步工具貌似是一个比较好的解决方案。

二、实现功能

基于以上的分析，该工具需要实现以下三个功能

分析（diff）：分析源数据库和目标数据库结构上的差异，在执行同步和拷贝前建议先执行分析来确定源数据库和目标数据库的差异；
同步（sync）：只同步数据库的结构，不同步数据；
拷贝（copy）： 对于数据没有要求的情况，可以直接使用拷贝将源数据库的数据库结构和数据全部导入目标数据库；

三、实现思路

具体流程如下：

对传入指令进行解析，包括：源数据库和目标数据库的 IP、端口、用户名、密码、数据库名以及执行动作（diff、sync、copy）；
分析 db，执行 SQL；
分析 db 下的表，执行 SQL；
分析表的字段和索引，执行 SQL；

四、分析过程

我们要对数据库的结构进行比对和分析，包括：数据库、数据库下面表、表中的字段和索引，那具体我们应该如何来进行分析和比对呢？

既然我们要做的是MySQL数据库的同步工具，那么我们对 MySQL 数据库就需要有深入一点的了解。在MySQL中，把 INFORMATION_SCHEMA 看作是一个数据库，确切说是信息数据库。其中保存着关于当前 MySQL 服务器所维护的所有其他数据库的信息。如数据库名，数据库的表、表的字段与索引以及访问权限等等。所以我们应该关注的是 INFORMATION_SCHEMA 中的以下几张表：

SCHEMATA：提供了当前mysql实例中所有数据库的信息。SHOW DATABASES 的结果取之此表；
TABLES：提供了关于数据库中的表的信息（包括视图）。详细表述了某个表属于哪个 schema，表类型，表引擎，创建时间等信息。SHOW TABLES FROM SCHEMANAME的结果取之此表；
COLUMNS：提供了表中的列信息。详细表述了某张表的所有列以及每个列的信息。SHOW COLUMNS FROM SCHEMANAME.TABLENAME 的结果取之此表；
STATISTICS：提供了关于表索引的信息。SHOW INDEX FROM SCHEMANAME.TABLENAME 的结果取之此表；

关键 SQL：

SELECT * FROM SCHEMATA WHERE SCHEMA_NAME='XXX'；
SELECT * FROM TABLES WHERE TABLE_SCHEMA='XXX' AND TABLE_NAME='XX'；
SELECT * FROM COLUMNS WHERE TABLE_SCHEMA='XXX' AND TABLE_NAME='XX'；
SELECT * FROM STATISTICS WHERE TABLE_SCHEMA='XXX' AND TABLE_NAME='XX'；

五、代码实现

这里只对 sync（同步）做简单介绍：

@Slf4j

public class App {

  /**

   * java -jar xxxx.jar src dst action

   *

   * src: host:port:username:passwd

   *

   * dst: host:port:username:passwd

   *

   * action: sync(同步)|diff(比对)|copy(复制)

   *

   * eg. java -jar day09-1.0.0.jar 127.0.0.1:3366:root:123456 127.0.0.1:3377:root:123456 sync

   *

   * @param args src dst action

   */

  public static void main(String[] args) {

    log.info("db schema sync start, args={}", Arrays.toString(args));

    start(args);

  }

  public static void start(String[] args){

    // 1.校验,参数个数,类型,格式不对校验

    calibration(args);

    // 2.解析,将args 解析成 SyncActionDTO

    SchemaActionDTO actionDTO = parse(args);

    // System.out.println(actionDTO);

    // 3.执行同步/比对/复制

    SchemaHander.doAction(actionDTO);

  }

}

App 入口类

入口类包含三个步骤：校验参数、解析参数、执行操作（doAction）

public class SchemaHander {

  public static void  doAction(SchemaActionDTO actionDTO){

    ConnectDTO src = actionDTO.getSrc();

    ConnectDTO dst = actionDTO.getDst();

    Action action = actionDTO.getAction();

    if (Action.SYNC.equals(action)){

      SyncHander.doSync(src,dst);

    }else if (Action.DIFF.equals(action)){

      DiffHander.doDiff(src,dst);

    }else if (Action.COPY.equals(action)){

      CopyHander.doCopy(src,dst);

    }else {

      throw new IllegalStateException("do not supprt this action");

    }

  }

}

SchemaHander

根据接收到的指令的第三个参数从而做对应的操作（diff、sync、copy）

public class SyncHander {

  /**

   * 分析src和dst两个数据库实例

   * @param src

   * @param dst

   */

  public static void doSync(ConnectDTO src,ConnectDTO dst){

    // 1.解析src和dst中的db差异,相同的数据库名和不同的数据库名

    Pair<Set<String>, Set<String>> dbPair = parseDb(src, dst);

    System.out.println("dbPair = " + dbPair);

    // 2.src有,dst无

    DbHander.copyDb(src, dst, dbPair.getLeft());

    // 3.src有,dst有

    DbHander.diffDb(src, dst, dbPair.getRight());

  }

}

SyncHander

解析源数据库和目标数据库的差异，相同的数据库和不同的数据库（不同的指的是src中有二dst中没有）。

src 中有而 dst 中没有的数据库，直接在 dst 中创建数据库、表和索引。

src 中和 dst 中都有的数据库，则进一步分析该数据库中的表的情况。

public class DbHander {

  /**

   * 分析db，src有，dst有

   * @param src

   * @param dst

   * @param target

   */

  public static void diffDb(ConnectDTO src, ConnectDTO dst, Set<String> target){

    for (String db : target) {

      // 解析src和dst中的同名的数据库的差异，返回该数据库中表的差异，相同的表名和不同的表名

      Pair<Set<String>, Set<String>> tablePair = parseTable(src, dst, db);

      // 复制差异表

      TableHandler.copyTable(src, dst, db, tablePair.getLeft());

      // 对比相同表

      TableHandler.diffTable(src, dst, db, tablePair.getRight());

      }

  }

}

DbHander

套路和分析数据库一样

src 中有而 dst 中没有的表，直接在 dst 中创建。

src 中和 dst 中都有的表，则进一步分析该表的所有字段和字段属性。

public class TableHandler {

/**

   * 分析相同表的字段和索引

   * @param src 源

   * @param dst 目标

   * @param db  数据库

   * @param targetTables 分析的目标表

   */

  public static void diffTable(ConnectDTO src,

      ConnectDTO dst,

      String db,

      Set<String> targetTables) {

    for (String table : targetTables) {

      // 1.分析差异字段

      Pair<Set<String>, Set<String>> columnPair = parseColumn(src, dst, db, table);

      // 2.复制src有,dst无

      ColumnHandler.copyColumn(src, dst, db, table, columnPair.getLeft());

      // 3.分析src有,dst有

      ColumnHandler.diffColumn(src, dst, db, table, columnPair.getRight());

      // 1.分析差异索引

      Pair<Set<String>, Set<String>> indexPair = parseIndex(src, dst, db, table);

      // 2.复制src有,dst无

      IndexHander.copyIndex(src, dst, db, table, indexPair.getLeft());

      // 3.分析src有,dst有

      IndexHander.diffIndex(src, dst, db, table, indexPair.getRight());

    }

  }

}

TableHandler

src 中有而 dst 中没有的字段和索引，直接在 dst 中创建。

src 中和 dst 中都有的字段和索引，则进一步分析。

需要注意的是索引，由于索引分为普通索引、唯一索引、主键索引和组合索引几种类型，所以在生成修改 SQL 时会比较复杂。

public class ColumnHandler {

长度、是否可为空、默认值、注释

   * @param src 源数据库实例

   * @param dst 目标数据库实例

   * @param db  数据库

   * @param table 表

   * @param targetColumns 分析的目标列

   */

  public static void diffColumn(ConnectDTO src,

      ConnectDTO dst,

      String db,

      String table,

      Set<String> targetColumns) {

    for (String column : targetColumns) {

      String queryColumnInfoSql = String.format(

          "select * from COLUMNS where TABLE_SCHEMA='%s' and TABLE_NAME='%s' AND COLUMN_NAME='%s'",

          db, table, column);

      // 1.取出src中的column的几个我们关注的属性,COLUMN_TYPE,COLUMN_COMMENT,IS_NULLABLE,COLUMN_DEFAULT

      Set<ColumnInfoDTO> srcColumnSet = JdbcUtils

          .read(src, ConnectConsts.INFO_SCHEMA_DB_NAME, queryColumnInfoSql)

          .stream()

          .map(entity -> ColumnInfoDTO.builder()

              .columnComment(entity.get("COLUMN_COMMENT").toString())

              .columnDefault(StringUtils.defaultString(String.valueOf(entity.get("COLUMN_DEFAULT")), ""))

              .columnType(entity.get("COLUMN_TYPE").toString())

              .isNullable(entity.get("IS_NULLABLE").toString())

              .build()).collect(Collectors.toSet());

      // 2.取出dst中的column的几个我们关注的属性,COLUMN_TYPE,COLUMN_COMMENT,IS_NULLABLE,COLUMN_DEFAULT

      Set<ColumnInfoDTO> dstColumnSet = JdbcUtils

          .read(dst, ConnectConsts.INFO_SCHEMA_DB_NAME, queryColumnInfoSql)

          .stream()

          .map(entity -> ColumnInfoDTO.builder()

              .columnComment(entity.get("COLUMN_COMMENT").toString())

              .columnDefault(StringUtils.defaultString(String.valueOf(entity.get("COLUMN_DEFAULT")), ""))

              .columnType(entity.get("COLUMN_TYPE").toString())

              .isNullable(entity.get("IS_NULLABLE").toString())

              .build()).collect(Collectors.toSet());

      // 3.逐个去对比,如果不一样,就生成修改SQL,如果一样,就什么都不做

      // 3.1 这个differenceColumn是需要去修改到dst中的

      Set<ColumnInfoDTO> differenceColumn = Sets.difference(srcColumnSet, dstColumnSet)

          .immutableCopy();

      for (ColumnInfoDTO infoDTO : differenceColumn) {

        String sql = String.format("alter table %s modify column %s %s %s %s comment '%s'",

            table,

            column,

            infoDTO.getColumnType(),

            isNullableSet(infoDTO.getIsNullable()),

            isDefaultSet(infoDTO.getColumnDefault()),

            infoDTO.getColumnComment()

        );

        JdbcUtils.write(dst, db, sql);

      }

    }

  }

}

ColumnHandler

public class IndexHander {

/**

   * 分析相同表相同索引的属性，并修改dst中索引的属性

   * 属性包括索引类型，是否唯一，单索引还是组合索引

   * @param src 源

   * @param dst 目标

   * @param db  db

   * @param table 表

   * @param targeIndexs 分析的目标索引

   */

  public static void diffIndex(ConnectDTO src,

    ConnectDTO dst,

    String db,

    String table,

    Set<String> targeIndexs){

    for (String index : targeIndexs) {

      String queryIndexInfoSql = String.format(

              "select * from STATISTICS where TABLE_SCHEMA='%s' and TABLE_NAME='%s' and INDEX_NAME='%s'",

              db, table, index);

      // 查出该index信息的返回结果,如果是组合索引，一个索引名对应多条记录

      List<Map<String, Object>> entities = JdbcUtils

              .read(src, ConnectConsts.INFO_SCHEMA_DB_NAME, queryIndexInfoSql);

      // 1.取出src中的index的几个我们关注的属性,COLUMN_NAME,NON_UNIQUE,SEQ_IN_INDEX

      Set<IndexInfoDTO> srcIndexSet = JdbcUtils

              .read(src, ConnectConsts.INFO_SCHEMA_DB_NAME, queryIndexInfoSql)

              .stream()

              .map(entity-> IndexInfoDTO.builder()

                  .columnName(entity.get("COLUMN_NAME").toString())

                  .nonUnique(entity.get("NON_UNIQUE").toString())

                  .seqInIndex(entity.get("SEQ_IN_INDEX").toString())

              .build()).collect(Collectors.toSet());

      // 2.取出dst中的index的几个我们关注的属性,COLUMN_NAME,NON_UNIQUE,SEQ_IN_INDEX

      Set<IndexInfoDTO> dstIndexSet = JdbcUtils

              .read(dst, ConnectConsts.INFO_SCHEMA_DB_NAME, queryIndexInfoSql)

              .stream()

              .map(entity-> IndexInfoDTO.builder()

                      .columnName(entity.get("COLUMN_NAME").toString())

                      .nonUnique(entity.get("NON_UNIQUE").toString())

                      .seqInIndex(entity.get("SEQ_IN_INDEX").toString())

                      .build()).collect(Collectors.toSet());

      // 对比，找出名称一样，但是属性不一样的索引。组合索引的比对有问题

      Set<IndexInfoDTO> differenctIndex = Sets.difference(srcIndexSet, dstIndexSet).immutableCopy();

      System.out.println("differenctIndex.size() = " + differenctIndex.size());

      for (IndexInfoDTO infoDTO : differenctIndex) {

        System.out.println("infoDTO = " + infoDTO);

      }

      String sql = null;

      // 单列索引

      if (differenctIndex.size() == 1) {

        // 先删除dst中的索引

        deleteIndex(dst,db,table,index);

        // 再在dst中创建索引

        for (IndexInfoDTO indexDTO : differenctIndex) {

          if ("PRIMARY".equals(index)) {

            sql = String.format("ALTER TABLE %s ADD PRIMARY KEY(%s);", table, indexDTO.getColumnName());

          }else {

            sql = String.format("ALTER TABLE %s ADD %s %s(%s)",

                    table,

                    isNonUnique(indexDTO.getNonUnique()),

                    index,

                    indexDTO.getColumnName());

          }

          JdbcUtils.write(dst,db,sql);

          }

      // 组合索引

      }else if (differenctIndex.size() > 1) {

        // 先删除dst中的索引

        deleteIndex(dst,db,table,index);

        // 再在dst中创建索引

        String[] arrs = getPair(entities).getLeft();

        String nonUnique = getPair(entities).getRight();

        if ("PRIMARY".equals(index)){

          String baseSql = "alter table %s add primary key(";

          String formatSql = formatSql(arrs, baseSql);

          sql = String.format(formatSql, table);

        }else {

          String baseSql = "alter table %s add %s %s(";

          String formatSql = formatSql(arrs, baseSql);

          sql = String.format(formatSql, table, isNonUnique(nonUnique), index);

        }

        JdbcUtils.write(dst,db,sql);

      }

    }

  }

}

IndexHander

这里是分析字段和索引的过程。

以上所有代码，复制数据库、表、字段、索引的代码都没有贴出来，大家可以自己来实现。

另外，最后索引的分析有一个 bug，希望大家可以发现。

六、问题

上面，我们基本实现了这个工具的框架，但是还存在一些问题：

Connection

使用连接池,并且基于连接信息做了一个Map<ConnectDTO,DruidDatasource>

SQL 执行

使用批量执行SQL；

多线程执行

任务分割去从线程池中申请线程,然后去执行；

MySQL数据库同步工具的设计与实现的更多相关文章

数据库同步工具HKROnline SyncNavigator SQL Server互同步MySQL
需要联系我QQ:786211180 HKROnline SyncNavigator 是一款专业的 SQL Server, MySQL 数据库同步软件.它为您提供一种简单智能的方式完成复杂的数据库数据同 ...
mysql数据库同步
mysql数据库同步 1.1. Master 设置步骤配置 my.cnf 文件确保主服务器主机上my.cnf文件的[mysqld]部分包括一个log-bin选项.该部分还应有一个server-i ...
C#同步SQL Server数据库中的数据--数据库同步工具[同步新数据]
C#同步SQL Server数据库中的数据 1. 先写个sql处理类: using System; using System.Collections.Generic; using System.Dat ...
愚公oracle数据库同步工具
最近,利用一些时间对oracle数据库实时同步工具做了一些调研分析,主要关注了linkedin的databus和阿里的yugong两个中间件,其中databus需要在每个待同步的表上增加额外的列和触发 ...
windows下配置mysql数据库监视工具Mysqlreport
该工具除了可以监控本机Mysql数据库外,也可以监控远程服务器mysql数据库需要的工具: 1:perl脚本解析工具安装: http://www.activestate.com/activeperl ...
实现两个Mysql数据库同步
一. 概述 MySQL从3.23.15版本以后提供数据库复制(replication)功能,利用该功能可以实现两个数据库同步.主从模式.互相备份模式的功能.本文档主要阐述了如何在linux系 ...
MySQL数据库----IDE工具介绍及数据备份
一.IDE工具介绍生产环境还是推荐使用mysql命令行,但为了方便我们测试,可以使用IDE工具下载链接:https://pan.baidu.com/s/1bpo5mqj 二.MySQL数据备份 # ...
logstash-jdbc-input与mysql数据库同步
大多数情况下我们的数据都存放在了数据库中,但是elasticsearch它有自己的索引库,那么如果我们在做搜索的是时候就需要将数据库中的数据同步到elasticsearch中,在这里我们使用logst ...
Atitit.Gui控制and面板----db数据库领域----- .比较数据库同步工具 vOa
Atitit.Gui控制and面板----db数据库区----- .数据库比較同步工具 vOa 1. 咨微海信数据库应用工具 1 2. 数据库比較工具 StarInix SQL Compare ...

随机推荐

Django框架orm
一.django目录二.登录注册三.三件套四.orm简介五.基于orm的用户登录一.django目录 -settings -urls -views -强调:setting中的'django. ...
Ubuntu系统---安装QQ
使用Ubuntu很不方便,如果有什么消息的话,还要回到windows中查看.预想在Ubuntu上直接安装一个QQ,有网友说使用WebQQ发现老是掉线,于是这里安装QQ国际版. 首先,下载安装包. 这里 ...
vue.js中父组件触发子组件中的方法
知识点:vue.js中,父组件的method中,触发子组件中的方法,获得子组件中的定义的属性 (1)子组件 : child_crud.js var html_child_crud= "< ...
Webpack v4.8.3 快速入门指南
一.进入 https://webpack.docschina.org/ 官方文档,点击 "文档" 进入文档页面,文档中包含 “概念,配置,API,指南,LOADERS,插件&q ...
location - URL
1.hash:获取或设置href 属性中跟在数字符号 # 之后的内容 2.跳转页面: 1)location.href 2)location.replace() 3)location.reload(tr ...
Spring boot连接3.03以上的mongodb 权限验证问题
由于3.0.3,mongodb加入了SCRAM-SHA-1校验方式,需要第三方工具配合进行验证,所有Spring boot连接MongoDB时会出现用户认证失败. 解决方法: > use adm ...
云栖社区 Tensorflow快餐教程
云栖社区 Tensorflow快餐教程(1) - 30行代码搞定手写识别:https://yq.aliyun.com/articles/582122云栖社区 Tensorflow快餐教程(2) - 标 ...
转：JMeter5的If Controller操作解析
问题描述在JMeter中添加了If Controller控制器,然后再控制器的表达式输入框中输入了预先构造的为“真”条件,执行Run发现结果树中并没有监控到执行的记录. 问题分析在最新版JMete ...
第三方库requests详解
Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库.它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTT ...
Palindrome Degree（CodeForces 7D）—— hash求回文
学了kmp之后又学了hash来搞字符串.这东西很巧妙,且听娓娓道来. 这题的题意是:一个字符串如果是回文的,那么k值加1,如果前一半的串也是回文,k值再加1,以此类推,算出其k值.打个比方abaaba ...

MySQL数据库同步工具的设计与实现

MySQL数据库同步工具的设计与实现的更多相关文章

随机推荐

热门专题