需求:解决私有环境数据库的基础数据同步问题,每当中心库基础数据发生改变时,其他私有库都会增量同步

Canal主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

Canal将自己伪装成MySQL的从服务器,接收主服务器的binlog日志,然后转发给客户端消费

搭建环境

MySQL环境

这里使用docker来快速启动一个mysql来模拟

docker run --name mysql -p 3307:3306 -d -e MYSQL_ROOT_PASSWORD=mysql mysql

启动后需要开启binlog,还需要将binlog的储存格式设置为ROW模式因为用的镜像是8.0的,默认开启了binlig,模式也是ROW

可以根据

SHOW VARIABLES LIKE 'log_bin'
SHOW VARIABLES LIKE 'binlog_format'

这两个sql来查看mysql是设置好

如果要设置的话可以进入到容器里边设置

docker exec -it mysql bash

配置文件在/etc/mysql/

echo 'log-bin=mysql-bin' >> my.cnf
echo 'binlog-format=ROW' >> my.cnf

将配置追加到my.cnf里,然后重启容器即可

以上命令可以简化为

docker exec -it mysql  bash -c "echo 'log-bin=mysql-bin' >> /etc/mysql/my.cnf"
docker exec -it mysql bash -c "echo 'binlog-format=ROW' >> /etc/mysql/my.cnf"

这样就可以省去进入容器的那一步

如果修改了配置记得重启容器

docker restart mysql

最后需要授权一个账号给canal

CREATE USER canal IDENTIFIED BY 'canal';
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES;

Canal环境

Canal使用的是软件包

官网:https://github.com/alibaba/canal/wiki/QuickStart

下载

wget https://github.com/alibaba/canal/releases/download/canal-1.0.17/canal.deployer-1.0.17.tar.gz

解压

mkdir /tmp/canal
tar zxvf canal.deployer-$version.tar.gz -C /tmp/canal

配置文件夹里有个example的文件夹,这是一个实列配置(instance),需要将这个实列配置成自己的数据源

vi conf/example/instance.properties

主要是修改数据库地址和用户名

canal.instance.master.address
canal.instance.dbUsername
canal.instance.dbPassword

在启动前还需要改一下启动脚本,因为canal启动默认是需要1G以上的jvm内存,如果内存太小会报错

canal Cannot allocate memory

在启动脚本startup.sh里找到JAVA_OPTS,将内存参数改成256m

然后启动

sh bin/startup.sh

logs里查看canal的日志,观察是否启动成功

客户端

启动成功后需要一个客户端来接收消息

先添加依赖

<dependency>
<groupId>com.alibaba.otter</groupId>
<artifactId>canal.client</artifactId>
<version>1.1.0</version>
</dependency>

官网提供了一个Java版本得Demo

https://github.com/alibaba/canal/wiki/ClientExample

将程序里得ip地址改成canal所在得ip,然后就可以启动了

在连接后会注册一个过滤规则

connector.subscribe(".*\\..*");

这个规则可以指定哪些表被监听

常见例子:

1.  所有表:.*   or  .*\\..*
2. canal schema下所有表: canal\\..*
3. canal下的以canal打头的表:canal\\.canal.*
4. canal schema下的一张表:canal\\.test1
5. 多个规则组合使用:canal\\..*,mysql.test1,mysql.test2 (逗号分隔)

注意在canal中得instance.properties配置文件里也有这个配置canal.instance.filter.regex,如果在客户端重新注册新的规则,配置文件的规则会被覆盖

使用了哪个规则可以看example日志

2022-02-14 14:41:59.773 [main] INFO  c.a.otter.canal.instance.core.AbstractCanalInstance - subscribe filter change to .*\..*
2022-02-14 14:41:59.773 [main] WARN c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^.*\..*$

在这个demo中,处理空事件超过120次就会停止

int totalEmptyCount = 120;
while (emptyCount < totalEmptyCount)

可以设置为while(true)

接下来获取事件

Message message = connector.getWithoutAck(batchSize);

Message中保存了List<CanalEntry.Entry>,遍历这个集合就能拿到消息,CanalEntry.Entry保存了元数据以及变更的详情

//反序列化
CanalEntry.RowChange rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
//具体事件
CanalEntry.EventType eventType = rowChage.getEventType();

接下来就是消费消息

 for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {
if (eventType == CanalEntry.EventType.DELETE) {
printColumn(rowData.getBeforeColumnsList());
} else if (eventType == CanalEntry.EventType.INSERT) {
printColumn(rowData.getAfterColumnsList());
} else {
System.out.println("-------&gt; before");
printColumn(rowData.getBeforeColumnsList());
System.out.println("-------&gt; after");
printColumn(rowData.getAfterColumnsList());
}
}

demo中监听了删除事件、新增事件和修改事件,可以看到

getBeforeColumnsList()是变更前的
getAfterColumnsList()是变更后的

更多的事件类型被封装在EventType

最后需要转化为具体的SQL,并在具体环境中执行变更SQL来解决业务场景

新增

   /**
* @param entry
* @param rowData
* @param flag 忽略主键新增
*/
static void insertSql(CanalEntry.Entry entry, CanalEntry.RowData rowData, boolean flag) { StringBuilder sql = new StringBuilder();
sql.append("insert into ").append(entry.getHeader().getTableName()).append(" (");
for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
if (flag && rowData.getAfterColumnsList().get(i).getIsKey()) {
continue;
}
sql.append(rowData.getAfterColumnsList().get(i).getName());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
} sql.append(") ").append("values ("); for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
if (flag && rowData.getAfterColumnsList().get(i).getIsKey()) {
continue;
}
sql.append(rowData.getAfterColumnsList().get(i).getValue());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
}
sql.append(") ");
System.out.println(sql);
}

更新

  static void updateSql(CanalEntry.Entry entry, CanalEntry.RowData rowData) {
StringBuilder sql = new StringBuilder();
sql.append("update ").append(entry.getHeader().getTableName()).append(" set ");
for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
sql.append(rowData.getAfterColumnsList().get(i).getName())
.append("=").append(rowData.getAfterColumnsList().get(i).getValue());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
} sql.append(" where "); for (CanalEntry.Column column : rowData.getAfterColumnsList()) {
if (column.getIsKey()) {
sql.append(column.getName()).append("=").append(column.getValue());
}
}
System.out.println(sql); }

删除

    static void deleteSql(CanalEntry.Entry entry, CanalEntry.RowData rowData) {
StringBuilder sql = new StringBuilder();
sql.append("delete ").append(entry.getHeader().getTableName()).append(" where ");
for (CanalEntry.Column column : rowData.getBeforeColumnsList()) {
if (column.getIsKey()) {
sql.append(column.getName()).append("=").append(column.getValue());
}
}
System.out.println(sql); }

最后消费了需要提交或者回滚事务

/logs/example中的meta.log中可以看到消费到哪个binlog,哪个偏移量

总结

Canal使用起来并不是非常复杂,虽然需要额外的写一个客户端,但实现起来代码量并不大

在我这个业务场景中,因为基础数据的变更不会非常频繁,所以对性能这方面没有太高要求

Canal搭建的更多相关文章

  1. 阿里Canal框架(数据同步中间件)初步实践

    最近在工作中需要处理一些大数据量同步的场景,正好运用到了canal这款数据库中间件,因此特意花了点时间来进行该中间件的的学习和总结. 背景介绍 早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存 ...

  2. canal数据同步

    前面提到数据库缓存不一致的几种解决方案,但是在不同的场景下各有利弊,而今天我们使用的canal进行缓存与数据同步的方案是最好的,但是也有一个缺点,就是相对前面几种解决方案会引入阿里巴巴的canal组件 ...

  3. canal demo搭建全记录

    一.环境介绍 canal是阿里开源的中间件,主要用于同步mysql数据库变更.具体参见:https://github.com/alibaba/canal/releases 搭建环境: vmware c ...

  4. mysql同步之otter/canal环境搭建完整详细版

    接上一篇mysql 5.7多源复制(用于生产库多主库合并到一个查询从库). 这一篇详细介绍otter/canal环境搭建以及当同步出现异常时如何排查.本文主要参考https://blog.csdn.n ...

  5. 「从零单排canal 02」canal集群版 + admin控制台 最新搭建姿势(基于1.1.4版本)

    canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据 订阅 和 消费.应该是阿里云DTS(Data Transfer Service)的开 ...

  6. 阿里Canal中间件的初步搭建和使用

    一.前言 Binlog是MySQL数据库的二进制日志,用于记录用户对数据库操作的SQL语句(除了数据查询语句)信息.而Binlog格式也有三种,分别为STATEMENT.ROW.MIXED.STATM ...

  7. CanalAdmin搭建Canal Server集群

    CanalAdmin搭建Canal Server集群 一.背景 二.机器情况 三.实现步骤 1.下载canal admin 2.配置canalAdmin 3.初始化canal admin数据库 4.启 ...

  8. Canal监控Mysql同步到Redis(菜鸟也能搭建)

    首先要Canal服务端下载:链接: https://pan.baidu.com/s/1FwEnqPC1mwNXKRwJuMiLdg 密码: r8xf 连接数据库的时候需要给予连接数据库权限:在my.i ...

  9. canal 环境搭建 canal 与kafka通信(三)

    canal 占用了生产者 .net core端 使用消费者获取canal 消息 安装 Confluent.Kafka  demo使用 1.3.0 public static void Consumer ...

随机推荐

  1. Mysql 8 使用过程中的命令记录

    Mysql 8 使用过程中的命令记录 注: 当前 MySQL 数据库的版本 8.0.27 修改密码 1. 使用其他用户修改root 密码 ALTER USER 'root'@'localhost' I ...

  2. [题解][ARC089D] ColoringBalls

    题目大意 有 \(n\) 个白色的小球排成一排,有一个长为 \(k\) 的字符串 \(S\).接下来进行 \(k\) 次操作. 第 \(i\) 个操作,选择一段连续的小球(可以为空),若 \(S\) ...

  3. 团队Arpha5

    队名:观光队 组长博客 作业博客 组员实践情况 王耀鑫 **过去两天完成了哪些任务 ** 文字/口头描述 完成服务器连接数据库部分代码 展示GitHub当日代码/文档签入记录 接下来的计划 服务器网络 ...

  4. NuGet包管理平台

    这节来讲一下.NET下的包管理平台:NuGet. 我们做一个项目,除了自己的代码文件之外,实际上还要引用诸多代码文件,这些文件可能是我们自己封装的底层框架代码,或者为了完成某个功能而引用的工具类文件等 ...

  5. 浅谈Nginx性能调优

    点击上方"开源Linux",选择"设为星标" 回复"学习"获取独家整理的学习资料! Linux系统参数优化 下文中提到的一些配置,需要较新的 ...

  6. SSH 证书登录教程

    开源Linux 专注分享开源技术知识 SSH 是服务器登录工具,提供密码登录和密钥登录. 但是,SSH 还有第三种登录方法,那就是证书登录.很多情况下,它是更合理.更安全的登录方法,本文就介绍这种登录 ...

  7. 详解 Java 17 中新推出的密封类

    Java 17推出的新特性Sealed Classes经历了2个Preview版本(JDK 15中的JEP 360.JDK 16中的JEP 397),最终定稿于JDK 17中的JEP 409.Seal ...

  8. 【面试普通人VS高手系列】为什么要使用Spring 框架?

    一个工作了4年的小伙伴,他说他从线下培训就开始接触Spring,到现在已经快5年时间了. 从来没有想过,为什么要使用Spring 框架. 结果在面试的时候,竟然遇到一个这样的问题. 大脑一时间短路了, ...

  9. 【远古黑历史】List链表及其功能

    前言 我知道有学校是禁用STL的, 但STL是真的香,加个蛋,嗯,好吃 所以,本人希望有更多OIer能使用STL,减少工作量! 初见STL 首先,什么是STL? STL,全称 Standard Tem ...

  10. form表单与CSS选择器和样式操作

    form表单 """获取前端用户数据并发送给后端服务器""" <form action=""></fo ...