1.概要

canal 是阿里发布的一个mysql 同步工具，它是模拟 mysql slave 的方式读取binlog，并可以将数据写入到队列中。

如下图：是官方提供的架构图。

2.下载CANAL

下载版本为1.1.5

其中

canal.deployer 是canal服务器

canal.admin 是CANAL可视化管理界面

3.配置canal

3.1 配置mysql

创建用户并授权

 create user 'canal'@'%' identified by 'canal';

grant SELECT, REPLICATION SLAVE, REPLICATION CLIENT on *.* to 'canal'@'%';

配置mysql

# 打开binlog

log-bin=mysql-bin

# 选择ROW(行)模式

binlog-format=ROW

# 配置MySQL replaction需要定义，不要和canal的slaveId重复

server_id=1

配置后重启mysql

查看binlog文件列表

查看当前写入的log文件

3.2 配置canal

编辑文件 conf/example/instance.properties

canal.instance.gtidon=false

# mysql地址

canal.instance.master.address=localhost:3306

# mysql 日志文件

canal.instance.master.journal.name=mysql-bin.000001

# 配置日志起始位置，配置为上图的 position。

canal.instance.master.position=3970

canal.instance.master.timestamp=

canal.instance.master.gtid=

# rds oss binlog

canal.instance.rds.accesskey=

canal.instance.rds.secretkey=

canal.instance.rds.instanceId=

# table meta tsdb info

canal.instance.tsdb.enable=true

# 用户名密码

canal.instance.dbUsername=canal

canal.instance.dbPassword=canal

canal.instance.connectionCharset = UTF-8

# enable druid Decrypt database password

canal.instance.enableDruid=false

#canal.instance.pwdPublicKey=MFwwDQYJKoZIhvcNAQEBBQADSwAwSAJBALK4BUxdDltRRE5/zXpVEVPUgunvscYFtEip3pmLlhrWpacX7y7GCMo2/JM6LeHmiiNdH1FWgGCpUfircSwlWKUCAwEAAQ==

# table regex

canal.instance.filter.regex=.*\\..*

# table black regex

canal.instance.filter.black.regex=mysql\\.slave_.*

# mq config

canal.mq.topic=example

# dynamic topic route by schema or table regex

#canal.mq.dynamicTopic=mytest1.user,mytest2\\..*,.*\\..*

canal.mq.partition=0

配置好后

正常的启动如下

是否启动成功，我们可以查看日志数据。

如果是mysql8 可能会报如下错误

Canal 1.1.5 启动报错：caching_sha2_password Auth failed

这个是mysql 的密码验证失败。

ALTER USER 'canal'@'%' IDENTIFIED WITH mysql_native_password BY 'canal';

执行这个后，在启动canal。

3.3 开发java程序读取同步数据

开发一个springboot程序。

引入jar包。

<dependency>

            <groupId>com.alibaba.otter</groupId>

            <artifactId>canal.client</artifactId>

            <version>1.1.5</version>

        </dependency>

        <dependency>

            <groupId>com.alibaba.otter</groupId>

            <artifactId>canal.protocol</artifactId>

            <version>1.1.5</version>

        </dependency>

开发编辑代码如下:

package com.example.canaldemo;

import com.alibaba.otter.canal.client.CanalConnector;

import com.alibaba.otter.canal.client.CanalConnectors;

import com.alibaba.otter.canal.protocol.CanalEntry;

import org.springframework.beans.factory.InitializingBean;

import org.springframework.stereotype.Component;

import com.alibaba.otter.canal.protocol.Message;

import com.alibaba.otter.canal.protocol.exception.CanalClientException;

import java.net.InetSocketAddress;

import java.util.List;

@Component

public class CannalClient implements InitializingBean {

    private final static int BATCH_SIZE = 1000;

    @Override

    public void afterPropertiesSet() throws Exception {

        // 创建链接

        CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress("127.0.0.1", 11111),

                "example", "", "");

        try {

            //打开连接

            connector.connect();

            //订阅数据库表,全部表

            connector.subscribe(".*\\..*");

            //回滚到未进行ack的地方，下次fetch的时候，可以从最后一个没有ack的地方开始拿

            connector.rollback();

            while (true) {

                // 获取指定数量的数据

                Message message = connector.getWithoutAck(BATCH_SIZE);

                //获取批量ID

                long batchId = message.getId();

                //获取批量的数量

                int size = message.getEntries().size();

                //如果没有数据

                if (batchId == -1 || size == 0) {

                    try {

                        //线程休眠2秒

                        Thread.sleep(2000);

                    } catch (InterruptedException e) {

                        e.printStackTrace();

                    }

                } else {

                    //如果有数据,处理数据

                    printEntry(message.getEntries());

                }

                //进行 batch id 的确认。确认之后，小于等于此 batchId 的 Message 都会被确认。

                connector.ack(batchId);

            }

        } catch (Exception e) {

            e.printStackTrace();

        } finally {

            connector.disconnect();

        }

    }

    /**

     * 打印canal server解析binlog获得的实体类信息

     */

    private static void printEntry(List<CanalEntry.Entry> entrys) {

        for (CanalEntry.Entry entry : entrys) {

            if (entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONBEGIN || entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONEND) {

                //开启/关闭事务的实体类型，跳过

                continue;

            }

            //RowChange对象，包含了一行数据变化的所有特征

            //比如isDdl 是否是ddl变更操作 sql 具体的ddl sql beforeColumns afterColumns 变更前后的数据字段等等

            CanalEntry.RowChange rowChage;

            try {

                rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());

            } catch (Exception e) {

                throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(), e);

            }

            //获取操作类型：insert/update/delete类型

            CanalEntry.EventType eventType = rowChage.getEventType();

            //打印Header信息

            System.out.println(String.format("================》; binlog[%s:%s] , name[%s,%s] , eventType : %s",

                    entry.getHeader().getLogfileName(), entry.getHeader().getLogfileOffset(),

                    entry.getHeader().getSchemaName(), entry.getHeader().getTableName(),

                    eventType));

            //判断是否是DDL语句

            if (rowChage.getIsDdl()) {

                System.out.println("================》;isDdl: true,sql:" + rowChage.getSql());

            }

            //获取RowChange对象里的每一行数据，打印出来

            for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {

                //如果是删除语句

                if (eventType == CanalEntry.EventType.DELETE) {

                    printColumn(rowData.getBeforeColumnsList());

                    //如果是新增语句

                } else if (eventType == CanalEntry.EventType.INSERT) {

                    printColumn(rowData.getAfterColumnsList());

                    //如果是更新的语句

                } else {

                    //变更前的数据

                    System.out.println("------->; before");

                    printColumn(rowData.getBeforeColumnsList());

                    //变更后的数据

                    System.out.println("------->; after");

                    printColumn(rowData.getAfterColumnsList());

                }

            }

        }

    }

    private static void printColumn(List<CanalEntry.Column> columns) {

        for (CanalEntry.Column column : columns) {

            System.out.println(column.getName() + " : " + column.getValue() + "    update=" + column.getUpdated());

        }

    }

}

执行后，我们操作数据库表，比如删除数据。

这样我们就可以通过java程序读取canal读取的数据。当然我们可以通过代码将数据插入到其他的数据库中。

使用CANAL同步数据的更多相关文章

用canal监控binlog并实现mysql定制同步数据的功能
业务背景写任何工具都不能脱离实际业务的背景.开始这个项目的时候是因为现有的项目中数据分布太零碎,零零散散的分布在好几个数据库中,没有统一的数据库来收集这些数据.这种情况下想做一个大而全的会员中心系统 ...
canal同步MySQL数据到ES6.X
背景: 最近一段时间公司做一个技术架构的更改,由于之前使用的solr和目前的业务不太匹配,具体原因不多说啦.所以要把数据放到Elasticsearch中进行快速的搜索,这是便产生了一个数据迁移的需求, ...
【Canal】数据同步的终极解决方案，阿里巴巴开源的Canal框架当之无愧！！
写在前面在当今互联网行业,尤其是现在分布式.微服务开发环境下,为了提高搜索效率,以及搜索的精准度,会大量使用Redis.Memcached等NoSQL数据库,也会使用大量的Solr.Elastics ...
实战！Spring Boot 整合阿里开源中间件 Canal 实现数据增量同步！
大家好,我是不才陈某~ 数据同步一直是一个令人头疼的问题.在业务量小,场景不多,数据量不大的情况下我们可能会选择在项目中直接写一些定时任务手动处理数据,例如从多个表将数据查出来,再汇总处理,再插入到相 ...
Canal 同步异常分析：Could not find first log file name in binary log index file
文章首发于[博客园-陈树义],点击跳转到原文Canal同步异常分析:Could not find first log file name in binary log index file. 公司搜索相 ...
mysql 同步数据到 ElasticSearch 的方案
MySQL Binlog 要通过 MySQL binlog 将 MySQL 的数据同步给 ES, 我们只能使用 row 模式的 binlog.如果使用 statement 或者 mixed forma ...
Mysql通过Canal同步Elasticsearch
目录版本管理 Mysql 设置在MySQL配置文件my.cnf设置: 检查是否开启增加新用户: 安装 Elasticsearch es 跨域问题目录挂载安装 Elasticsearch-He ...
实现从Oracle增量同步数据到GreenPlum
简介: GreenPlum是一个基于PostgreSQL数据库开发的MPP架构的数据库仓库,适用于OLAP系统,支持50PB(1PB=1000TB)级海量数据的存储和处理. 背景: 目前有一个业务是需 ...
sql笨办法同步数据
Helpers.SqlHelper sqlHelper = new Helpers.SqlHelper("server=***;database=Cms;user id=sa;passwor ...
对Big Table进行全表更新，导致 Replication 同步数据的过程十分缓慢
在Publisher database中更新一个big table,数据行数是3.4亿多.由于没有更新 clustered Index key,因此,只产生了3.4亿多个Update Commands ...

随机推荐

CIIS 2023 丨聚焦文档图像处理前沿领域，合合信息 AI 助力图像处理与内容安全保障
近日,2023第十二届中国智能产业高峰论坛(CIIS 2023)在江西南昌顺利举行.大会由中国人工智能学会.江西省科学技术厅.南昌市人民政府主办,南昌市科学技术局.中国工程科技发展战略江西研究院承办. ...
Angular 16+ 高级教程 – 谈谈 ASP.NET Core & Angular & React 在业务开发上各自的优势和体验
前言日常, 我的开发都围绕着 ASP.NET Core 和 Angular. 这篇想聊聊它们各自的特点和解决问题的方式. 以及最重要的, 我们该在什么时候采用何种方案更为妥当. 浅谈项目分类我一般 ...
TypeScript 高级教程 – 把 TypeScript 当强类型语言使用 (第一篇)
前言原本是想照着 TypeScript 官网 handbook 写个教程的. 但提不起那个劲... 所以呢, 还是用我自己的方式写个复习和进阶笔记就好了呗. 以前写过的 TypeScript 笔记: ...
httpclient调用接口
有时候会将参数(返回结果)压缩(解压),加密(解密) 将json参数通过GZip压缩 Base64加密 1 public static String gzipAndEncryption(String ...
贝壳找房携手 Flutter，为三亿家庭提供更好的居住服务 | Flutter 开发者故事
贝壳找房是科技驱动的新居住服务平台,致力于在二手房.新房.租房以及装修等居住领域为三亿家庭提供全方位的品质居住服务.如此庞大的用户群体,自然也有着十分多样和复杂的使用场景和需求.以往使用原生开发模式时 ...
Java Web 拾遗
许是年纪大了,老是回忆起以前的点点滴滴.翻看当初的代码,如同偶遇多年未见的前女友,曾经一起深入交流的情谊在颔首之间消散,令人烦躁. 今天就来聊聊老生常谈的 Java Web 开发.缘于一个简单的Spr ...
三维医学图像数据扩充：flip and rotate
对于小数据量医学图像进行深度学习使,会由于数据量过小而过拟合.因此我们需要采用数据扩充方法,而flip和rotate又是经常用到的,这里做一个简单的实现. 输入为[batchsize,height, ...
Kulla-Conty BRDF补充_重要性采样GGX
重要性采样的方法有多种,这里我们介绍其中一种,你的实现也可以使用其他方法.我们将通过 GGX 采样来完成 E(µ)的预计算工作.先从理论上讨论 GGX 采样算法,对于给定出射方向 o 的 GGX采样, ...
C#/.NET/.NET Core优秀项目和框架2024年9月简报
前言公众号每月定期推广和分享的C#/.NET/.NET Core优秀项目和框架(每周至少会推荐两个优秀的项目和框架当然节假日除外),公众号推文中有项目和框架的介绍.功能特点.使用方式以及部分功能截图 ...
C++第七节课 new开辟空间 delete释放空间
#include <iostream> using namespace std; // C中开辟空间的方式所有的返回值都是 void * /// int * p = (int*)mal ...

使用CANAL同步数据