【Canal】01 入门 & Kafka模式

什么是Canal (卡耐尔) ？

Canal 是用 Java 开发的基于数据库增量日志解析，提供增量数据订阅&消费的中间件

原理基于MySQL的binlog从库监听

一、MySQL环境配置

1、更改MySQL配置（my.ini / my.cnf）：

[mysqld]

# 主库id标识

server-id=1

# 开启binlog日志

log-bin=mysql-bin

# 日志格式类型

binlog_format=row

# （可选）声明只对哪个库进行日志输出

binlog-do-db=gmall-2021

2、测试用例

没有表就创建一个测试用的表：

CREATE TABLE user_info(

　　`id` VARCHAR(255),

　　`name` VARCHAR(255),

　　`sex` VARCHAR(255)

);

3、监听的账号

和主从复制一样，需要提供一个从库监听的账号：

CREATE USER 'canal'@'%' IDENTIFIED BY '123456';

GRANT ALL ON *.* TO 'canal'@'%' WITH GRANT OPTION;

FLUSH PRIVILEGES;

-- GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';

二、安装Canal

Linux平台：

# 解压方式一

tar -zxvf canal.deployer-1.1.2.tar.gz

mkdir canal.deployer-1.1.2

mv bin canal.deployer-1.1.2/

mv logs canal.deployer-1.1.2/

mv lib canal.deployer-1.1.2/

mv conf canal.deployer-1.1.2/

# 解压方式二

mkdir ~/canal-1.1.2

tar -zxvf canal.deployer-1.1.2.tar.gz -C ~/canal-1.1.2/

Windows平台：

新建一个canal的目录，然后打开目录

把压缩包内容解压到目录中即可

通用配置操作：

案例只是为了演示，单机运行的方式进行配置

# 备份 instance.properties文件

cd ~/canal-1.1.2/example

cp instance.properties instance.properties.bak

编辑example下的实例文件

vim ~/canal-1.1.2/conf/example/instance.properties

关键参数项：

# 伪装从库的id，不要和主库id一致即可

canal.instance.mysql.slaveId=20

# 主库IP地址和端口号

canal.instance.master.address=192.168.2.225:3308

# 主库开设的监听账号

canal.instance.dbUsername=canal

canal.instance.dbPassword=123456

# 字符集

canal.instance.connectionCharset=UTF-8

# 默认监听的db?

canal.instance.defaultDatabaseName=canal

三、启动，关闭Canal

restart.sh

startup.bat

startup.sh

stop.sh

# windows 平台直接运行 startup.bat

# 关闭就是直接关闭终端窗口即可

startup.bat 

# linux 平台

startup.sh  # 启动

restart.sh # 重启

stop.sh # 停止

四、创建Canal监听客户端：

canal没有提供默认的终端输出，强制要求客户端监听日志消息：

这里使用Java做一个客户端来查看消息

创建普通Maven项目，引入两个依赖

<dependencies>

     <dependency>

         <groupId>com.alibaba.otter</groupId>

         <artifactId>canal.client</artifactId>

         <version>1.1.2</version>

    </dependency>

    <dependency>

        <groupId>org.apache.kafka</groupId>

        <artifactId>kafka-clients</artifactId>

        <version>2.4.1</version>

    </dependency>

</dependencies>

客户端类：

import com.alibaba.fastjson.JSONObject;

import com.alibaba.otter.canal.client.CanalConnector;

import com.alibaba.otter.canal.client.CanalConnectors;

import com.alibaba.otter.canal.protocol.CanalEntry;

import com.alibaba.otter.canal.protocol.Message;

import com.google.protobuf.ByteString;

import com.google.protobuf.InvalidProtocolBufferException;

import java.net.InetSocketAddress;

import java.util.List;

public class CanalClient {

    public static void main(String[] args) throws InterruptedException, InvalidProtocolBufferException {

        //TODO 获取连接

        CanalConnector canalConnector = CanalConnectors.newSingleConnector(new InetSocketAddress("127.0.0.1", 11111), "example", "", "");

        while (true) {

            //TODO 连接

            canalConnector.connect();

            //TODO 订阅数据库

            canalConnector.subscribe("canal.*");

            //TODO 获取数据

            Message message = canalConnector.get(100);

            //TODO 获取Entry集合

            List<CanalEntry.Entry> entries = message.getEntries();

            //TODO 判断集合是否为空,如果为空,则等待一会继续拉取数据

            if (entries.size() <= 0) {

                System.out.println("当次抓取没有数据，休息一会。。。。。。");

                Thread.sleep(1000);

            } else {

                //TODO 遍历entries，单条解析

                for (CanalEntry.Entry entry : entries) {

                    //1.获取表名

                    String tableName = entry.getHeader().getTableName();

                    //2.获取类型

                    CanalEntry.EntryType entryType = entry.getEntryType();

                    //3.获取序列化后的数据

                    ByteString storeValue = entry.getStoreValue();

                    //4.判断当前entryType类型是否为ROWDATA

                    if (CanalEntry.EntryType.ROWDATA.equals(entryType)) {

                        //5.反序列化数据

                        CanalEntry.RowChange rowChange = CanalEntry.RowChange.parseFrom(storeValue);

                        //6.获取当前事件的操作类型

                        CanalEntry.EventType eventType = rowChange.getEventType();

                        //7.获取数据集

                        List<CanalEntry.RowData> rowDataList = rowChange.getRowDatasList();

                        //8.遍历rowDataList，并打印数据集

                        for (CanalEntry.RowData rowData : rowDataList) {

                            JSONObject beforeData = new JSONObject();

                            List<CanalEntry.Column> beforeColumnsList = rowData.getBeforeColumnsList();

                            for (CanalEntry.Column column : beforeColumnsList) {

                                beforeData.put(column.getName(), column.getValue());

                            }

                            JSONObject afterData = new JSONObject();

                            List<CanalEntry.Column> afterColumnsList = rowData.getAfterColumnsList();

                            for (CanalEntry.Column column : afterColumnsList) {

                                afterData.put(column.getName(), column.getValue());

                            }

                            //数据打印

                            System.out.println("Table:" + tableName +

                                    ",EventType:" + eventType +

                                    ",Before:" + beforeData +

                                    ",After:" + afterData);

                        }

                    } else {

                        System.out.println("当前操作类型为：" + entryType);

                    }

                }

            }

        }

    }

}

开启后，想指定的表中写入数据：

客户端输出消息：

当次抓取没有数据，休息一会。。。。。。

当次抓取没有数据，休息一会。。。。。。

当次抓取没有数据，休息一会。。。。。。

当次抓取没有数据，休息一会。。。。。。

当前操作类型为：TRANSACTIONBEGIN

Table:user_info,EventType:INSERT,Before:{},After:{"sex":"男","name":"张三","id":"1"}

当前操作类型为：TRANSACTIONEND

当前操作类型为：TRANSACTIONBEGIN

Table:user_info,EventType:INSERT,Before:{},After:{"sex":"男","name":"张三","id":"2"}

当前操作类型为：TRANSACTIONEND

当次抓取没有数据，休息一会。。。。。。

五、Kafka模式

修改 canal.properties

# 指定输出模式为kafka

canal.serverMode = kafka

# kafka集群地址，如单机，则写一个即可

canal.mq.servers = hadoop102:9092,hadoop103:9092,hadoop104:9092

修改 example/instance.properties

# mq config

# 指定Topic名称 和 分区数量

canal.mq.topic=canal_test

canal.mq.partitionsNum=1

重启canal以加载配置信息

启动Kafka消费者来查看是否运行:

bin/kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --topic canal_test

执行插入SQL：

INSERT INTO user_info VALUES('1001','zhangsan','male'),('1002','lisi','female');

Kafka控制台：

{

  "data": [

    {

      "id": "1001",

      "name": "zhangsan",

      "sex": "male"

    },

    {

      "id": "1002",

      "name": "lisi",

      "sex": "female"

    }

  ],

  "database": "gmall-2021",

  "es": 1639360729000,

  "id": 1,

  "isDdl": false,

  "mysqlType": {

    "id": "varchar(255)",

    "name": "varchar(255)",

    "sex": "varchar(255)"

  },

  "old": "null",

  "sql": "",

  "sqlType": {

    "id": 12,

    "name": 12,

    "sex": 12

  },

  "table": "user_info",

  "ts": 1639361038454,

  "type": "INSERT"

}

【Canal】01 入门 & Kafka模式的更多相关文章

Python学习--01入门
Python学习--01入门 Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.和PHP一样,它是后端开发语言. 如果有C语言.PHP语言.JAVA语言等其中一种语言的基础,学习Py ...
设计模式入门,策略模式,c++代码实现
// test01.cpp : Defines the entry point for the console application.////第一章,设计模式入门,策略模式#include &quo ...
[译]Vulkan教程(01)入门
[译]Vulkan教程(01)入门接下来我将翻译(https://vulkan-tutorial.com)上的Vulkan教程.这可能是我学习Vulkan的最好方式,但不是最理想的方式. 我会用“d ...
「从零单排canal 01」 canal 10分钟入门（基于1.1.4版本）
1.简介 canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费.应该是阿里云DTS(Data Transfer Servi ...
Canal详细入门实战(使用总结)
Canal介绍 Canal简介 canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费早期阿里巴巴因为杭州和美国双机房部署,存在 ...
RabbitMQ入门-Topic模式
上篇<RabbitMQ入门-Routing直连模式>我们介绍了可以定向发送消息,并可以根据自定义规则派发消息.看起来,这个Routing模式已经算灵活的了,但是,这还不够,我们还有更加多样 ...
elasticsearch6.7 01.入门指南（2）
2.安装(略) 默认情况下,elasticsearch 使用端口 9200 来访问它的 REST API.如果有必要,该端口也可以配置 3.探索集群 3.1 The REST API 既然我们已经启动 ...
带你入门代理模式/SpringAop的运行机制
SpringAop 是spring框架中最重要的一项功能之一,同时也是企业级开发记录事物日志等不可或缺的一部分,如果说你的系统需要记录用户访问接口的操作,那SpringAop是很完美的了,当然,拦截器 ...
canal 环境搭建 kafka Zookeeper安装（二）
第一步创建Zookeeper 下载完成后修改 Zookeeper中的 zoo.cfg 修改 dataDir .dataLogDir 集群模式 server.1=ServerIP:2888:3888 ...
Spring Cloud - Nacos注册中心入门单机模式及集群模式
近几年微服务很火,Spring Cloud提供了为服务领域的一整套解决方案.其中Spring Cloud Alibaba是我们SpringCloud的一个子项目,是提供微服务开发的一站式解决方案. 包 ...

随机推荐

GNU GDB
1 说明本文主要介绍一些简单的.常用的gdb调试技巧. 环境:GNU gdb (GDB) Red Hat Enterprise Linux (7.2-60.el6_4.1) 参考文档:<gdb ...
UML建模工具Astah Pro 8破解教程2022最新最详细版
(2022最新最详细版)UML建模工具Astah Pro 8破解教程本文作者严正声明:拒绝盗版行为,打击盗版,痛恨吃白食的家伙,我一直都是坚定思想,有钱了一定要支持正版,所以此文档贡献,只为学习交流 ...
php基本语法与安装
// 什么是PHP // PHP 是后端语言的一种 // 主要作用就是实现数据交互 // ...
Easysearch 跨集群复制实战
在之前的文章中,有通过网关实现容灾的案例.今天给大家介绍 Easysearch 的跨集群复制功能.该功能可在集群之间复制数据,应用场景包括但不限于以下举例: 灾备同步:将数据同步到灾备中心,灾备中心可 ...
大一统的监控探针采集器 cprobe
需求背景监控数据采集领域,比如 Prometheus 生态有非常多的 Exporter,虽然生态繁荣,但是无法达到开箱即用的大一统体验,Exporter 体系的核心问题有: 良莠不齐:有的 Expo ...
Java JSON组成和解析
本框架JSON元素组成和分析,JsonElement分三大类型JsonArray,JsonObject,JsonString. JsonArray:数组和Collection子类,指定数组的话,使用A ...
HDU2062题解 01背包而已
RT,我就不解释了,题目连接http://acm.hdu.edu.cn/showproblem.php?pid=2602. 初学01背包的人可以做做 #include<iostream> ...
Linux特殊权限之SBIT
简单点,说话的方式简单点: 用于修饰目录其他用户x位替换成t 作用:目录属主在该目录下创建的文件只有该属主能删除
深度对比！瑞芯微RK3562J比RK3568J好在哪里？
作为瑞芯微的明星产品--RK3568J,凭借其出色的性能及丰富的外设接口成为国内众多工业客户的最佳选择. 随着RK3568J的大规模应用,很多客户开始针对RK3568J的价格偏高.功耗偏高等问题提出了 ...
NXP i.MX 8M Plus工业核心板规格书(四核ARM Cortex-A53 + 单核ARM Cortex-M7，主频1.6GHz)
1 核心板简介创龙科技SOM-TLIMX8MP是一款基于NXP i.MX 8M Plus的四核ARM Cortex-A53 + 单核ARM Cortex-M7异构多核处理器设计的高端工业核心板, ...