debezium 数据变更工具使用

1. 作用

简单概述就是CDC(change data capture),实时数据分析领域用的比较多

2. 简单使用（基于官网的docker 说明）

备注：测试没有使用守护进程模式为了方便测试

a. zookeeper

docker run -it --rm --name zookeeper -p 2181:2181 -p 2888:2888 -p 3888:3888 debezium/zookeeper:0.6

b. kafka

docker run -it --rm --name kafka -p 9092:9092 --link zookeeper:zookeeper debezium/kafka:0.6

c. mysql

docker run -it --rm --name mysql -p 3306:3306 -e MYSQL_ROOT_PASSWORD=debezium -e MYSQL_USER=mysqluser -e MYSQL_PASSWORD=mysqlpw debezium/example-mysql:0.6

d. mysql-client

docker run -it --rm --name mysqlterm --link mysql --rm mysql:5.7 sh -c 'exec mysql -h"$MYSQL_PORT_3306_TCP_ADDR" -P"$MYSQL_PORT_3306_TCP_PORT" -uroot -p"$MYSQL_ENV_MYSQL_ROOT_PASSWORD"'

查看表信息

use inventory;

show tables;

SELECT * FROM customers;

e. kafka connect

docker run -it --rm --name connect -p 8083:8083 -e GROUP_ID=1 -e CONFIG_STORAGE_TOPIC=my_connect_configs -e OFFSET_STORAGE_TOPIC=my_connect_offsets --link zookeeper:zookeeper --link kafka:kafka --link mysql:mysql debezium/connect:0.6

进行connect 信息查看

curl -H "Accept:application/json" localhost:8083/

curl -H "Accept:application/json" localhost:8083/connectors/

f. 监控MySQL 数据库变更

curl -i -X POST -H "Accept:application/json" -H "Content-Type:application/json" localhost:8083/connectors/ -d '{ "name": "inventory-connector", "config": { "connector.class": "io.debezium.connector.mysql.MySqlConnector", "tasks.max": "1", "database.hostname": "mysql", "database.port": "3306", "database.user": "debezium", "database.password": "dbz", "database.server.id": "184054", "database.server.name": "dbserver1", "database.whitelist": "inventory", "database.history.kafka.bootstrap.servers": "kafka:9092", "database.history.kafka.topic": "dbhistory.inventory" } }'

返回信息如下：

{

  "name": "inventory-connector",

  "config": {

    "connector.class": "io.debezium.connector.mysql.MySqlConnector",

    "tasks.max": "1",

    "database.hostname": "mysql",

    "database.port": "3306",

    "database.user": "debezium",

    "database.password": "dbz",

    "database.server.id": "184054",

    "database.server.name": "dbserver1",

    "database.whitelist": "inventory",

    "database.history.kafka.bootstrap.servers": "kafka:9092",

    "database.history.kafka.topic": "schema-changes.inventory"

  }

}

查看注册的connect

 curl -H "Accept:application/json" localhost:8083/connectors/

 ["inventory-connector"]

g. 查看数据变更

docker run -it --name watcher --rm --link zookeeper:zookeeper debezium/kafka:0.6 watch-topic -a -k dbserver1.inventory.customers

应该会看到包含下面的信息：

{

  "schema": {

    "type": "struct",

    "name": "dbserver1.inventory.customers.Key"

    "optional": false,

    "fields": [

      {

        "field": "id",

        "type": "int32",

        "optional": false

      }

    ]

  },

  "payload": {

    "id": 1004

  }

}

进行数据变更

UPDATE customers SET first_name='Anne Marie' WHERE id=1004;

应该会看到下面的信息

{

  "schema": {

    "type": "struct",

    "name": "dbserver1.inventory.customers.Key"

    "optional": false,

    "fields": [

      {

        "field": "id",

        "type": "int32",

        "optional": false

      }

    ]

  },

  "payload": {

    "id": 1004

  }

}

删除、添加的信息类似，同时对于监控数据变更的服务，在停止之后，重新启动数据还是可以同步过来的

3. 说明

大数据，微服务应用开发、单体应用向微服务迁移的时候使用起来可以减少好多开发的工作量

4. 参考资料

http://debezium.io/docs/tutorial/

遗留系统重建实践

Migrating_to_Microservices_Databases_Red_Hat.pdf （https://developers.redhat.com/promotions/migrating-to-microservice-databases/）

debezium 数据变更工具使用的更多相关文章

数据同步工具Sqoop和DataX
在日常大数据生产环境中,经常会有集群数据集和关系型数据库互相转换的需求,在需求选择的初期解决问题的方法----数据同步工具就应运而生了.此次我们选择两款生产环境常用的数据同步工具进行讨论 Sqoop ...
一篇文章看懂TPCx-BB（大数据基准测试工具）源码
TPCx-BB是大数据基准测试工具,它通过模拟零售商的30个应用场景,执行30个查询来衡量基于Hadoop的大数据系统的包括硬件和软件的性能.其中一些场景还用到了机器学习算法(聚类.线性回归等).为了 ...
SQL Server 数据变更时间戳（timestamp）在复制中的运用
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 方案(Solution) 方案一(Solution One) 方案二(Solution Two ...
Charted – 自动化的可视化数据生成工具
Charted 是一个让数据自动生成可视化图表的工具.只需要提供一个数据文件的链接,它就能返回一个美丽的,可共享的图表.Charted 不会存储任何数据.它只是获取和让链接提供的数据可视化. 在线演示 ...
oracle数据导出工具sqluldr2
oracle数据导出工具sqluldr2可以将数据以csv.txt等格式导出,适用于大批量数据的导出,导出速度非常快.导出后可以使用oracle loader工具将数据导入.下载完sqluldr2,工 ...
Web 开发人员必备的随机 JSON 数据生成工具
在 Web 开发中,经常会需要一些测试数据来测试接口或者功能时候正确.JSON Generator 就是这样一款生成随机 JSON 数据的在线工具,Web 开发人员必备,记得收藏和分享啊. 您可能感兴 ...
Redis数据导入工具优化过程总结
Redis数据导入工具优化过程总结背景使用C++开发了一个Redis数据导入工具从oracle中将所有表数据导入到redis中: 不是单纯的数据导入,每条oracle中的原有记录,需要经过业务逻 ...
[Hadoop 周边] Hadoop和大数据：60款顶级大数据开源工具（2015-10-27）【转】
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

随机推荐

《Python学习手册》（四）
List and Dictionary 列表: 任意对象的有序集合通过偏移读取可变.异构.任意嵌套常用方法: L.append(object) L.extend(iterable) L.inse ...
高亮显示UILabel中的子串
I. 用户在搜索框中,输入关键字进行检索时,APP对搜索结果进行显示,有以下两种情况: 1. 匹配一次,如检索关键字为人名这种情况,实现比较容易.写一个UILabel的category, 用rang ...
NumPy矩阵库
NumPy - 矩阵库 NumPy 包包含一个 Matrix库numpy.matlib.此模块的函数返回矩阵而不是返回ndarray对象. matlib.empty() matlib.empty()函 ...
一块网卡多个IP实现
////////////////////////////写在前面//////////////////////////////////////////// 需要注意,这里我们是一块网卡多个IP,而并非是 ...
JQuery小知识点代码
1.链式操作 $(function(){ /*var oDiv = $('#div1'); oDiv.html('hello'); oDiv.css('background','red'); oDiv ...
js 小秘密
1.RegExp 对象方法 test检索字符串中指定的值.返回 true 或 false. 支持正则表达式的 String 对象的方法
ActiveMQ 的管理和监控
本章重点理解 JMX 和 ActiveMQ 使用告警消息来监控 ActiveMQ 管理 ActiveMQ ActiveMQ 的日志配置额,这本书终于读完了,虽然看到后面都是云里雾里的,但是总算是对 ...
RabbitMQ C# driver stops receiving messages
http://stackoverflow.com/questions/12499174/rabbitmq-c-sharp-driver-stops-receiving-messages
【Python】内置函数清单
Python内置(built-in)函数随着python解释器的运行而创建.在Python的程序中,你可以随时调用这些函数,不需要定义.最常见的内置函数是: print("Hello Wor ...
android手机尺寸相关p107-p110
1.ldpi-----240x320-----密度120 mdpi-----320x480-----密度160 hdpi-----480x800-----密度240 xhdpi-----720x128 ...

debezium 数据变更工具使用

debezium 数据变更工具使用的更多相关文章

随机推荐

热门专题