【大数据】kafka-02:Kafka Connect内容、原理及使用
〇、概述
1、常见资料
(1)confluent
https://docs.confluent.io/5.4.0/connect/kafka-connect-jdbc/sink-connector/sink_config_options.html
一、可用的sink/source配置
(一)source connector
1、根据自增id的source
(1)订单表
{
"name": "source_connect_Oracle_Test_T_Order_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "AUUID_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_0905",
"topic": "connect_topic_Test_T_Order_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_0905",
"task": 0
}
],
"type": "source"
}
(2)用户表
1、Oracle的source
{
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "ID",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_USER",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"topic": "ORACLE_TEST_TOPIC",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "ORACLE_TEST_ID_TIMESTAMP_INC",
"task": 0
}
],
"type": "source"
}
2、根据time自增的source
{
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"timestamp.column.name": "UPDDATTIM_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "timestamp incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"topic": "topic_Test_T_Order_timestamp_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"task": 0
}
],
"type": "source"
}
3、基于confluent的JDBC source
【大数据】kafka-02:Kafka Connect内容、原理及使用的更多相关文章
- 大数据技术之Kafka
Kafka概述 1.1 消息队列 (1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除) 点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息 ...
- 大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
- 入门大数据---Flume整合Kafka
一.背景 先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合 ...
- 【原创】大数据基础之Kafka(1)简介、安装及使用
kafka2.0 http://kafka.apache.org 一 简介 Kafka® is used for building real-time data pipelines and strea ...
- 大数据基础之Kafka(1)简介、安装及使用
kafka2.0 http://kafka.apache.org 一 简介 Kafka® is used for building real-time data pipelines and strea ...
- 大数据 --> 分布式文件系统HDFS的工作原理
分布式文件系统HDFS的工作原理 Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.它能提供高吞吐量的数 ...
- 大数据开发实战:MapReduce内部原理实践
下面结合具体的例子详述MapReduce的工作原理和过程. 以统计一个大文件中各个单词的出现次数为例来讲述,假设本文用到输入文件有以下两个: 文件1: big data offline data on ...
- 大数据 -- zookeeper和kafka集群环境搭建
一 运行环境 从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
- 《OD大数据实战》Kafka入门实例
官网: 参考文档: Kafka入门经典教程 Kafka工作原理详解 一.安装zookeeper 1. 下载zookeeper-3.4.5-cdh5.3.6.tar.gz 下载地址为: http://a ...
- 大数据安装之Kafka(用于实时处理的消息队列)
一.安装部署kafka 1.集群规划 hadoop102 hadoop103 hado ...
随机推荐
- C++ 左值引用与一级指针
将**左值引用**用于**一级指针**时,有以下几种用法: ```c++ //方式一:引用一级指针,常规用法 int a = 5; int * pa = &a; int * &rpa ...
- .NET 反向代理-YARP 根据域名转发
前段时间发布过一个关于 YARP 的简单介绍,感兴趣的小伙伴恭请移步看看 .NET 反向代理-YARP - 一事冇诚 - 博客园 (cnblogs.com) 作为反向代理,必不可少的当然是根据域名代理 ...
- Linux病毒扫描工具ClamAV(Clam AntiVirus)安装使用
在线检测木马病毒的网址:https://www.virustotal.com/gui/home/upload 一.简介 ClamAV(Clam AntiVirus)是Linux平台上的开源病毒扫描程序 ...
- 搞透 IOC,Spring IOC 看这篇就够了!
IOC与AOP属于Spring的核心内容,如果想掌握好Spring你肯定需要对IOC有足够的了解 @mikechen IOC的定义 IOC是Inversion of Control的缩写,多数书籍翻译 ...
- PAT (Basic Level) Practice 1032 挖掘机技术哪家强 分数 20
为了用事实说明挖掘机技术到底哪家强,PAT 组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第 1 行给出不超过 105 的正整数 N,即参赛人数.随后 N ...
- Git使用与心得体会
Git使用与心得体会 一.闲聊 闲暇时间学一下Git,也算是不用在网页端操作github了 二.Git相关 集中式与分布式 Git是一个分布式的版本控制系统,而传统的SVN则属于集中式 集中式与分布式 ...
- Linux安装中文字体(已验证)
1.安装字体命令 sudo apt install -y fontconfig 2.查看已安装的字体 (1)查看linux已安装字体 fc-list (2)查看linux已安装中文字体 fc-list ...
- 【软件学习】如何将Typora中的本地图片上传到博客
1. 配置方法 下载软件: 点击程序输入博客信息进行配置: 进行偏好设置: 2. 配置中出现的一些问题 解决方法:
- MYSQL-->函数与约束条件
函数 用法 函数最常用的地方就是查询语句处 select 函数(字段) from 表名; select 字段列表 from 表名 group by 分组字段 having 函数(字段); 字符串函数( ...
- IDEA对数据库、表、记录的(增删改查可视化操作)、数据库安全性问题的演示
对数据库的增删改查 新增数据库 修改数据库 删除数据库 对表的增删改查 新增表 修改表 删除表 对记录的增删改查 数据库安全性问题的演示 演示脏读 一个事物里面读到了另外一个事物没有提交的数据: ...