【大数据】kafka-02:Kafka Connect内容、原理及使用
〇、概述
1、常见资料
(1)confluent
https://docs.confluent.io/5.4.0/connect/kafka-connect-jdbc/sink-connector/sink_config_options.html
一、可用的sink/source配置
(一)source connector
1、根据自增id的source
(1)订单表
{
"name": "source_connect_Oracle_Test_T_Order_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "AUUID_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_0905",
"topic": "connect_topic_Test_T_Order_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_0905",
"task": 0
}
],
"type": "source"
}
(2)用户表
1、Oracle的source
{
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"incrementing.column.name": "ID",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_USER",
"mode": "incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "ORACLE_TEST_ID_TIMESTAMP_INC",
"topic": "ORACLE_TEST_TOPIC",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "ORACLE_TEST_ID_TIMESTAMP_INC",
"task": 0
}
],
"type": "source"
}
2、根据time自增的source
{
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"config": {
"connector.class": "com.ecer.kafka.connect.oracle.OracleSourceConnector",
"reset.offset": "true",
"timestamp.column.name": "UPDDATTIM_0",
"db.hostname": "192.168.0.100",
"tasks.max": "1",
"db.user.password": "system",
"table.blacklist": "",
"table.whitelist": "TEST.T_Order",
"mode": "timestamp incrementing",
"db.user": "system",
"db.port": "1521",
"db.fetch.size": "1",
"multitenant": "false",
"name": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"topic": "topic_Test_T_Order_timestamp_0905",
"parse.dml.data": "true",
"db.name": "helowin",
"db.name.alias": "helowin"
},
"tasks": [
{
"connector": "source_connect_Oracle_Test_T_Order_timestamp_0905",
"task": 0
}
],
"type": "source"
}
3、基于confluent的JDBC source
【大数据】kafka-02:Kafka Connect内容、原理及使用的更多相关文章
- 大数据技术之Kafka
Kafka概述 1.1 消息队列 (1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除) 点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息 ...
- 大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
- 入门大数据---Flume整合Kafka
一.背景 先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合 ...
- 【原创】大数据基础之Kafka(1)简介、安装及使用
kafka2.0 http://kafka.apache.org 一 简介 Kafka® is used for building real-time data pipelines and strea ...
- 大数据基础之Kafka(1)简介、安装及使用
kafka2.0 http://kafka.apache.org 一 简介 Kafka® is used for building real-time data pipelines and strea ...
- 大数据 --> 分布式文件系统HDFS的工作原理
分布式文件系统HDFS的工作原理 Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.它能提供高吞吐量的数 ...
- 大数据开发实战:MapReduce内部原理实践
下面结合具体的例子详述MapReduce的工作原理和过程. 以统计一个大文件中各个单词的出现次数为例来讲述,假设本文用到输入文件有以下两个: 文件1: big data offline data on ...
- 大数据 -- zookeeper和kafka集群环境搭建
一 运行环境 从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
- 《OD大数据实战》Kafka入门实例
官网: 参考文档: Kafka入门经典教程 Kafka工作原理详解 一.安装zookeeper 1. 下载zookeeper-3.4.5-cdh5.3.6.tar.gz 下载地址为: http://a ...
- 大数据安装之Kafka(用于实时处理的消息队列)
一.安装部署kafka 1.集群规划 hadoop102 hadoop103 hado ...
随机推荐
- JAVA SE 基础总结
§ 基础知识 一.程序组织与运行原理 1.1 程序组织 一个 JAVA 程序文件中主要由如下几部分构成: package 声明 public 类:public 类与类文件名相同,因为其是作为该类文件唯 ...
- Shell分析日志文件
文章转载自:https://mp.weixin.qq.com/s/o63aIM2p9rc2OjhxiC6wgA 1.查看有多少个IP访问: awk '{print $1}' log_file|sort ...
- 关于使用kuboard安装其自带的监控应用授权普通用户使用
官方文档地址:https://www.kuboard.cn/guide/example/monitor-v2.html#授权用户访问套件
- kube-scheduler 调度调优
文章转载自:https://www.kuboard.cn/learning/k8s-advanced/schedule/tuning.html kube-scheduler 是 Kubernetes ...
- 阿里云SLB的健康检查配置
若阿里云SLB健康检查异常,则默认SLB无法访问到后端ECS,也就意味着通过SLB访问后端ECS上部署的服务会报502 gateway. 另一种办法是关闭健康检查(不推荐) 简要说明: SLB通过配置 ...
- 编码中的Adapter,不仅是一种设计模式,更是一种架构理念与解决方案
大家好,又见面了. 不知道下面这玩意大家有没有见过或者使用过?这是一个插座转换器.我们都知道日常使用的是220v的交流电,而国外不同国家使用的电流电压是不一样的(比如日本使用的是110v).且插座的接 ...
- Java后端开发——美团(牛客)
Java后端开发--美团(牛客) Java的基本数据类型,各自的字节数 老生常谈,不多说了. 类型 字节数 byte 1字节 short 2字节 int 4字节 long 8字节 float 4字 ...
- vue3中pinia的使用总结
pinia的简介和优势: Pinia是Vue生态里Vuex的代替者,一个全新Vue的状态管理库.在Vue3成为正式版以后,尤雨溪强势推荐的项目就是Pinia.那先来看看Pinia比Vuex好的地方,也 ...
- docker搭建yapi接口文档系统、Idea中上传接口、在线调用
一.前言 在我们后端开发中,必不可少的是接口的交接,有很多种方式,常见的就是swagger,不过这个侵入性太强了.还有就是接口文档的框架,比如今天小编带大家一起搭建的yapi,在公司还是挺常见的! 今 ...
- POJ2282 The Counting Problem(数位DP)
用dp[pos][val][cnt]表示状态,pos是数位,val是当前统计的数字,cnt是目前统计的目标数字的出现次数 注意状态的转移过程,统计数字0时前导0的影响. 1 #include<c ...