Flink同步kafka到iceberg(cos存储）

一、flink到logger

1、source

create table source_table (

 id                             bigint          comment '唯一编号'

,order_number                   bigint          comment '订单编号'

,update_timestamp               timestamp_ltz metadata from 'timestamp'

,primary key (id, order_number) not enforced

) with (

 'connector' = 'kafka'

,'topic' = 'topic'

,'properties.bootstrap.servers' = '127.0.0.1:9092'

,'scan.startup.mode' = 'latest-offset'

,'key.format' = 'json'

,'key.json.fail-on-missing-field' = 'false'

,'key.fields' = 'id;order_number'

,'key.json.ignore-parse-errors' = 'true'

,'value.format' = 'debezium-json'

,'value.debezium-json.ignore-parse-errors' = 'true'

,'value.debezium-json.encode.decimal-as-plain-number' = 'true'

);

2、sink logger

CREATE TABLE sink_test_wang2(

    id                             bigint          comment '唯一编号'

    ,order_number                   bigint          comment '订单编号'

    ,update_timestamp               timestamp_ltz   comment '更新时间戳'

    ,primary key (id, order_number) not enforced

) WITH (

 'connector' = 'logger',

  'all-changelog-mode' = 'true'

);

3、写入

insert into sink_test_wang2

select  id

       ,order_number

       ,update_timestamp

from source_table /*+ OPTIONS('properties.group.id'='testwang') */;

二、kafka到iceberg

1、目标源

create table sink_cos_table (

 id                             bigint          comment '唯一编号'

,order_number                   bigint          comment '订单编号'

,update_timestamp               timestamp_ltz   comment '更新时间戳'

,primary key (id, order_number) not enforced

)

with (

 'connector' = 'iceberg'

,'warehouse'='cosn://cos桶名称/test_wang'

,'catalog-type' = 'hadoop'

,'catalog-name'='hadoop'

,'catalog-database' = 'data_lake_ods_test'

,'catalog-table' = 'test_kafka_table'

,'format-version' = '2'

,'write.upsert.enabled' = 'true'

,'table.drop.base-path.enabled' = 'true'

,'engine.hive.enabled' = 'true'

);

2、写入

insert into sink_cos_table

select  id

       ,order_number

       ,pay_number

       ,update_timestamp

from source_table /*+ OPTIONS('properties.group.id'='read-oceanus-wangshida') */;

Flink同步kafka到iceberg(cos存储）的更多相关文章

Flink同步Kafka数据到ClickHouse分布式表
公众号文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问. 业务需要一种OLAP引擎,可以做到实时写入存储和查询计算功能,提供高效.稳健的实时数据服务,最终决定C ...
HBase2实战：HBase Flink和Kafka整合
1.概述 Apache官方发布HBase2已经有一段时间了,HBase2中包含了许多个Features,从官方JIRA来看,大约有4500+个ISSUES(查看地址),从版本上来看是一个非常大的版本了 ...
Flink-Kafka-Connector Flink结合Kafka实战
戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Fli ...
Flink消费Kafka数据并把实时计算的结果导入到Redis
1. 完成的场景在很多大数据场景下,要求数据形成数据流的形式进行计算和存储.上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis. ...
Flink读写Kafka
Flink 读写Kafka 在Flink中,我们分别用Source Connectors代表连接数据源的连接器,用Sink Connector代表连接数据输出的连接器.下面我们介绍一下Flink中用于 ...
Flink消费Kafka到HDFS实现及详解
1.概述最近有同学留言咨询,Flink消费Kafka的一些问题,今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据,通过Flink任务来消费并存储到HDFS上. 2.内容这里举个消费Kaf ...
Flink写入kafka时，只写入kafka的部分Partitioner，无法写所有的Partitioner问题
1. 写在前面在利用flink实时计算的时候,往往会从kafka读取数据写入数据到kafka,但会发现当kafka多个Partitioner时,特别在P量级数据为了kafka的性能kafka的节点有 ...
ELK同步kafka带有key的Message
需求 kafka中的message带有key,带有相同key值的message后入kafka的意味着更新message,message值为null则意味着删除message. 用logstash来同步 ...
Flink消费kafka
Flink消费Kafka https://blog.csdn.net/boling_cavalry/article/details/85549434 https://www.cnblogs.com/s ...
kafka在zookeeper中存储结构
1.topic注册信息 /brokers/topics/[topic] : 存储某个topic的partitions所有分配信息 Schema: { "version": ...

随机推荐

laravel之任务调度(定时任务)
crontab指令线性增长.毕竟crontab是一项系统级的配置,在业务中我们为了节约机器,往往对于量不大的多个项目会放在同一台服务器上,crontab指令多了就容易管理混乱,并且功能也不够灵活强大( ...
mysql之编译安装
在CentOS7中编译安装MySQL 5.7.29 一.依赖包安装 yum install gcc gcc-c++ ncurses ncurses-devel cmake bison -y 二.下载源 ...
💥TinyPro Vue v1.1.0 正式发布：增加细粒度权限管理、页签模式、多级菜单，支持 Webpack/Vite/Rspack/Farm 多种构建工具
你好,我是 Kagol,个人公众号:前端开源星球. 视频教程:https://www.bilibili.com/video/BV1SUBRYGECg/ 为了提升前端开发效率,OpenTiny 提供了一 ...
S2P销讯通-主数据对于客户关系管理系统的重要性
由于业务发展,各大企业的业务系统经历了从无到有,从简单到复杂,从而形成了一个又一个的业务系统,比如OA.HR.CRM.ERP等等. 主数据在客户关系管理系统(CRM)中扮演着至关重要的角色.主数据是指 ...
人工智能大语言模型起源篇，低秩微调（LoRA）
上一篇: <规模法则(Scaling Law)与参数效率的提高> 序言:您在找工作时会不会经常听到LoRA微调,这项技术的来源就是这里了. (12)Hu.Shen.Wallis.Allen ...
Flutter TickerProvider使用
Flutter TickerProvider使用当需要使用Animation controller时,需要在控制器初始化时传递一个vsync参数,此时需要用到TickerProvider,例如 cl ...
OpenTelemetry.NET API
OpenTelemetry.NET API Status and Releases Tracing Metrics Logging 1.0 Alpha Beta 安装 dotnet add packa ...
django推导流程
目录一.纯手撸web框架二.基于wsgiref模块三.代码封装优化四.动静态网页五.jinja2模块六.前端.后端.数据库三者联动一.纯手撸web框架 1.web框架的本质理解1:连接 ...
【MyBatis】学习笔记07：模糊查询
[Mybatis]学习笔记01:连接数据库,实现增删改 [Mybatis]学习笔记02:实现简单的查 [MyBatis]学习笔记03:配置文件进一步解读(非常重要) [MyBatis]学习笔记04:配 ...
Qt编写可视化大屏电子看板系统14-标准曲线图
一.前言近期将可视化大屏电子看板系统重新规划和调整项目结构代码,几个重大改变是新增启动窗体选择,可选大屏系统.控件演示.模块演示三种,其中控件演示是专门针对本系统中用到的各种自定义控件单独做的使用d ...

Flink同步kafka到iceberg(cos存储）

Flink同步kafka到iceberg(cos存储）的更多相关文章

随机推荐

热门专题