在自定义source&sink这一块官方给的说明并不是很多，需要去看源代码熟悉，自己实现一个redis sink主要需要实现StreamTableSinkFactory，RichSinkFunction和AppendStreamTableSink/RetractStreamTableSink/UpsertStreamTableSink，代码逻辑依赖主要如下

1.定义TableFactory

定义一个TableSinkFactory需要实现以下一个或者多个接口，在这里只实现StreamTableSinkFactory

BatchTableSourceFactory: Creates a batch table source.
BatchTableSinkFactory: Creates a batch table sink.
StreamTableSourceFactory: Creates a stream table source.
StreamTableSinkFactory: Creates a stream table sink.
DeserializationSchemaFactory: Creates a deserialization schema format.
SerializationSchemaFactory: Creates a serialization schema forma

createStreamTableSink()：在这里能够拿到ddl的with参数，我们通过getValidatedProperties进行合法性校验，再将参数构建为一个RedisOptions供后续方法使用，tableSchema主要包含ddl语句字段信息，最后返回实例化的RedisTableSink
requiredContext()：指定已为此工厂实现的上下文。该框架保证仅在满足指定的属性和值集的情况下才与此工厂匹配。典型的属性可能是connector.type，format.type或update-mode。为将来的向后兼容情况保留了诸如connect.property-version和format.property-version之类的属性键。
supportedProperties()：此工厂可以处理的属性键的列表。此方法将用于验证。如果传递了该工厂无法处理的属性，则将引发异常。该列表不得包含上下文指定的键。
getValidatedProperties()：构建DescriptorProperties并作合法性校验

2.定义TableSink

定义一个TableSink可以实现BatchTableSink、RetractStreamTableSink、UpsertStreamTableSink或者AppendStreamTableSink，redis的数据写入，我们按照来一条写一条的思路来实现，不涉及到数据的删除，所以只需要继承AppendStreamTableSink

consumeDataStream()：在这里能够拿到数据流，在addSink的时候将实例化的RedisSinkFunction写入方法传进去即可
emitDataStream()：已经废弃
configure()：拿到的是sql返回字段和类型，在这里我们和tableSchema做一致性校验，必须完全对应才能通过
getConsumedDataType()：返回Consumed数据类型
getTableSchema()：返回tableSchema信息

3.定义RedisSinkFunction

定义RedisSinkFunction需要继承RichSinkFunction，如果需要在Checkpoint时候做一些事情还可以实现CheckpointedFunction

open()：可以在这里构建jedis方法
close()：在这里执行销毁或者关闭方法
invoke()：数据写入的执行方法，我们这里根据ddl的connector.data.type类型来确定调用的方法，目前先实现了string,set,list,map,sortedset五种
snapshotState()：如果是mysql或者hbase那种定时/定量写入方式，可以在这里调用写入方法

4.创建java spi发现目录和文件

在resources目录下创建META-INF/services文件夹，创建一个名为org.apache.flink.table.factories.TableFactory的文件，将com.bigdata.connect.redis.RedisTableFactory写入，如果还有自定义的其他source/sink也一起写在这里

5.打包发布

注意打包的时候一定要确认把com.bigdata.connect.redis.RedisTableFactory打进去了，最好打包完反编译一下看时候被覆盖。我使用maven-assembly-plugin打包就会出现被覆盖的问题，后面改为maven-shade-plugin打包就没问题，所以一定要检查下。

6.遇到的问题

org.apache.flink.table.api.TableException: Table sink does not implement a table schema.

在RedisTableSink中忘记重写getTableSchema方法

org.apache.flink.table.api.TableException: Table sink does not implement a consumed data type.

在RedisTableSink中忘记重写getConsumedDataType方法

org.apache.flink.api.common.InvalidProgramException: root
|-- pay_hour: STRING
|-- item_id: STRING
is not serializable. The object probably contains or references non serializable fields.

在RedisTableSink的emitDataStream方法中将tableSchema传到RedisSinkFunction方法中去，而TableSchema未实现Serializable，出现序列化的问题

org.apache.flink.client.program.ProgramInvocationException: The main method caused an error: The StreamTableSink#consumeDataStream(DataStream) must be implemented and return the sink transformation DataStreamSink. However, com.bigdata.connect.redis.RedisTableSink doesn't implement this method.

使用了废弃的emitDataStream方法，而且没有重写consumeDataStream

7.使用方式

sink使用方法：

参考文档

https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/sourceSinks.html

Flink Table API & SQL 自定义Redis Sink 代码实现的更多相关文章

【翻译】Flink Table Api & SQL — 自定义 Source & Sink
本文翻译自官网: User-defined Sources & Sinks https://ci.apache.org/projects/flink/flink-docs-release-1 ...
Flink Table Api & SQL 翻译目录
Flink 官网 Table Api & SQL 相关文档的翻译终于完成,这里整理一个安装官网目录顺序一样的目录 [翻译]Flink Table Api & SQL —— Overv ...
【翻译】Flink Table Api & SQL — SQL客户端Beta 版
本文翻译自官网:SQL Client Beta https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/sqlCl ...
【翻译】Flink Table Api & SQL —— 概念与通用API
本文翻译自官网:https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/common.html Flink Tabl ...
【翻译】Flink Table Api & SQL —— 连接到外部系统
本文翻译自官网:Connect to External Systems https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev ...
【翻译】Flink Table Api & SQL — SQL
本文翻译自官网:SQL https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/sql.html Flink Tab ...
【翻译】Flink Table Api & SQL — Hive —— Hive 函数
本文翻译自官网:Hive Functions https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/hive/h ...
【翻译】Flink Table Api & SQL —— Overview
本文翻译自官网:https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/ Flink Table Api & ...
【翻译】Flink Table Api & SQL —— 数据类型
本文翻译自官网:https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/table/types.html Flink Table ...
【翻译】Flink Table Api & SQL —Streaming 概念 ——在持续查询中 Join
本文翻译自官网 : Joins in Continuous Queries https://ci.apache.org/projects/flink/flink-docs-release-1.9 ...

随机推荐

MyBatis-Plus修改数据，会不会把其他字段置为null
前两天在用MyBatis-Plus写了一张单表的增删改查,在写到修改的时候,就突然蹦出一个奇怪的想法. MyBatis-Plus的BaseMapper中有两个关于修改的方法.如下: int updat ...
HuggingNews #0210 这周模型有点多，快来看看吧
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...
rust 网上资料记录（自用）
最近要学嵌入式的rust,记录一些资料的url,方便自己查阅书籍常用的: rust圣经(不是权威指南那本)https://course.rs/ 中文 rust 参考手册 https://rustw ...
Linux基础之用户、组和权限管理
用户类别分为:普通用户.系统用户.登陆用户用户标识:UserID, UID 是16bits二进制数字: 0-65535管理员:0普通用户:0-65536系统用户:1-499(CentOS6)1-99 ...
【KAWAKO】iphone13pro开箱流程
目录全程录像检查包装盒检查包装盒内物品检查各种码拆封激活激活之后检查屏幕检查其它功能贴膜(选) References 全程录像如果你觉得你所购买的平台 (比如某ABB格式名字的平 ...
JZOJ 3213. 【SDOI2013】直径
题目思路树的直径很好求,两遍 \(dfs\),记下两个端点然后很显然所有直径经过的边必然在我们求出的这条直线上那么我们只要判断一下一条直径上的边是不是答案假设当前边为 \(i\) 那么把 \ ...
Prettier 在 Vite 项目下格式化报错
Prettier 配置文件有很多种格式,有.json..js..yml等.因为 Vite 默认项目用的模块机制是 ES6,我的配置文件又正好是.js,且用的模块机制是 CommonJS.所以就是如上图 ...
重磅！flink-table-store 将作为独立数据湖项目重新加入 Apache
数据湖是大数据近年来的网红项目,大家熟知的开源数据湖三剑客 Apache hudi.Apache iceberg .Databricks delta 近年来野蛮生长,目前各自背后也都有商业公司支持,投 ...
mysql转DM的日期函数转换
背景: 项目要从mysql转换为DM数据库,发现很多日期函数在DM是不能用的. 所以大概总结下有哪些,以及转换思路. 正文: INTERVAL 表示日期间隔. 看做拼接符. DATE_ADD 表示日期 ...
Dockerfile构建python项目
一.步骤 1.镜像基础 2.复制代码 3.设置工作目录 4.把需要执行的shell命令编写成脚本文件 5.配置容器启动自动执行脚本,CMD在docker run时运行脚本 DockerFile 脚本 ...

Flink Table API & SQL 自定义Redis Sink 代码实现