FLink迟到数据的处理之三

【FLink迟到数据的处理之三】的更多相关文章

FLink迟到数据的处理之三

Flink迟到的数据更新窗口计算结果,窗口销毁后的迟到数据输出到测输出流主程序: //TODO 使用迟到的数据更新窗口的计算结果 public static void main(String[] args) throws Exception { StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); env.setParallelism(1); Properties prope…

【源码解析】Flink 是如何处理迟到数据

相信会看到这篇文章的都对Flink的时间类型(事件时间.处理时间.摄入时间)和Watermark有些了解,当然不了解可以先看下官网的介绍:https://ci.apache.org/projects/flink/flink-docs-master/dev/event_time.html 这里就会有这样一个问题:FLink 是怎么基于事件时间和Watermark处理迟到数据的呢? 在回答这个问题之前,建议大家可以看下下面的Google 的三篇论文,关于流处理的模型: https://www.vld…

flink-----实时项目---day06-------1. 获取窗口迟到的数据 2.双流join（inner join和left join（有点小问题）） 3 订单Join案例（订单数据接入到kafka，订单数据的join实现，订单数据和迟到数据join的实现）

1. 获取窗口迟到的数据主要流程就是给迟到的数据打上标签,然后使用相应窗口流的实例调用sideOutputLateData(lateDataTag),从而获得窗口迟到的数据,进而进行相关的计算,具体代码见下 WindowLateDataDemo package cn._51doit.flink.day10; import org.apache.flink.api.common.functions.MapFunction; import org.apache.flink.api.java.tup…