Flink sql 之AsyncIO与LookupJoin的几个疑问（源码分析）

本文源码基于flink 1.14

被同事问到几个关于AsyncIO和lookUp维表的问题所以翻了下源码，从源码的角度解惑这几个问题

对于AsyncIO不了解的可以看看之前写的这篇《Flink中异步AsyncIO的实现 (源码分析)》

问题一：AsyncIO 有（排序 / 非排序）模式，非排序模式数据会乱序，那水印waterMarker会乱序吗？？？

　　　　不想看源码的先直接给出答案

　　　　：不会乱序，接收到水印数据后非排序模式会，直接往下游发送waterMarker

问题二：LookUp维表join分为同步和Async, 上面异步非排序,数据会乱序水印不会，那sql的维表异步join数据会乱序吗？？？

　　　　：不会乱序，源码中默认都是AsyncIO的排序(Ordered)模式

ok上源码

问题一：AsyncIO水印会乱序吗？

来看一下异步io对应的StreamOperator的源码 org.apache.flink.streaming.api.operators.async.AsyncWaitOperator

异步io接收到数据以后，加入到queue里面，然后调用用户写的UserFunction

异步io接收到水印以后，同样加入到queue里面

那继续看addToWorkQueue方法接收到水印以后

加入具体的queue

继续，这里只看非排序的unordered

也是一样直接加addWtaermark()

将水印包装成一个WatermarkQueueEntry对象直接放queue

ok那来看下这个watermarkQueueEntry类

可以看到当水印进入queue以后直接就是已完成的了，就可以直接往下游发送，管你其他异步处理的数据完成没完成，水印已经往下发了

问题二：LookUp维表异步join会导致数据乱序吗？

看下关于lookup的calcite的对应规则

调用链不看了，有点长来看最后生成的，execNode物理的relNode执行节点StreamExecLookupJoin

来看下它抽象类 CommonExecLookupJoin的translateToPlanInternal方法

最后走到 createAsyncLookupJoin 来看下如何生成AsyncIO的function的

ok 用的ordered模式的异步io,维表关联的数据尽管是异步去join的，但是往下游发的时候还是按顺序的

不会乱序

Flink sql 之AsyncIO与LookupJoin的几个疑问（源码分析）的更多相关文章

[源码分析] 带你梳理 Flink SQL / Table API内部执行流程
[源码分析] 带你梳理 Flink SQL / Table API内部执行流程目录 [源码分析] 带你梳理 Flink SQL / Table API内部执行流程 0x00 摘要 0x01 Apac ...
[源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码生成 (修订版)
[源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码生成 (修订版) 目录 [源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码 ...
MyCat源码分析系列之——SQL下发
更多MyCat源码分析,请戳MyCat源码分析系列 SQL下发 SQL下发指的是MyCat将解析并改造完成的SQL语句依次发送至相应的MySQL节点(datanode)的过程,该执行过程由NonBlo ...
MyBatis源码分析-SQL语句执行的完整流程
MyBatis 是支持定制化 SQL.存储过程以及高级映射的优秀的持久层框架.MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集.MyBatis 可以对配置和原生Map使用简 ...
Flink源码分析 - 源码构建
原文地址:https://mp.weixin.qq.com/s?__biz=MzU2Njg5Nzk0NQ==&mid=2247483692&idx=1&sn=18cddc1ee ...
MyBatis 源码分析 - SQL 的执行过程
* 本文速览本篇文章较为详细的介绍了 MyBatis 执行 SQL 的过程.该过程本身比较复杂,牵涉到的技术点比较多.包括但不限于 Mapper 接口代理类的生成.接口方法的解析.SQL 语句的解析 ...
第十一篇：Spark SQL 源码分析之 External DataSource外部数据源
上周Spark1.2刚发布,周末在家没事,把这个特性给了解一下,顺便分析下源码,看一看这个特性是如何设计及实现的. /** Spark SQL源码分析系列文章*/ (Ps: External Data ...
第十篇：Spark SQL 源码分析之 In-Memory Columnar Storage源码分析之 query
/** Spark SQL源码分析系列文章*/ 前面讲到了Spark SQL In-Memory Columnar Storage的存储结构是基于列存储的. 那么基于以上存储结构,我们查询cache在 ...
第九篇：Spark SQL 源码分析之 In-Memory Columnar Storage源码分析之 cache table
/** Spark SQL源码分析系列文章*/ Spark SQL 可以将数据缓存到内存中,我们可以见到的通过调用cache table tableName即可将一张表缓存到内存中,来极大的提高查询效 ...

随机推荐

three.js 在模型上移动相机
需求: 根据鼠标点击位置相机进行相应的移动, 方案: 1.实际要解决的问题就是相机以及相机朝向位置的坐标更新 2.使用 TWEEN 组件优化两个点切换的补间动画 3.获取鼠标点击的位置获取鼠标 ...
Phalcon多模块如何实现连接不同数据库《Phalcon入坑指南系列五》
本系列目录一.Phalcon在Windows上安装 <Phalcon入坑指南系列一> 二.Phalcon入坑必须知道的功能<Phalcon入坑指南系列二> 三.Phalc ...
video 适配通屏展示、针对不同分辨率禁止变形处理
CSS object-fit 属性 object-fit: fill|contain|cover|scale-down|none|initial|inherit; 样式上 video{ height: ...
go语言游戏服务端开发（四）——RPC机制
五邑隐侠,本名关健昌,12年游戏生涯. 本教程以Go语言为例. RPC指远程方法调用,游戏里引入RPC目的是降低跨进程交互的复杂度. 游戏业务设计为多go routine,一个玩家一个go routi ...
从一个舒服的姿势插入 HttpClient 拦截器技能点
马甲哥继续写一点大前端,阅读耗时5 minute,行文耗时5 Days 今天我们来了解一下如何拦截axios请求/响应? 这次我们举一反三,用一个最舒适的姿势插入这个技能点. axios是一个基于 p ...
nginx负载均衡部署
1 系统版本 CentOS Linux release 6.0.1708 (Core) 2 编译安装前所需要的准备: 1.GCC编译器首先检查GCC是否安装,命令:gcc -v ,如果显示有相关版本 ...
关于dp那些事
拿到一道题,先写出状态转移方程,再优化时间复杂度状态优化: 对于状态可累加 \(e.g.dp[i+j]=dp[i]+dp[j]+i+j\) 的,用倍增优化决策优化: \(e.g.dp[i][j]= ...
Java初步学习——2021.10.12每日总结，第六周周二
(1)今天做了什么: (2)明天准备做什么? (3)遇到的问题,如何解决? 今天学习了菜鸟教程Java实例,数组 1.数组的排序和元素的查找--sort和binarySearch方法 import j ...
flask 之请求钩子
请求钩子什么是请求钩子? 在客户端和服务器交互的过程中,有些准备工作或扫尾工作需要统一处理,为了让每个视图函数避免编写重复功能的代码,flask提供了统一的接口可以添加这些处理函数,即请求钩子. f ...
锚点布局anchorlayout在kv中的引用
from kivy.app import App from kivy.uix.anchorlayout import AnchorLayout from kivy.uix.button import ...

Flink sql 之AsyncIO与LookupJoin的几个疑问 （源码分析）

Flink sql 之AsyncIO与LookupJoin的几个疑问 （源码分析）的更多相关文章

随机推荐

热门专题

Flink sql 之AsyncIO与LookupJoin的几个疑问（源码分析）

Flink sql 之AsyncIO与LookupJoin的几个疑问（源码分析）的更多相关文章