Flink模式

Per-job Cluster

该模式下，一个作业一个集群，作业之间相互隔离。

在Per-Job模式下，集群管理器框架用于为每个提交的Job启动一个 Flink 集群。Job完成后，集群将关闭，所有残留的资源也将被清除。

此模式可以更好地隔离资源，因为行为异常的Job不会影响任何其他Job。另外，由于每个应用程序都有其自己的JobManager，因此它将记录的负载分散到多个实体中。

场景：Per-Job模式适合长期运行的Job，这些Job可以接受启动延迟的增加以支持弹性。

资源管理器支持：Yarn

Application

与per-job 模式相比，在Application 模式下，main() 方法在集群上而不是在客户端执行。

场景：任务启动较慢，适合于长时间运行的大型任务。

资源管理器支持：Yarn、Native kubernetes

Session

该模式下，作业共享集群资源。Session 模式提交的应用都在该集群里执行，会导致资源的竞争。

该模式优势是无需为每一个提交的任务花费精力去分解集群。但是，如果Job异常或是TaskManager 宕掉，那么该TaskManager运行的其他Job都会失败。除了影响到任务，也意味着潜在需要更多的恢复操作，重启所有的Job，会并发访问文件系统，会导致该文件系统对其他服务不可用。此外，单集群运行多个Job，意味着JobManager更大的负载。

场景：该模式适合于对启动延迟要求较高且运行时间较短的作业，例如交互式查询。任务提交速度快，适合频繁提交运行的短时间任务。

资源管理器支持：Standalone、Yarn、Native kubernetes

Flink on kubernetes

Standalone

Standalone模式需要在任务启动时就确定TaskManager的数量，不能像Yarn一样，可以在任务启动时申请动态资源。

很多时候任务需要多少个TaskManager事先并不知道，TaskManager设置少了，任务可能跑不起来，多了又会造成资源浪费，需要在任务启动时才能确定需要多少个TaskMananger。

Standalone Application kubernetes

需要先将用户代码都打到镜像里面，然后根据该镜像来部署一个flink集群运行用户代码。

每提交一个任务，单独启动一个集群运行该任务，运行结束集群被删除，资源也被释放。

Standalone Session kubernetes

在Session模式下，先启动一个Flink集群，然后向该集群提交任务，所有任务共用JobManager。

Native kubernetes

Flink 的 Client 内置了一个 K8s Client，可以借助 K8s Client 去创建 JobManager，当 Job 提交之后，如果对资源有需求，JobManager 会向 Flink 自己的 ResourceManager 去申请资源。这个时候 Flink 的 ResourceManager 会直接跟 K8s 的 API Server 通信，将这些请求资源直接下发给 K8s Cluster，告诉它需要多少个 TaskManger，每个 TaskManager 多大。当任务运行完之后，它也会告诉 K8s Cluster 释放没有使用的资源。相当于 Flink 用很原生的方式了解到 K8s Cluster 的存在，并知晓何时申请资源，何时释放资源。

Native Kubernetes Application

native kubernetes下，application模式相当于提交任务时调k8s api自动拉起一个flink集群跑该应用，然后跑完就删除集群。

这种模式比较适合对启动时间不敏感、且长时间运行的作业。不适合对任务启动时间比较敏感的场景。

优点：隔离性比较好，任务之间资源不冲突，一个任务单独使用一个 Flink 集群；相对于 Flink session 集群而且，资源随用随建，任务执行完成后立刻销毁资源，资源利用率会高一些。

缺点：需要提前指定 TaskManager 的数量，如果 TaskManager 指定的少了会导致作业运行失败，指定的多了仍会降低资源利用率；资源是实时创建的，用户的作业在被运行前，需要先等待以下过程。

flink on native kubernetes application模式：提交任务示例

./bin/flink run-application --target kubernetes-application

-Dkubernetes.namespace=flink-native-kubernetes

-Dkubernetes.cluster-id=flink-application-cluster

-Dkubernetes.jobmanager.service-account=flink

-Dkubernetes.container.image=flink:1.14.2

-Dkubernetes.rest-service.exposed.type=NodePort

-Djobmanager.heap.size=1024m

-Dkubernetes.jobmanager.cpu=1

-Dkubernetes.taskmanager.cpu=2

-Dtaskmanager.memory.process.size=1024m

-Dtaskmanager.numberOfTaskSlots=2

local:///opt/flink/examples/batch/WordCount.jar

应用镜像构建方式：

`FROM flink:1.14.2

 RUN mkdir -p $FLINK_HOME/usrlib

 COPY my-flink-job.jar $FLINK_HOME/usrlib/my-flink-job.jar`

Native Kubernetes Session

native kubernetes下,session模式是提前调k8s api启动一个常驻的flink集群，然后客户端提交任务时，调k8s api自动起一个taskmanager pod 运行任务，然后等任务运行完之后，这个taskmanager的任务pod会被销毁。

flink on native kubernetes session模式：

1、kubectl create namespace flink-session-cluster

2、kubectl create serviceaccount flink -n flink-session-cluster

3、kubectl create clusterrolebinding flink-role-binding-flink --clusterrole=edit --serviceaccount=flink-session-cluster:flink

启动session集群：

4、./bin/kubernetes-session.sh \

 -Dkubernetes.namespace=flink-session-cluster \

-Dkubernetes.jobmanager.service-account=flink \

 -Dkubernetes.cluster-id=flink-session-cluster \

 -Dkubernetes.rest-service.exposed.type=NodePort  \

-Dkubernetes.container.image=flink:1.14.2

flink on native kubernetes session模式：提交任务示例

./bin/flink run -d --target kubernetes-session  \

-Dkubernetes.namespace=flink-session-cluster  \

-Dkubernetes.cluster-id=flink-session-cluster \

 -Dkubernetes.jobmanager.service-account=flink \

-Dkubernetes.rest-service.exposed.type=NodePort \

/opt/flink-1.14.2/examples/batch/WordCount.jar

总结

Flink on K8s ：

优点：

Flink 在 K8s 上最简单的方式是以 Standalone 方式进行部署。这种方式部署的好处在于不需要对 Flink 做任何改动，同时 Flink 对 K8s 集群是无感知的，通过外部手段即可让 Flink 运行起来。

缺点：

无论 Operator、Helm Chart 或者是直接使用 Kubectl Yaml 的方式，Flink 都感知不到 K8s 的存在。
目前主要使用静态的资源分配。需要提前确认好需要多少个 TaskManager，如果 Job 的并发需要做一些调整，TaskManager 的资源情况必须相应的跟上，否则任务无法正常执行。
用户需要对一些 Container、Operator 或者 K8s 有一些最基本的认识，这样才能保证顺利将 Flink 运行到 K8s 之上。
对于批处理任务，或者想在一个 Session 里提交多个任务不太友好。无法实时申请资源和释放资源。因为 TaskManager 的资源是固定的，批处理任务可能会分多个阶段去运行，需要去实时地申请资源、释放资源，当前也无法实现。如果需要在一个 Session 里跑多个 Job 并且陆续运行结束当前也无法实现。
如果维持一个比较大的 Session Cluster，可能会资源浪费。但如果维持的 Session Cluster 比较小，可能会导致 Job 跑得慢或者是跑不起来。

基于这几点，社区推进了一个 Native 的集成方案。让Flink 原生的感知到下层 Cluster 的存在。Native 是相对于 Flink 而言的，借助 Flink 的命令就可以达到自治的一个状态，不需要引入外部工具就可以通过 Flink 完成任务在 K8s 上的运行。

生产环境上推荐：

Flink on YARN(pre-job、application）、Flink on Native Kubernetes Appliation；

问题

Flink on Kubernetes 需考虑的问题：

日志问题

日志需要通过k8s的pod日志排查。如果出现节点宕机，pod飘移到别的节点，日志获取困难。

应用jar包问题

flink on k8s的application模式需要将jar包以及依赖放在镜像里启动。

应用依赖问题

有依赖的任务，无法通过客户端获取信息。k8s不支持pre-job模式。

Flink模式的更多相关文章

Flink JobManager HA模式部署（基于Standalone）
参考文章:https://ci.apache.org/projects/flink/flink-docs-release-1.3/setup/jobmanager_high_availability. ...
Flink部署-standalone模式
Flink部署-standalone模式 2018年11月30日 00:07:41 Xlucas 阅读数:74 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.cs ...
Flink 集群运行原理兼部署及Yarn运行模式深入剖析
1 Flink的前世今生(生态很重要) 原文:https://blog.csdn.net/shenshouniu/article/details/84439459 很多人可能都是在 2015 年才听到 ...
Flink架构分析之Standalone模式启动流程
概述 FLIP6 对Flink架构进行了改进,引入了Dispatcher组件集成了所有任务共享的一些组件:SubmittedJobGraphStore,LibraryCacheManager等,为了保 ...
Flink on Yarn模式启动流程分析
此文已由作者岳猛授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. Flink On Yarn 架构 Paste_Image.png 前提条件首先需要配置YARN_CONF_DI ...
Flink on Yarn模式启动流程源代码分析
此文已由作者岳猛授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. Flink on yarn的启动流程可以参见前面的文章 Flink on Yarn启动流程,下面主要是从源码角 ...
【Flink】深入理解Flink-On-Yarn模式
1. 前言 Flink提供了两种在yarn上运行的模式,分别为Session-Cluster和Per-Job-Cluster模式,本文分析两种模式及启动流程. 下图展示了Flink-On-Yarn模式 ...
Flink 源码解析 —— Standalone session 模式启动流程
Standalone session 模式启动流程 https://t.zsxq.com/EemAEIi 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0 ...
[Flink]Flink1.6三种运行模式安装部署以及实现WordCount
前言 Flink三种运行方式:Local.Standalone.On Yarn.成功部署后分别用Scala和Java实现wordcount 环境版本:Flink 1.6.2 集群环境:Hadoop2 ...
Flink on Yarn的两种模式及HA
转自:https://blog.csdn.net/a_drjiaoda/article/details/88203323 Flink on Yarn模式部署始末:Flink的Standalone和on ...

随机推荐

Python3之并发(五)---线程条件(Condition)和事件(Event)
一.线程条件Condition(条件变量) 依赖锁对象(Lock,RLock),锁对象可以通过参数传入获得,或者使用自动创建的默认锁对象当多个条件变量需要共享同一个锁时,建议传入锁对象除了带有获取到 ...
Easycode—MybatisPlus模板
EasyCode使用指南 1.下载EasyCode插件 2.配置EasyCode 2.1.配置作者名称 2.2.配置代码内容生成模板(模板内容见文末) ...
jeecg 自定义loading框（导入时加载备份/ajax请求加载loading）
第一种: 1.导入t:upload标签 <t:upload name="fiels" buttonText="选择文件" uploader="p ...
前端面试问题整理（html和css部分）
html5新增属性有哪些? 如何理解语义化标签? 你如何看待前端模块化的? 如何看待前后端分离? 浏览器兼容性问题? 你知道的行内元素.块级元素有哪些? css部分: 1.为什么要初始化css样式? ...
Java中File类
File类是java.io包中唯一代表磁盘文件本身的对象.File类的对象主要用来获取文件本身的一些信息,如文件所在目录.文件长度.读写权限等. 一. 文件的创建与删除通常使用以下三种方法来创建一个 ...
C# net core 从文件流中获取文件头、匹配文件类型
常用文件的文件头如下: (以前六位为准) JPEG (jpg),文件头:FFD8FF PNG (png),文件头:89504E47 GIF (gif),文件头:47494638 TIFF (tif), ...
4组-Beta冲刺-1/5
一.基本情况队名:摸鲨鱼小队组长博客:https://www.cnblogs.com/smallgrape/p/15590583.html github链接:https://github.com/ ...
PLC入门笔记12
1.边沿应用 (1)边沿开关 (2)上升沿触发下降沿触发 (3) MOVP K4M0 D0 传送比较 movp (=mov) 脉冲型指令前面条件成立只能执行一次,仅执行一次扫描周期不带P MOV ...
④ 版本② axios 封装
HttpRequestBase 类 1 构造函数 constructor(baseUrl) { const basePort = getUrlPort(baseUrl); this.baseUrl = ...
nodejs的增删改查
1.新建一个jwttest.router.js 引入toast const {success,fail} = require("../toast"); const jwt = re ...