flink笔记(三) flink架构及运行方式
架构图

Job Managers, Task Managers, Clients
- JobManager(Master)
- 用于协调分布式执行。它们用来调度task,协调检查点,协调失败时恢复等。
- Flink运行时至少存在一个JobManager。
- 一个高可用的运行模式会存在多个JobManager,它们其中有一个是leader,而其他的都是standby。
- TaskManager(Worker)
- 用于执行一个dataflow的task(或者特殊的subtask)、数据缓冲和data stream的交换。
- Flink运行时至少会存在一个TaskManager。
- TaskManager连接到JobManager,告知自身的可用性进而获得任务分配。
- 客户端不是运行时和程序执行的一部分。但它用于准备并发送dataflow给master,然后户端断开连接或者维持连接以等待接收计算结果。
- JobManager和TaskManager可以以如下方式中的任意一种启动:
- Standalone cluster
- Yarn
- Mesos
- Container(容器, 如 由K8S管理的Docker集群)
Standalone 模式
- 流程如上所示
- 任务提交命令:
- bin/flink run -c mainclass jar_path
- webui 提交(傻瓜式)
On Yarn 模式
两种运行模式
Yarn-session 模式
- 该模式是预先在yarn上面划分一部分资源给flink集群用,flink提交的所有任务,共用这些资源。
- 示意图
- 任务提交
- 先启动一个yarn-session,并指明分配的资源。
- 命令:
- ./yarn-session.sh -n 3 -jm 1024 -tm 1024 /opt/sxt/flinkTest.jar
- -n 容器个数
- -jm jobmanager 进程内存大小
- -tm 指明每个 taskmanager 的进程内存大小
- 启动yarn-session后,就可以提交任务了
- . /flink run -m 节点:端口 jar 文件目录
- 停止yarn上的 flink 集群
- 先找到 application_id
- 然后执行命令:
- yarn application -kill application_id
Single job 模式
该模式是每次提交任务,都会创建一个新的flink集群
任务之间互相独立,互不影响,方便管理
任务执行完成之后,flink集群也会消失
示图:

任务提交命令:
- ./flink rum -m yarn-cluster -yn 并行度 jar文件路径
- -m:
- 后面跟的是yarn-cluster,不需要指明地址。
- 这是由于Single job模式是每次提交任务会新建flink集群,所以它的jobmanager是不固定的。
- -yn:
- 指明taskmanager个数。
- 其余参数可使用:./flink -h 来查看
- -m:
- ./flink rum -m yarn-cluster -yn 并行度 jar文件路径
运行原理
flink on yarn 内部实现图

步骤1
- 当启动一个新的 Flink YARN Client会话,客户端首先会检查所请求的资源(容器和内存)是否可用。
- 之后,它会上传包含了 Flink 配置文件和 jar包到 HDFS.
步骤2
- 客户端的请求一个container资源去启动 ApplicationMaster 进程
步骤3
- ResourceManager选一台NodeManager机器启动AM。
- 注意点1:
- 因为客户端已经将配置文件和jar包作为容器的资源注册了,所以 NodeManager 会负责准备容器做一些初始化工作(例如,下载文件)。
- 一旦这些完成了,ApplicationMaster (AM) 就启动了。
- 注意点2:
- JobManager 和 AM 运行在同一个容器中。
- 一旦它们成功地启动了,AM 知道 JobManager 的地址(它自己)。
- 它会为 TaskManager 生成一个新的 Flink 配置文件(这样它们才能连上 JobManager)。
- 该文件也同样会上传到 HDFS。另外,AM 容器同时提供了 Flink 的 Web 界面服务。
步骤4
- AM 开始为 Flink 的 TaskManager 分配容器(container),在对应的nodemanager上面启动taskmanager
步骤5
- 初始化工作,从 HDFS 下载 jar 文件和修改过的配置文件。
- 一旦这些步骤完成了,Flink 就安装完成并准备接受任务了。
flink笔记(三) flink架构及运行方式的更多相关文章
- Flink学习笔记-新一代Flink计算引擎
说明:本文为<Flink大数据项目实战>学习笔记,想通过视频系统学习Flink这个最火爆的大数据计算框架的同学,推荐学习课程: Flink大数据项目实战:http://t.cn/EJtKh ...
- Flink学习笔记:Flink Runtime
本文为<Flink大数据项目实战>学习笔记,想通过视频系统学习Flink这个最火爆的大数据计算框架的同学,推荐学习课程: Flink大数据项目实战:http://t.cn/EJtKhaz ...
- Flink(三)Flink开发IDEA环境搭建与测试
一.IDEA开发环境 1.pom文件设置 <properties> <maven.compiler.source>1.8</maven.compiler.source&g ...
- 揭秘 Flink 1.9 新架构,Blink Planner 你会用了吗?
本文为 Apache Flink 新版本重大功能特性解读之 Flink SQL 系列文章的开篇,Flink SQL 系列文章由其核心贡献者们分享,涵盖基础知识.实践.调优.内部实现等各个方面,带你由浅 ...
- 开篇 | 揭秘 Flink 1.9 新架构,Blink Planner 你会用了吗?
本文为 Apache Flink 新版本重大功能特性解读之 Flink SQL 系列文章的开篇,Flink SQL 系列文章由其核心贡献者们分享,涵盖基础知识.实践.调优.内部实现等各个方面,带你由浅 ...
- Flink 笔记(一)
简介 Flink是一个低延迟.高吞吐.统一的大数据计算引擎, Flink的计算平台可以实现毫秒级的延迟情况下,每秒钟处理上亿次的消息或者事件. 同时Flink提供了一个Exactly-once的一致性 ...
- 《从0到1学习Flink》—— Apache Flink 介绍
前言 Flink 是一种流式计算框架,为什么我会接触到 Flink 呢?因为我目前在负责的是监控平台的告警部分,负责采集到的监控数据会直接往 kafka 里塞,然后告警这边需要从 kafka topi ...
- 8、Flink Table API & Flink Sql API
一.概述 上图是flink的分层模型,Table API 和 SQL 处于最顶端,是 Flink 提供的高级 API 操作.Flink SQL 是 Flink 实时计算为简化计算模型,降低用户使用实时 ...
- Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
随机推荐
- runas的替代品CPAU使用
runas替代软件CPAU 在windows系统下,想要实现某个程序不论何时都以指定的用户身份登录,因此找到了CPAU这个软件 cpau官方网站:https://www.joeware.net/fre ...
- C. Book Reading 求在[1,n]中的数中,能整除m的数 的个位的和
C. Book Reading time limit per test 1 second memory limit per test 256 megabytes input standard inpu ...
- 【剑指Offer面试编程题】题目1386:旋转数组的最小数字--九度OJ
题目描述: 把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转.输入一个递增排序的数组的一个旋转,输出旋转数组的最小元素.例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转 ...
- dir815_FW_102.bin路由器固件解压碰到的坑
在跟随大神kczwa1进行路由器漏洞分析时,对dir815_FW_102.bin 固件文件用binwalk -e dir815_FW_102.bin命令进行解压时,在根目录squashfs-root下 ...
- 开通博客第一天 写一个hello world
申请的博客第一天便被批准了,有了一个和大家交流学习的园地.在今后的日子里期待一起进步.
- pytho 基本数据类型
1.字符串(引号) name = "........." 双引号引出来的都是字符串 name = """.........""& ...
- gpg加密和解密
linux:gpg加密和解密 1 创建密钥 2 查看私钥 3 导出公钥 4 导出私钥 5 导入秘钥 5.1 公钥 6 公钥加密 7 私钥解密 创建密钥 gpg --gen-key 你要求输入一下内容, ...
- spring切面编程
xml配置实现 先写三个类 public String amethod(String s) { System.out.println("This is AAAAAAAAAAAAAAAA&q ...
- dwr超时
DWR可以指定超时设置: 1.设置局部超时: RemoteBean.remoteMethod(param1, param2, ..., { callback: callbackfun, //回调函数 ...
- jsp获取web的跟路径
我实现了一个listener,此listener在tomcat启动的时候读取项目的配置文件,配置文件是xml.但是读取解析的功能是在另一个工具类实现的. 这个普通的工具类B,如何获取到当前web的跟路 ...