Flink HA

standalone 模式的高可用

部署

flink 使用zookeeper协调多个运行的jobmanager,所以要启用flink HA 你需要把高可用模式设置成zookeeper，配置zookeeper相关参数，并且在masters配置文件中配置所有的jobmanager主机地址和web UI 端口

在一下例子中，我们配置node1,node2,node3三个jobmanager

编辑conf/masters
```
node1:8081

node2:8081

node3:8081
```

编辑conf/flink-conf.yaml

high-availability: zookeeper

high-availability.zookeeper.quorum: node1:2181,node2:2181,node3:2181

high-availability.zookeeper.path.root: /flink

high-availability.cluster-id: /cluster_one 	high-availability.storageDir: hdfs:///flink/recovery

启动集群
```
bin/start-cluster.sh
```

yarn 模式的高可用

yarn 模式中不会同时运行多个jobmanager(ApplicationMaster) instances,而是只运行一个，如果ApplicationMaster异常会依靠Yarn机制进行重启.

部署

编辑yarn-site.xml添加如下配置

<property>

	<name>yarn.resourcemanager.am.max-attempts</name>

	<value>4</value>

	<description>

	The maximum number of application master execution attempts.

	</description>

</property>

设置application master 最大重启次数

编辑conf/flink-conf.yaml

high-availability: zookeeper

high-availability.zookeeper.quorum: node1:2181,node2:2181,node3:2181

high-availability.storageDir: hdfs:///flink/recovery

high-availability.zookeeper.path.root: /flink

yarn.application-attempts: 10

配置HA模式为zookeeper,并设置应用的最大重启次数

启动一个yarn session
```
bin/yarn-session.sh -n 2
```

原理

采用curator库中的LeaderLatch实现leader选举。不了解的同学可以移步curator相关文档LeaderLatch

在zookeeper中生成的主要目录结构如下图:

涉及到的主要类:

选举:

首先我们看一下JobManager的构造函数：

注意它的构造函数需要LeaderElectionService对象作为参数以及它本身实现了LeaderContender接口。那么LeaderElectionService是怎么创建的？其实就是根据high-availability: zookeeper此配置项，由HighAvailabilityServicesUtils工具类的createAvailableOrEmbeddedServices方法创建HighAvailabilityServices对象然后通过其getJobManagerLeaderElectionService方法创建：

public static HighAvailabilityServices createAvailableOrEmbeddedServices(

	Configuration config,

	Executor executor) throws Exception {

	HighAvailabilityMode highAvailabilityMode = LeaderRetrievalUtils.getRecoveryMode(config);

	switch (highAvailabilityMode) {

		case NONE:

			return new EmbeddedHaServices(executor);

		case ZOOKEEPER:

			BlobStoreService blobStoreService = BlobUtils.createBlobStoreFromConfig(config);

			return new ZooKeeperHaServices(

				ZooKeeperUtils.startCuratorFramework(config),

				executor,

				config,

				blobStoreService);

		default:

			throw new Exception("High availability mode " + highAvailabilityMode + " is not supported.");

	}

}



    ```java

	public static ZooKeeperLeaderElectionService createLeaderElectionService(

		final CuratorFramework client,

		final Configuration configuration,

		final String pathSuffix)

	{

		final String latchPath = configuration.getString(

			HighAvailabilityOptions.HA_ZOOKEEPER_LATCH_PATH) + pathSuffix;

		final String leaderPath = configuration.getString(

			HighAvailabilityOptions.HA_ZOOKEEPER_LEADER_PATH) + pathSuffix;

		return new ZooKeeperLeaderElectionService(client, latchPath, leaderPath);

	}

我们再了解一下`ZooKeeperLeaderElectionService`

![](https://img2018.cnblogs.com/blog/413838/201810/413838-20181008220134231-1838364581.png)

以及`LeaderContender`

![](https://img2018.cnblogs.com/blog/413838/201810/413838-20181008220233351-1437582454.png)

`ZooKeeperLeaderElectionService`类主要管理`namespace`下的两个路径,即`latchPath`(/leaderlatch)和`leaderPath(/leader)`,`latchPath`用来进行leader选举,`leaderPath`存储选举出的leader的地址和UUID。

`LeaderContender`类用于当leader发生改变时，收到相应的通知以进行相关业务处理。比如：自己变成leader时，进行job恢复；当自己被撤销leader时，断开注册的TaskManager。

在`JobManager`的`preStart`方法中会调用`ZooKeeperLeaderElectionService`的`start`方法注册`LeaderLatch`(/leaderlatch)和`NodeCache`(/leader)的监听器。如果某个`LeaderLatch`被选为leader,则对应的`ZooKeeperLeaderElectionService`对象的`isLeader`方法会被回调，从而调用`LeaderContender->grantLeadership()`通知被选中的竞选者(此处为JobManager),然后`JobManager`会调用`LeaderElectionService->confirmLeaderSessionID()`把被选中的leader的相关信息写入到`/leader`目录下，并异步进行job恢复工作。

NodeCache(/leader)的监听器监听写入数据的变化，并具备纠错功能。

```java

public void isLeader() {

	synchronized (lock) {

		if (running) {

			issuedLeaderSessionID = UUID.randomUUID();

			confirmedLeaderSessionID = null;

			if (LOG.isDebugEnabled()) {

				LOG.debug(

					"Grant leadership to contender {} with session ID {}.",

					leaderContender.getAddress(),

					issuedLeaderSessionID);

			}

			leaderContender.grantLeadership(issuedLeaderSessionID);

		} else {

			LOG.debug("Ignoring the grant leadership notification since the service has " +

				"already been stopped.");

		}

	}

}



    leader重新选举后需要恢复提交的Job以及恢复相应job的checkpoint。 这就涉及到`JobManager`构造函数图示中圈红的`SubmittedJobGraphStore`和`CheckpointRecoveryFactory`这两个类,我们后边专门进行详细讲解。

* 查询:

    ![](https://img2018.cnblogs.com/blog/413838/201810/413838-20181008220442621-548390073.png)

     `ZooKeeperLeaderRetrievalService`通过监听`/flink/{cluster_id}/leader/{default_jobid}/job_manager_lock`目录的变化，读取该目录下的数据然后通过`LeaderRetrievalListener`的`notifyLeaderAddress`方法通知实现该接口的对象。比如更新`FlinkMiniCluster`的`leaderGateway`

Flink HA的更多相关文章

Flink HA 搭建坑
目前网上能找到的做HA的教程基本都无法真正做到多机高可用,包括官方文档,经过很久的折腾,终于做到了多机高可用,希望其它人不再被坑. 集群模式安装前提条件: 机器已经安装好Java环境 jobMana ...
Flink源码学习笔记(3)了解Flink HA功能的实现
使用Flink HA功能维护JobManager中组件的生命周期,可以有效的避免因为JobManager 进程失败导致任务无法恢复的情况. 接下来分享下 Flink HA功能的实现大纲基于Zook ...
flink ha zk集群迁移实践
flink为了保证线上作业的可用性,提供了ha机制,如果发现线上作业失败,则通过ha中存储的信息来实现作业的重新拉起. 我们在flink的线上环境使用了zk为flink的ha提供服务,但在初期,由于资 ...
Flink JobManager HA模式部署（基于Standalone）
参考文章:https://ci.apache.org/projects/flink/flink-docs-release-1.3/setup/jobmanager_high_availability. ...
flink的集群的HA高可用
对于一个企业级的应用,稳定性是首要要考虑的问题,然后才是性能,因此 HA 机制是必不可少的: 和 Hadoop 一代一样,从架构中我们可以很明显的发现 JobManager 有明显的单点问题(SPOF ...
搭建高可用的flink JobManager HA
JobManager协调每个flink应用的部署,它负责执行定时任务和资源管理. 每一个Flink集群都有一个jobManager, 如果jobManager出现问题之后,将不能提交新的任务和运行新任 ...
Flink on yarn以及实现jobManager 高可用(HA)
on yarn https://ci.apache.org/projects/flink/flink-docs-release-1.8/ops/deployment/yarn_setup.html f ...
Flink源码分析 - 源码构建
原文地址:https://mp.weixin.qq.com/s?__biz=MzU2Njg5Nzk0NQ==&mid=2247483692&idx=1&sn=18cddc1ee ...
Flink的高可用集群环境
Flink的高可用集群环境 Flink简介 Flink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布,数据通信以及容错机制等功能. 因现在主要Flink这一块做先关方面的学习, ...

随机推荐

ssh无密码登陆远程机，pssh轻批量工具
#B(client)--------A(g_server)#A: ssh-keygen -t rsa (g_server)#B: scp -P 58422 root@g_server_ip: ...
1070. [SCOI2007]修车【费用流】
Description 同一时刻有N位车主带着他们的爱车来到了汽车维修中心.维修中心共有M位技术人员,不同的技术人员对不同的车进行维修所用的时间是不同的.现在需要安排这M位技术人员所维修的车及顺序, ...
搭建高可用mysql系列（2）-- Percona XtraDB Cluster 安装
本文主要介绍在 centos 下 Percona XtraDB Cluster(下文简称PXC) 的安装, 个人的系统版本信息如下: [root@c2-d09 worker]# more /etc/r ...
在任务管理器中显示所有CPU内核性能
在Windows7"任务管理器"的”性能“选项卡默认显示所有的CPU内核性能在Windows10中可以通过设置来实现效果
20155314 2016-2017-2 《Java程序设计》第4周学习总结
20155314 2016-2017-2 <Java程序设计>第4周学习总结教材学习内容总结理解封装.继承.多态的关系理解抽象类与接口的区别掌握S.O.L.I.D原则了解模式和设 ...
Longest Substring Without Repeating Characters[medium]
Given a string, find the length of the longest substring without repeating characters. Examples: Giv ...
Python2图像文本识别
原文地址:http://www.cnblogs.com/tanghuang/p/6380588.html 适用版本:python2以下将图片中的数字通过 pytesseract.image_to_s ...
Python高级编程和异步IO并发编程
第1章课程简介介绍如何配置系统的开发环境以及如何加入github私人仓库获取最新源码. 1-1 导学试看 1-2 开发环境配置 1-3 资源获取方式第2章 python中一切皆对象本章节首先对比静 ...
东芝线阵CCD芯片TCD1305DG驱动时序设计
最近在做微型光谱仪,用到了东芝的CCD芯片TCD1305DG,该芯片是单行3648像素,输出信号是时间上离散的模拟信号,典型输出速率为0.5M,即每2000ns输出一个像素值(模拟信号),芯片内部集成 ...
python 小技巧同时迭代多个列表，多变量同时运算
再来一个大家很熟悉的 dict={"a": "b","c": "d"}k,v=dict.items()print(k,v ...

Flink HA

standalone 模式的高可用

部署

yarn 模式的高可用

部署

原理

Flink HA的更多相关文章

随机推荐

热门专题