一、如何迁移：从 Flink run 到流计算平台

如下图的线下命令如何迁移到线上。首先打开 VVP UI，添加基础配置，主要包括：作业名称、Jar URI、一些主要参数和并行度。还可以点击高级配置，配置更多信息。

比如高级配置里的行为配置，分为三部分：升级策略、初始状态和恢复策略。升级策略一般选择Stateless，初始状态选择Running，恢复策略选择Latest State。

升级策略选择Stateless，表示针对已经在运行的作业，编辑并保存配置后，会直接把原作业停掉，然后重新启动一个更新的作业；选择Stateble，针对正在运行的作业做配置编辑并保存的话，作业会先做一次Savepoint，然后加载新的配置并使用该 Savepoint启动新的作业。
恢复策略选择LatestSavepoint，是指作业在暂停情况下，如果再启动，将使用最新的Savepoint启动。
上面介绍的是 Flink 配置中比较重要的部分，下面图片显示的是另外一部分可以设置Checkpoint间隔等的配置，接下来是资源配置。日志配置部分可以选择日志保存位置，方便日后如果作业出现问题，可以方便的排查问题。

Flink 作业配置完成并启动运行后，如果出现异常，可以通过运行事件查看运行情况和问题。也可以打开 Flink UI的Job Manager，查看日志情况。

二、多Jar情况下，用户如何添加其他依赖的Jar

一些用户有自定义依赖且无法通过 fat jar 解决问题。举个例子，A用户有自己的main Jar和一些其他的Jar，这些Jar的应用场景不一样，那么首先需要在资源管理页面上传Jar包，上传完成之后就可以在页面使用该文件。
上传后再到高级配置中，找到“额外依赖的Jar”，下拉并选择刚刚上传的Jar 包就可以了。

三、用户如何通过配置文件定义作业

在资源管理里上传文件，然后在高级配置里选添加依赖，选择需要的依赖。如果启动函数里，main class是需要读取某个文件，先通过依赖添加文件，然后再根据提示的方式读取文件。

以上两个方式是放置用户Jar的方式，jar 和其他文件都可以在这里存放。

四、如何复用原来的state加速作业恢复

如果在运行作业时发现问题，一般情况下是停下来然后找到问题修复后再重启。用户需要在创建的时候指定 Checkpoint 需要的 OSS。如果开启了Checkpoint，后续作业就可以直接从Checkpoint中恢复。
首先确认高级配置中恢复策略选择LatestState或LatestSavepoint。在这个前提下，可以暂停作业（千万不要停止作业），暂停会触发Savepoint，当再次点击启动时，会从这次Savepoint点恢复。

打开 Flink UI ，然后点击作业快照，在作业快照中可以查看 Flink Checkpoint指标，里面会显示Restore的次数和最后一次Restore的地址等信息，可确定作业是从最新的 State 恢复。

当作业正在运行，想对当前作业进项拷贝，如何操作呢？在作业控制页面点击Checkpoint，找到历史快照并点击其对应的最右侧的“从该快照复制作业”，那么就完成了把当前作业复制的操作，复制内容包括正在运行作业的Jar 包配置等。点击启动后，可以从作业快照中查看到新作业是从上个作业最近的一次Savepoint中复制启动的。

作者：景丽宁（砚田）

原文链接

本文为阿里云原创内容，未经允许不得转载

如何迁移 Flink 任务到实时计算的更多相关文章

实时计算Flink on Kubernetes产品模式介绍
Flink产品介绍目前实时计算的产品已经有两种模式,即共享模式和独享模式.这两种模式都是全托管方式,这种托管方式下用户不需要关心整个集群的运维.其次,共享模式和独享模式使用的都是Blink引擎.这两 ...
Flink消费Kafka数据并把实时计算的结果导入到Redis
1. 完成的场景在很多大数据场景下,要求数据形成数据流的形式进行计算和存储.上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis. ...
Flink+kafka实现Wordcount实时计算
1. Flink Flink介绍: Flink 是一个针对流数据和批数据的分布式处理引擎.它主要是由 Java 代码实现.目前主要还是依靠开源社区的贡献而发展.对 Flink 而言,其所要处理的主要场 ...
可以穿梭时空的实时计算框架——Flink对时间的处理
Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成. 在Streaming-大数据的未来一文中我们知道,对于流式处理最重要 ...
《大数据实时计算引擎 Flink 实战与性能优化》新专栏
基于 Flink 1.9 讲解的专栏,涉及入门.概念.原理.实战.性能调优.系统案例的讲解. 专栏介绍扫码下面专栏二维码可以订阅该专栏首发地址:http://www.54tianzhisheng. ...
一文让你彻底了解大数据实时计算引擎 Flink
前言在上一篇文章你公司到底需不需要引入实时计算引擎? 中我讲解了日常中常见的实时需求,然后分析了这些需求的实现方式,接着对比了实时计算和离线计算.随着这些年大数据的飞速发展,也出现了不少计算的框架 ...
基于Kafka的实时计算引擎如何选择？Flink or Spark？
1.前言目前实时计算的业务场景越来越多,实时计算引擎技术及生态也越来越成熟.以Flink和Spark为首的实时计算引擎,成为实时计算场景的重点考虑对象.那么,今天就来聊一聊基于Kafka的实时计算引 ...
Apache Flink 如何正确处理实时计算场景中的乱序数据
一.流式计算的未来在谷歌发表了 GFS.BigTable.Google MapReduce 三篇论文后,大数据技术真正有了第一次飞跃,Hadoop 生态系统逐渐发展起来. Hadoop 在处理大批量 ...
（二）基于商品属性的相似商品推荐算法——Flink SQL实时计算实现商品的隐式评分
系列随笔: (总览)基于商品属性的相似商品推荐算法 (一)基于商品属性的相似商品推荐算法--整体框架及处理流程 (二)基于商品属性的相似商品推荐算法--Flink SQL实时计算实现商品的隐式评分 ( ...
实时计算框架：Flink集群搭建与运行机制
一.Flink概述 1.基础简介 Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算.Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算.主要特性包 ...

随机推荐

主题 3 编辑器(Vim)
主题 3 编辑器(Vim) 编辑器 (Vim) · the missing semester of your cs education (missing-semester-cn.github.io) ...
Android 开发Day8
/* AUTO-GENERATED FILE. DO NOT MODIFY. * * This class was automatically generated by the * gradle pl ...
爬虫实战：探索XPath爬虫技巧之热榜新闻
之前我们已经详细讨论了如何使用BeautifulSoup这个强大的工具来解析HTML页面,另外还介绍了利用在线工具来抓取HTTP请求以获取数据的方法.在今天的学习中,我们将继续探讨另一种常见的网络爬虫 ...
JavaScript知识总结终结篇--面向对象，垃圾回收与内存泄漏
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助一.面向对象一般使用字面量的形式直接创建对象,但是这种创建方式对于创建大量相似对象的时候,会产生大量的重复代码.但 js和一般的面向对象 ...
《On Java 8》笔记 2
第十一章内部类 Java 8 的 Lambda 表达式和方法引用减少了编写内部类的需求外部类可以提供一个方法返回一个指向内部类的引用链接外部类内部类还拥有其外部类的所有元素的访问权使用 .t ...
分析性能差的sql
--EXECUTIONS 所有子游标的执行这条语句次数 --DISK_READS 所有子游标运行这条语句导致的读磁盘次数 --BUFFER_GETS 所有子游标运行这条语句导致的读内存次数 --Hit ...
【环境配置】vscode配置C C++开发和调试环境
按照本教程配置好之后,不再需要写任何tasks.json和launch.json文件,减轻记忆负担,即使是调试程序,也不用再写这些文件了,跟着做就能得到一个很好的集成开发环境目录 msys2的安装与 ...
KingbaseES 对象重命名需要注意的事项
前言: Oracle 对视图或同义词依赖的底层对象表,如果被重命名,则视图或同义词失效.Oracle DBA 经常利用这个特点,对表进行重建,在重建过程中,无法通过视图或同义词访问,这就保证了数据的安 ...
32位x86处理器编程架构
1. IA-32架构的基本执行环境 1.1 寄存器的扩展为了在汇编语言程序中使用经过扩展(Extend) 的寄存器: 在32位模式下,为了生成32位物理地址,处理器需要使用32位的指令指针寄 ...
掌握 Spring IoC 容器与 Bean 作用域：详解 singleton 与 prototype 的使用与配置
在您的应用程序中,由 Spring IoC 容器管理的形成其核心的对象被称为 "bean".一个 bean 是由 Spring IoC 容器实例化.组装和管理的对象这些 bean ...