SparkLauncher 1.6 版本bug
背景
近期在研究使用
java api的方式来调用Spark程序,通过句柄的方式来完成监控Job运行状态、及时杀死Job等功能。官方文档直接指出使用Java/Scala创建Job的方式——利用SparkLauncher类。 环境:Hadoop2.6;Spark 1.6
SparkLauncher类概览
该类通过主要包含一些设置Spark Job参数相关的成员变量与函数,另外,还包括启动Spark Job的两个函数(launch()和startApplication())。
其中,launch()函数只是简单拼接spark-submit命令,并以子进程的方式启动;startApplication()通过将命令提交给ChildProcAppHandle,通过其创建Launch Server与Driver中Launch Backend之间的连接,返回的ChildProcAppHandle可以实现用户与程序之间实时交互的效果。
ChildProcAppHandle类可以对提交后的job有一些交互式操作,如获取JobIb(Application****)、获取Job运行状态、杀死Job等。
综上,可以创建一个SparkLauncher,配置Spark参数,通过startApplication()的方式提交Job,然后监控获得作业的运行状态(State)。
SparkLauncher launcher = new SparkLauncher();
launcher.setAppName(appName);
launcher.setMaster("yarn-cluster");
// launcher.setMaster("local");
launcher.setAppResource("wordcount.jar");
launcher.setMainClass("WordCount");
launcher.setConf(SparkLauncher.DRIVER_MEMORY, "2g");
launcher.setConf(SparkLauncher.EXECUTOR_MEMORY, "2g");
launcher.setConf(SparkLauncher.EXECUTOR_CORES, "3");
//jar包路径为在整个文件系统中的路径。
launcher.addAppArgs(new String[]{"",""});//SparkApp Main args
launcher.setVerbose(true);
SparkAppHandle handle = launcher.startApplication();
while(handle.getState() != SparkAppHandle.State.FINISHED) {
Thread.sleep(1000L);
System.out.println("applicationId is: "+ handle.getAppId());
System.out.println("current state: "+ handle.getState());
// handle.stop();
}
实践过程中遇到问题
在实践时,由于SparkAppHandle中State有如下枚举值:
想当然认为JOB运行成功状态就是FINISHED,失败会是FAILED。运行一个确实能成功运行的Job的确没有出现问题,跟预期一样。但是,在运行一个输出路径在HDFS上已存在的JOB时,后台得到的State并不是一开始想当然的FAILED,而同样是FINISHED。于是各种查,终于在GITHUB上找到链接,原来这个问题在Spark2.0中已经修复,在1.6中是已存在的bug。
细看代码yarn/src/main/scala/org/apache/spark/deploy/yarn/Client.scala,进行对比。
Spark 1.6
Spark 2.0
很明显,Spark 2.0中对FINISHED的状态进行了细分,让Yarn将更准确的State状态信息传回。
SparkLauncher 1.6 版本bug的更多相关文章
- Lazarus下面的javascript绑定另外一个版本bug修正
Lazarus下面的javascript绑定另外一个版本bug修正 从svn 检出的代码有几个问题 1.fpcjs.pas 单元开始有 {$IFDEF FPC} {$MODE delphi} {$EN ...
- Alpha版本BUG BASH
在本次软件开发的第一轮迭代中,我们团队遇到了很多问题.首先是和学长联系不上导致拿到项目前一版本的代码的时间延后了一个星期. 拿到代码后发现由于安装环境的问题代码无法移植.在这一阶段我们就耗费了大量的时 ...
- DDL_Killer Alpha版本 Bug集中反馈处
本博客用于DDL_Killer Alpha版本的Bug集中反馈. 您可以在本博客的下方评论区处留言,反馈您在使用DDl_Killer的过程中遇到的问题,以帮助我们更好的改进本产品. 我们会尽快修复找到 ...
- mysql 版本bug
mysql命令gruop by报错this is incompatible with sql_mode=only_full_group_by 在mysql 工具 搜索或者插入数据时报下面错误: ERR ...
- chrome 49 版本bug: flex父元素设置flex:1 , 子元素用height:100%无法充满父元素
1 <div class="container"> <div class="item"> <div class="ite ...
- TextInputLayout低版本bug :“android.view.InflateException: Binary XML file line #6 : Error inflating class Textview”
开发中用到TextInputLayout配合TextInputEdittext做输入框,在android7.0 android8.0手机上运行正常,在异步android5.0.2的手机上,点击输入框就 ...
- eWebEditor不支持IE7以上版本Bug修改
修改: \Include\Editor.js //把此行 if (element.YUSERONCLICK) eval(element.YUSERONCLICK + "anonymous() ...
- SevenZip.pas BUG修改版 - 20160613
原始版本: Henri Gourvest <hgourvest@gmail.com> 1.2版本 BUG修改: 1.对于文件名中带有空格的文件, 无法压缩, 原因是1488行, 压缩调用的 ...
- 如何通过热修复,搞定开发中的那些 Bug?
作为程序员,Bug 修复终究是绕不开的话题,本期移动开发精英俱乐部讨论的主题便是 Bug 修复中的 Hotfix,即热修复.接下来让我们跟随大牛的脚步来了解 Hotfix,就算你不能一下豁然开朗,相信 ...
随机推荐
- GSM07.10协议中串口复用的注意事项
DLCI:0通道(地址域中DLCI==0)是控制通道,用来传输管理信息.逻辑通道的建立和关闭,睡眠模式的启动和唤醒,流量控制等控制信息都是用该通道. DLCI:1~n通道是逻辑通道,用来传输用户数据. ...
- set使用方法
set 添加一个无序的,用set方法,访问速度快,天生解决了重复问题 1.difference 指定某个元素从原来set取出,并生成新的set #difference a = set(["a ...
- WebView-存在的内存泄漏
0. Notice - earlier version 要使用WebView不造成内存泄漏,首先应该做的就是不能在xml中定义webview节点,而是在需要的时候动态生成.即:可以在使用WebView ...
- [转]大数据时代,python竟是最好的语言?
随着大数据疯狂的浪潮,新生代的工具Python得到了前所未有的爆发.简洁.开源是这款工具吸引了众多粉丝的原因.目前Python最热的领域,非数据分析和挖掘莫属了.从以Pandas为代表的数据分析领 ...
- 我的Hcharts的页面应用
<!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="utf-8& ...
- firefox插件HTTP-Tool的使用方法
2016年11月3日 14:32:01 星期四 chrome 有postman很强大 我比较懒, 不想FQ, 经常用firefox, 试了几款模拟post请求的插件, 觉得http-tool挺简洁的 ...
- 用GitHub Pages搭了个静态博客
经过周末两天折腾,终于在GitHub Pages上用Hugo搭了个静态博客. 链接:https://xusiwei.github.io/ @ruanyf 曾经在博客里提到过"喜欢写Blog的 ...
- POJ 2823 Sliding Window 线段树区间求和问题
题目链接 线段树区间求和问题,维护一个最大值一个最小值即可,线段树要用C++交才能过. 注意这道题不是求三个数的最大值最小值,是求k个的. 本题数据量较大,不能用N建树,用n建树. 还有一种做法是单调 ...
- WEB 用户指南 -- WEB 系统结构文档
本文描述了如何使用 WEB语言 编程.同时还包含了 WEAVE 和 TANGLE 程序的说明文档. WEB 程序 可以读取 WEB 文件,然后输出 TeX 文档 和 Pascal 程序. 使用 WEB ...
- PEtools
// PETools.cpp : Defines the entry point for the console application.// #include "stdafx.h" ...