以yarn-client方式提交spark任务，任务一直卡在ACCEPTED状态

问题背景

spark是以客户端的方式安装的，并没有启动spark的mesos集群，这时候的spark就相当与hive客户端。

以local模型和yarn-cluster方式提交任务，都能正确额执行，但是一yarn-client方式就卡在ACCEPTED

问题原因

在网上查了资料，都说是资源不够用，需要调整yarn.scheduler.capacity.maximum-am-resource-percent从0.1改成0.5，但是我测试数据才几k，集群内存128G，所以我直接排除了这个原因

后来想到，只有yarn-client方式失败，那问题应该出来driver端。就查看了一下服务器的/etc/hosts，发现diver上有集群其他节点的IP等信息，但是其他节点没有driver配置信息

导致driver能访问到集群，但是集群其他节点访问不了driver

所以local模式可以执行

yarn-cluster上可以执行，是因为客户端只要把任务提交到yarn上，客户端就没有用了。

但是yarn-client方式，客户端是充当了driver，driver需要一直和集群有通信，所以接收不到resouceManager的反馈。任务就一直卡住了

解决办法：

有两个方法：

    1、在命令后面加上一个--conf spark.driver.host=$your_ip_address，后面直接填客户端机器的IP地址就行

spark-submit \

       --master yarn \

       --deploy-mode client \

       --num-executors 2 \

       --executor-memory 1G \

       --executor-cores 1 \

       --conf spark.driver.host=192.168.72.129\

        dmp_broadcast_data_day.py

    2、在集群其他节点上都把driver服务器的IP加上去。

以yarn-client方式提交spark任务，任务一直卡在ACCEPTED状态的更多相关文章

windows平台使用spark-submit以client方式提交spark应用到standalone集群
1.spark应用打包,我喜欢打带依赖的,这样省事. 2.使用spark-submit.bat 提交应用,代码如下: for /f "tokens=1,2 delims==" %% ...
spark跑YARN模式或Client模式提交任务不成功（application state: ACCEPTED）
不多说,直接上干货! 问题详情电脑8G,目前搭建3节点的spark集群,采用YARN模式. master分配2G,slave1分配1G,slave2分配1G.(在安装虚拟机时) export SPA ...
spark跑YARN模式或Client模式提交任务不成功（application state: ACCEPTED）(转)
不多说,直接上干货! 问题详情电脑8G,目前搭建3节点的spark集群,采用YARN模式. master分配2G,slave1分配1G,slave2分配1G.(在安装虚拟机时) export SPA ...
利用SparkLauncher 类以JAVA API 编程的方式提交Spark job
一.环境说明和使用软件的版本说明: hadoop-version:hadoop-2.9.0.tar.gz spark-version:spark-2.2.0-bin-hadoop2.7.tgz jav ...
Spark2.x（五十九）：yarn-cluster模式提交Spark任务，如何关闭client进程?
问题: 最近现场反馈采用yarn-cluster方式提交spark application后,在提交节点机上依然会存在一个yarn的client进程不关闭,又由于spark application都是 ...
spark使用idea以client模式提交应用到standalone集群
使用idea以client方式提交代码到standalone集群非常简单. 1.首先有一个部署好且已经启动的standalone集群 --------------------------------- ...
理解Spark运行模式（一）(Yarn Client)
Spark运行模式有Local,STANDALONE,YARN,MESOS,KUBERNETES这5种,其中最为常见的是YARN运行模式,它又可分为Client模式和Cluster模式.这里以Spar ...
提交Spark作业遇到的NoSuchMethodError问题总结
测试应用说明测试的Spark应用实现了同步hive表到kafka的功能.具体处理流程: 从 ETCD 获取 SQL 语句和 Kafka 配置信息使用 SparkSQL 读取 Hive 数据表把 ...
livy提交spark应用
spark-submit的使用shell时时灵活性较低,livy作为spark提交的一种工具,是使用接口或者java客户端的方式提交,可以集成到web应用中 1.客户端提交的方式 http://l ...

随机推荐

年轻人的第一个自定义 Spring Boot Starter！
陆陆续续,零零散散,栈长已经写了几十篇 Spring Boot 系列文章了,其中有介绍到 Spring Boot Starters 启动器,使用的.介绍的都是第三方的 Starters ,那如何开发一 ...
js截取get参数乱码问题之解决
举个例子说一下: http://wwww.yctech.com/blog/post?id=1 像这样的话,通常通过如下代码直接截取不用做任何处理: function getQueryString(na ...
c++笔试题已迁移完成
转载 1.C和C++的特点与区别? 答:(1)C语言特点:1.作为一种面向过程的结构化语言,易于调试和维护: 2.表现能力和处理能力极强,可以直接访问内存的物理地址: 3.C语言实现了对硬件的编程操作 ...
基于cesium的GIS洪水淹没三维模拟系统
简介: “FloodFreeth3D”是一款对Mike11软件计算的洪水演进结果使用cesium进行淹没演进三维模拟的软件产品. 技术参数: 1. B/S架构,支持多Web浏览器(ie.chrom ...
【JavaScript】JavaScript中的ActiveXObject对象
JavaScript中ActiveXObject对象是启用并返回 Automation 对象的引用. 使用方法: newObj = new ActiveXObject( servername.t ...
批量实现ssh免密登录
本节索引场景分析 ssh免密登录 pssh工具批量管理 SHELL自动化脚本本篇总结场景分析作为一个运维工程师,不是每个人工作的环境都想阿里.腾讯那样,动不动就上亿的PV量,上万台服务器.我们 ...
WebDataBinder 学习顺序
01. 关于Spring属性处理器PropertyResolver以及应用运行环境Environment的深度分析,强大的StringValueResolver使用和解析[享学Spring] http ...
SpringCloud 微服务中 @Async 注解自定义线程池引发的aop 问题
背景在使用springCloud 的@Async注解来做异步操作时,想自定义其线程池. 引发问题自定义完线程池后,发现代码里并没有使用自定义线程池里的线程,于是新建一个demo工程,一样的配置代 ...
014-交互式Shell和shell脚本获取进程 pid
Linux 的交互式 Shell 与 Shell 脚本存在一定的差异,主要是由于后者存在一个独立的运行进程 1.交互式 Bash Shell 获取进程 pid 在已知进程名(name)的前提下,交互式 ...
allure与junit结合生成漂亮的demo
1.allure安装环境配置可参考https://blog.csdn.net/huggh/article/details/90905845,且博客中也分享了官网的案例https://github.c ...

以yarn-client方式提交spark任务，任务一直卡在ACCEPTED状态

问题背景

问题原因

解决办法：

以yarn-client方式提交spark任务，任务一直卡在ACCEPTED状态的更多相关文章

随机推荐

热门专题