【原创】大叔经验分享（19）spark on yarn提交任务之后执行进度总是10%

spark 2.1.1

系统中希望监控spark on yarn任务的执行进度，但是监控过程发现提交任务之后执行进度总是10%，直到执行成功或者失败，进度会突然变为100%，很神奇，

下面看spark on yarn任务提交过程：

spark on yarn提交任务时会把mainClass修改为Client

childMainClass = "org.apache.spark.deploy.yarn.Client"

spark-submit过程详见：https://www.cnblogs.com/barneywill/p/9820684.html

下面看Client执行过程：

org.apache.spark.deploy.yarn.Client

  def main(argStrings: Array[String]) {

...

    val sparkConf = new SparkConf

    // SparkSubmit would use yarn cache to distribute files & jars in yarn mode,

    // so remove them from sparkConf here for yarn mode.

    sparkConf.remove("spark.jars")

    sparkConf.remove("spark.files")

    val args = new ClientArguments(argStrings)

    new Client(args, sparkConf).run()

...

  def run(): Unit = {

    this.appId = submitApplication()

...

  def submitApplication(): ApplicationId = {

...

      val containerContext = createContainerLaunchContext(newAppResponse)

...

  private def createContainerLaunchContext(newAppResponse: GetNewApplicationResponse)

    : ContainerLaunchContext = {

...

    val amClass =

      if (isClusterMode) {

        Utils.classForName("org.apache.spark.deploy.yarn.ApplicationMaster").getName

      } else {

        Utils.classForName("org.apache.spark.deploy.yarn.ExecutorLauncher").getName

      }

这里调用过程为Client.main->run->submitApplication->createContainerLaunchContext，然后会设置amClass，最终都会调用到ApplicationMaster，因为ExecutorLauncher内部也是调用ApplicationMaster，如下：

org.apache.spark.deploy.yarn.ExecutorLauncher

object ExecutorLauncher {

  def main(args: Array[String]): Unit = {

    ApplicationMaster.main(args)

  }

}

下面看ApplicationMaster：

org.apache.spark.deploy.yarn.ApplicationMaster

  def main(args: Array[String]): Unit = {

...

    SparkHadoopUtil.get.runAsSparkUser { () =>

      master = new ApplicationMaster(amArgs, new YarnRMClient)

      System.exit(master.run())

    }

...

  final def run(): Int = {

...

      if (isClusterMode) {

        runDriver(securityMgr)

      } else {

        runExecutorLauncher(securityMgr)

      }

...

  private def registerAM(

      _sparkConf: SparkConf,

      _rpcEnv: RpcEnv,

      driverRef: RpcEndpointRef,

      uiAddress: String,

      securityMgr: SecurityManager) = {

...

    allocator = client.register(driverUrl,

      driverRef,

      yarnConf,

      _sparkConf,

      uiAddress,

      historyAddress,

      securityMgr,

      localResources)

    allocator.allocateResources()

    reporterThread = launchReporterThread()

...

  private def launchReporterThread(): Thread = {

    // The number of failures in a row until Reporter thread give up

    val reporterMaxFailures = sparkConf.get(MAX_REPORTER_THREAD_FAILURES)

    val t = new Thread {

      override def run() {

        var failureCount = 0

        while (!finished) {

          try {

            if (allocator.getNumExecutorsFailed >= maxNumExecutorFailures) {

              finish(FinalApplicationStatus.FAILED,

                ApplicationMaster.EXIT_MAX_EXECUTOR_FAILURES,

                s"Max number of executor failures ($maxNumExecutorFailures) reached")

            } else {

              logDebug("Sending progress")

              allocator.allocateResources()

            }

...

这里调用过程为ApplicationMaster.main->run，run中会调用runDriver或者runExecutorLauncher，最终都会调用到registerAM，其中会调用YarnAllocator.allocateResources，然后在launchReporterThread中会启动一个thread，其中也会不断调用YarnAllocator.allocateResources，下面看YarnAllocator：

org.apache.spark.deploy.yarn.YarnAllocator

  def allocateResources(): Unit = synchronized {

    updateResourceRequests()

    val progressIndicator = 0.1f

    // Poll the ResourceManager. This doubles as a heartbeat if there are no pending container

    // requests.

    val allocateResponse = amClient.allocate(progressIndicator)

可见这里会设置进度为0.1，即10%，而且是硬编码，所以spark on yarn的执行进度一直为10%，所以想监控spark on yarn的任务进度看来是徒劳的；

【原创】大叔经验分享（19）spark on yarn提交任务之后执行进度总是10%的更多相关文章

【原创】大叔经验分享（21）yarn中查看每个应用实时占用的内存和cpu资源
在yarn中的application详情页面 http://resourcemanager/cluster/app/$applicationId 或者通过application命令 yarn appl ...
【原创】大叔经验分享（5）oozie提交spark任务如何添加依赖
spark任务添加依赖的方式: 1 如果是local方式运行,可以通过--jars来添加依赖: 2 如果是yarn方式运行,可以通过spark.yarn.jars来添加依赖: 这两种方式在oozie上 ...
【原创】大叔经验分享（47）yarn开启日志归集
yarn开启日志归集功能,除了配置之外 yarn.log-aggregation-enable=true 还要检查/tmp/logs目录是否存在以及权限,尤其是在开启kerberos之后,有些目录可能 ...
【原创】大叔经验分享（9）yarn重要配置yarn.nodemanager.local-dirs
yarn中有一个比较重要的配置yarn.nodemanager.local-dirs,如果配置的不好,在饱和状态运行下集群会出现很多问题:1 默认配置${hadoop.tmp.dir}/nm-loca ...
【原创】大叔经验分享（4）Yarn ResourceManager页面如何实现主被自动切换
hdfs.yarn.hbase这些组件的master支持多个,实现自动主备切换,其中hdfs.hbase无论访问主master或者备master都可以正常访问页面,但是yarn比较特别,只有主mast ...
【原创】大叔经验分享（46）用户提交任务到yarn报错
用户提交任务到yarn时有可能遇到下面的错误: 1) Requested user anything is not whitelisted and has id 980,which is below ...
【原创】大叔经验分享（48）oozie中通过shell执行impala
oozie中通过shell执行impala,脚本如下: $ cat test_impala.sh #!/bin/sh /usr/bin/kinit -kt /tmp/impala.keytab imp ...
【原创】经验分享：一个小小emoji尽然牵扯出来这么多东西？
前言之前也分享过很多工作中踩坑的经验: 一个线上问题的思考:Eureka注册中心集群如何实现客户端请求负载及故障转移? [原创]经验分享:一个Content-Length引发的血案(almost.. ...
spark利用yarn提交任务报:YARN application has exited unexpectedly with state UNDEFINED
spark用yarn提交任务会报ERROR cluster.YarnClientSchedulerBackend: YARN application has exited unexpectedly w ...

随机推荐

mybatis的where和if标签配合使用
where标签用于简化sql的书写,if标签用于判断.大概的使用如下 <select id="getCountByPageInfo" parameterType=" ...
linux系统安装redis
redis的下载安装教程 1.进入到linux指定目录中 cd /usr/local 路径看你自己情况 2.下载redis,执行如下命令: wget http://download.re ...
第二部分之RDB持久化(第十章)
RDB持久化功能所生成的RDB文件是一个经过压缩的二进制文件,通过该文件可以还原生成RDB文件时的数据库状态.(数据库状态:服务器中的非空数据库以及它们的键值对统称为数据库状态) 一.RDB文件的创建 ...
使用Crowd集成Confluence与JIRA
一. 独立安装Crowd,步骤1-步骤13的内容二. 设置Confluence使用Crowd进行认证.步骤14-18的内容三. 设置JIRA使用Crowd进行认证,并使用Confluence的组织机构 ...
java的List列表转成Tree（树形）结构列表
直接看借鉴博客:https://blog.csdn.net/massivestars/article/details/53911620/ 由于我的业务没有父子级id两个字段,只有一个层级id字段来分层 ...
Linux(Ubuntu)使用日记(三)------git安装使用
1. 安装首先,确认你的系统是否已安装git,可以通过git指令进行查看,如果没有,在命令行模式下输入sudo apt-get install git命令进行安装. 2. 配置 git confi ...
爬虫系列之mongodb
mongo简介 MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案. MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非 ...
读取Excel2003、Excel2007或更高级的兼容性问题 workbook 下载中文名称文件
xls 使用HSSFWorkbook xlsx使用XSSFWorkbook 但是我使用XSSFWorkbook时没找到nuget包,引用不了,只能重新找办法,幸好workbook解决了我这个问题 // ...
React Native——react-navigation的使用
在 React Native 中,官方已经推荐使用 react-navigation 来实现各个界面的跳转和不同板块的切换. react-navigation 主要包括三个组件: StackNavig ...
解决类似umount target is busy挂载盘卸载不掉问题
问题描述: Linux下挂载后的分区或者磁盘某些时候需要umount的时候出现类似“umount: /mnt: target is busy.”等字样,或者“umount: /xxx: device ...

【原创】大叔经验分享（19）spark on yarn提交任务之后执行进度总是10%

【原创】大叔经验分享（19）spark on yarn提交任务之后执行进度总是10%的更多相关文章

随机推荐

热门专题