监控Spark Application的运行

官方文档: http://spark.apache.org/docs/latest/monitoring.html

1.1 监控方式

Driver Programme WEB UI (Port: 4040)

* 每一个driver program (更具体的说应该是SparkContext) 都会启动1个web UI,  http://<driver-node>:4040
* 通过web ui能够看到这个特定的Spark Application的如下内容,如果1台机器上运行了多个SparkContext,那么端口将从4040持续增长(4040/4041/4042...)
  - stages,tasks
  - summary of RDD size and memeory usage
  - 环境信息
  - running executor的信息
【注意】默认情况下Driver Programme WEB UI只能在Application运行期间提供服务

Spark UI (Port:8080)

集群模式下运行的Spark,Master节点(cluster manager)会启动一个Spark UI,用于监控Spark Application的各个阶段, http://<master>:8080

Standalone模式提交的Application
* Standalone模式的cluster manager(Spark Master节点上运行)会启动一个Web UI,Spark UI(8080),显示正在运行及结束的Spark Application
* Spark UI上的Applicaiton detail会跳转到Driver Program Web UI(4040), 因此Application运行结束后,application detail默认就无法查看

Yarn UI(8088)

yan client,yan clustert提交的Spark Application, 都会在Yarn UI上列出(yarn上运行的application,类型为spark)
区别:
yarn client:     提交Spark Application的终端, 打印详细信息及最终结果,Yarn UI上观测该Application的运行状态
yarn cluster:   提交Spark Application的终端,打印application的提交,运行,结束信息,Yarn UI观测该Application的运行状态,最终结果在worker的stdout日志中打印

1.2  提交方式,监控方式总结

提交模式 提交脚本 监控页面及结果查看
local本地模式提交 # ./bin/run-example SparkPi 10 --master local[2] 

监控: http://本地ip:4040  (Driver program Web UI)

注意:Application运行期间Driver Program Web UI才可用

结果: 提交Application的终端(打印详细信息)

standalone模式提交

# ./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \

监控: http://master ip:8080 (Master节点上的cluster manager启动的web ui)

历史监控:页面会显示standalone模式提交的已完成的application

结果:提交Application的终端(打印详细信息)

yarn-client模式提交

# ./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \

监控: http://ResourceManager:8088 (Yarn RM启动的web ui)

历史监控:页面会显示已完成的application

结果:提交Application的终端(会打印详细信息)

yarn-cluster模式提交

# ./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \

监控: http://ResourceManager:8088 (Yarn RM启动的web ui)

历史监控:页面会显示已完成的application

结果:通过监控页面,跳转到worker node, worker node的stdout日志中打印(终端只打印Application的运行状态,accepted, running,finished)

02_Spark Application不同模式下的监控的更多相关文章

  1. Apache Spark源码走读之19 -- standalone cluster模式下资源的申请与释放

    欢迎转载,转载请注明出处,徽沪一郎. 概要 本文主要讲述在standalone cluster部署模式下,Spark Application在整个运行期间,资源(主要是cpu core和内存)的申请与 ...

  2. spark on yarn模式下内存资源管理(笔记2)

    1.spark 2.2内存占用计算公式 https://blog.csdn.net/lingbo229/article/details/80914283 2.spark on yarn内存分配** 本 ...

  3. spark on yarn模式下内存资源管理(笔记1)

    问题:1. spark中yarn集群资源管理器,container资源容器与集群各节点node,spark应用(application),spark作业(job),阶段(stage),任务(task) ...

  4. flink on yarn模式下两种提交job方式

    yarn集群搭建,参见hadoop 完全分布式集群搭建 通过yarn进行资源管理,flink的任务直接提交到hadoop集群 1.hadoop集群启动,yarn需要运行起来.确保配置HADOOP_HO ...

  5. ART模式下基于Xposed Hook开发脱壳工具

    本文博客地址:http://blog.csdn.net/qq1084283172/article/details/78092365 Dalvik模式下的Android加固技术已经很成熟了,Dalvik ...

  6. 测试Oracle 11gr2 RAC 非归档模式下,offline drop数据文件后的数据库的停止与启动测试全过程

    测试Oracle 11gr2 RAC 非归档模式下,offline drop数据文件后的数据库的停止与启动测试全过程 最近系统出现问题,由于数据库产生的日志量太大无法开启归档模式,导致offline的 ...

  7. Apache Spark技术实战之8:Standalone部署模式下的临时文件清理

    未经本人同意严禁转载,徽沪一郎. 概要 在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文件,这些临时目录和文件又是在什么时候被清理,本文将就这些问题做深入细致的解答. 从 ...

  8. Azure ARM (12) ARM模式下,在负载均衡器上设置多个公网IP地址

    <Windows Azure Platform 系列文章目录> 最近在帮助一个客户设置WAF (Web Application Firewall),WAF厂商要求在负载均衡器上,设置多个公 ...

  9. ASM:《X86汇编语言-从实模式到保护模式》第13章:保护模式下内核的加载,程序的动态加载和执行

    ★PART1:32位保护模式下内核简易模型 1. 内核的结构,功能和加载 每个内核的主引导程序都会有所不同,因为内核都会有不同的结构.有时候主引导程序的一些段和内核段是可以共用的(事实上加载完内核以后 ...

随机推荐

  1. crontab定时任务-干货案例

    自定义需求:实现消息队列. 1.创建一张mysql表结构 2.编写php脚本,便于sh文件执行 3.编写sh脚本,便于crontab定时执行 4.crontab -e 注册定时任务,如果此步不清楚请参 ...

  2. mybatis中获取参数

    1.${parameter}方式: parameter是数字时用:模糊查询%${parameter}%时用. 例:select * from account where userId = ${para ...

  3. keras之save & reload model

    import numpy as np np.random.seed(1337) # for reproducibility from keras.models import Sequential fr ...

  4. shell应用技巧

    Shell 应用技巧 Shell是一个命令解释器,是在内核之上和内核交互的一个层面. Shell有很多种,我们所使用的的带提示符的那种属于/bin/bash,几乎所有的linux系统缺省就是这种she ...

  5. ftp.GetResponse() 无法连接到远程服务器

    最近在做一个ftp上传下载以及在服务器上创建文件夹的工具 报 GetResponse() 无法连接到远程服务器  错误 明明 ip , 账户和 密码 用ftp 工具都能连接上 ,可是 代码就不行了,看 ...

  6. yii2模板

    GridView 小部件在开发中常用的功能及技巧.持续更新中.... 数据网格或者说 GridView 小部件是Yii中最强大的部件之一.它有一个属性名叫 dataProvider ,这个属性能够提供 ...

  7. suiyi

    <?php namespace app\controllers; use Yii;use app\models\Device;use app\models\DeviceSearch;use ap ...

  8. mysql数据安装问题汇总

    1.mysql安装冲突:conflicts with file from package 看到“conflicts”,是产生冲突了,文件“/usr/share/mysql/charsets/*”需要M ...

  9. 程序猿职场心理学,教你三进三出“斩”HR拿offer(跳槽必看)

    摘要: 今天主要涉及到的是 HR 在面试时有哪些套路,这样可以见招拆招,斩获 offer! 今天主要涉及到的是 HR 在面试时有哪些套路,这样可以见招拆招,斩获 offer! 主要包括以下内容: 一. ...

  10. String和StringBuffer和StringBuilder

    String类 Java语言中用String类代表不可变的字符串,它是由任意多个字符组成的序列.程序中需要存储大量的信息时,一般都用String对象. 1.字符串初始化 JavaSE API为字符串对 ...