Spark history server 遇到的一些问题

最近学习Spark，看了一个视频，里面有提到启动spark后，一般都会启动Spark History Server。视频里把 spark.history.fs.logDirectory 设置成了Hadoop上一个目录。配置的是hdfs://ubuntu1:9000/spark 啥的。我原来搭建的Hadoop是HA的，肯定不能这么写。我心血来潮，把hadoop HA改回了集群模式。这下可好，恶梦开始。启动Spark History Server，报连不上hadoop，但是我在浏览器中是能打开的。开始怀疑是Spark哪里配置错了，搞了半天，还是连接hadoop时报connection refuse。刚开始学Spark，对它也不熟，所以索性就从简单点的开始。从最简单local模式开始。这种模式下，程序运行完，就什么都看不到了，需要启动Spark History Server，这样就能查看运行完的程序的信息了。只是Spark History Server还是一直连不上hadoop。郁闷至极，后来才发现我也HA Hadoop改成集群时，在core-site.xml 中配置如下，NNDX，没有加9000端口号！！！

<property>
                <name>fs.defaultFS</name>
                <value>hdfs://ubuntu1</value>
        </property>

加上端口号后，发现Spark History Server能连上Hadoop了，真TMD高兴。可是跑完一个程序后，在Spark History Server的UI界面上还是没有信息。搞了半天，才发现datanode没有启动起来。清了一遍namenode和datanode的目录，又格式化了一下namenode。Hadoop终于是正确地跑起来了。

崩溃了，Spark History Server的UI界面上，还是啥都没有。又是半天，才发现是 spark.history.fs.logDirectory 配置错了，应该和 spark.eventLog.dir 配置成同一个目录的，我当时犯贱了一下，没有配成同一个目录。改成同一个目录后，终于把问题解决了。

虽然走了不少弯路，但是在解决问题的过程中，学到了蛮多东西的。

Spark history server 遇到的一些问题的更多相关文章

Spark History Server配置使用
Spark history Server产生背景以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该WEB ...
Spark学习笔记-使用Spark History Server
在运行Spark应用程序的时候,driver会提供一个webUI给出应用程序的运行信息,但是该webUI随着应用程序的完成而关闭端口,也就是说,Spark应用程序运行完后,将无法查看应用程序的历史记 ...
Spark History Server产生背景
以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该WEBUI随着Application的完成(成功/失败) ...
Spark集群之Spark history server额外配置
Note: driver在SparkContext使用stop()方法后才将完整的信息提交到指定的目录,如果不使用stop()方法,即使在指定目录中产生该应用程序的目录,history server ...
Spark history Server配置实用
Spark history Server产生背景以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息:但该WEB ...
spark history server
参考:http://blog.csdn.net/lsshlsw/article/details/44786575 为什么需要historyServer? 在运行Spark Application的时候 ...
【转】Spark History Server 架构原理介绍
[From]https://blog.csdn.net/u013332124/article/details/88350345 Spark History Server 是spark内置的一个http ...
Spark 学习笔记之 Spark history Server 搭建
在hdfs上建立文件夹/directory hadoop fs -mkdir /directory 进入conf目录 spark-env.sh 增加以下配置 export SPARK_HISTORY ...
一次解决spark history server日志不见
通过cloudera的旧版VM(centos6版本)跑spark,之后,想看一下日志研究一下job,stage以及task,压力很大的发现完全没有日志,180088页面打开后: Event log d ...

随机推荐

CUDA：流
1. 页锁定主机内存 c库函数malloc()分配标准的,可分页(Pagable)的内存,cudaHostAlloc()分配页锁定的主机内存.页锁定内存也称为固定内存(Pinned Memory)或者 ...
近200篇机器学习&深度学习资料分享【转载】
编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Le ...
BMP文件解析【转】
本文转载自:http://blog.csdn.net/Blues1021/article/details/44954817 BMP文件通常是不压缩的,所以它们通常比同一幅图像的压缩图像文件格式要大很多 ...
算法（Algorithms）第4版练习 1.3.12
方法实现: package com.qiusongde; import java.util.Iterator; import java.util.NoSuchElementException; imp ...
win8+sdk8+vs2012+freeglut+glew开发opengl
写给想要学习opengl的同学们. 刚开始学习opengl的时候,对于整个环境的搭建以及一些概念不太清晰,网上的资料又比较凌乱,因此在此总结一下,方便大家. 首先,是有一个windows系统,我用的是 ...
高并发压力下导致数据库bug
环境信息: linux 6.1 + oracle11.2.0.3 RAC 问题现象: 学校晚上6点选课,人数大概有3000,7点时,数据库报错如下(数据库到6点多还是可以连接的),数据库hu ...
如何用js获取日期（转载）
本文介绍了js获取日期的方法,可以获取前天.昨天.今天.明天.后天. 代码: <html> <head> <meta http-equiv="Content-T ...
not in和not exist的区别（转）
in和exists in 是把外表和内表作hash 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询.一直以来认为exists比in效率高的说法是不准确的. 如果查询的两个 ...
PHP实现简单爬虫-抓取网页url
<?php /** * 爬虫程序 -- 原型 * * 从给定的url获取html内容 * * @param string $url * @return string */ function _g ...
Linux 中安装软件报缺少共享库文件的错误
linux 安装一些如软件或者相关的模块时,经常报出缺少一些依赖包的 libxxx.so等的共享库文件首先找到该共享库文件然后查看/etc/ld.so.conf 这个文件记录了编译时使用的动态 ...

Spark history server 遇到的一些问题

Spark history server 遇到的一些问题的更多相关文章

随机推荐

热门专题