Hadoop、Spark 集群环境搭建问题汇总

那一剑的風情 2024-11-02 08:59:59 原文

Hadoop

问题1：

　　Hadoop Slave节点 NodeManager 无法启动

解决方法：

　　yarn-site.xml

　　reducer取数据的方式是mapreduce_shuffle

　　

问题2：

　　启动hadoop，报错Error JAVA_HOME is not set and could not be found

解决方法：

　　因为JAVA_HOME环境没配置正确，还有一种情况是即使各结点都正确地配置了JAVA_HOME，但在集群环境下还是报该错误。

　　解决方法是在 hadoop-env.sh中显示地重新声明一遍JAVA_HOME。

问题3：

　　hadoop 执行start-dfs.sh后，datenode没有启动

解决方法：

　　上网查了下，有些文章说的解决办法是删掉数据文件，格式化，重启集群，但这办法实在太暴力，根本无法在生产环境实施，所以还是参考另一类文章的解决办法，修改clusterID：
　　step1：
　　　　查看hdfs-site.xml，找到存namenode元数据和datanode元数据的路径：
　　step2：
　　　　打开namenode路径下的current/VERSION文件

　　　　打开datanode路径下的current/VERSION文件

　　step3：

　　　　将data节点的 clusterID 修改成和 name 节点的 clusterID 一致，重启集群即可。

Spark

问题1：

　　Spark 集群启动后，Slave节点 Worker 进程一段时间后自动结束

解决方法：

　　修改各节点 /etc/hostname 文件中的主机名:

　　

　　与 /etc/sysconfig/network 中的主机名保持一致。

　　

　　重启机器。

问题2：

　　Spark只启动了Master，Worker没启动

解决方法：

　　各节点 /home/hadoop/spark-2.2.1/conf/ spark-env.sh 中的 SPARK_LOCAL_IP 改为该节点自己的 IP。

　　

问题3：

　　Spark集群启动后，Slave节点上有Worker进程，但打开webui，Workers列表却只显示有Master节点

　　

解决方法：

　　关闭机器的防火墙

　　CentOS 7 默认采用新防火墙firewall，不再用iptables（service iptables status 查看防火墙状态，chkconfig iptables off 关闭防火墙）

systemctl stop firewalld.service 　　　 #停止firewall

systemctl disable firewalld.service 　　#禁止firewall开机启动

firewall-cmd --state　　　　　　　　   #查看默认防火墙状态（关闭后显示notrunning，开启后显示running）

　　

问题4：

　　Spark shell退出操作以及出现问题的解决方法

解决方法：

　　退出的正确操作是：

:quit

　　

Hadoop、Spark 集群环境搭建问题汇总的更多相关文章

Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...
Spark集群环境搭建——Hadoop集群环境搭建
Spark其实是Hadoop生态圈的一部分,需要用到Hadoop的HDFS.YARN等组件. 为了方便我们的使用,Spark官方已经为我们将Hadoop与scala组件集成到spark里的安装包,解压 ...
Spark 集群环境搭建
思路: ①先在主机s0上安装Scala和Spark,然后复制到其它两台主机s1.s2 ②分别配置三台主机环境变量,并使用source命令使之立即生效主机映射信息如下: 192.168.32.100 ...
Spark集群环境搭建——部署Spark集群
在前面我们已经准备了三台服务器,并做好初始化,配置好jdk与免密登录等.并且已经安装好了hadoop集群. 如果还没有配置好的,参考我前面两篇博客: Spark集群环境搭建--服务器环境初始化:htt ...
Spark集群环境搭建——服务器环境初始化
Spark也是属于Hadoop生态圈的一部分,需要用到Hadoop框架里的HDFS存储和YARN调度,可以用Spark来替换MR做分布式计算引擎. 接下来,讲解一下spark集群环境的搭建部署. 一. ...
Hadoop、Spark 集群环境搭建
1.基础环境搭建 1.1运行环境说明 1.1.1硬软件环境主机操作系统:Windows 64位,四核8线程,主频3.2G,8G内存虚拟软件:VMware Workstation Pro 虚拟机操作 ...
Hadoop,HBase集群环境搭建的问题集锦(四)
21.Schema.xml和solrconfig.xml配置文件里參数说明: 參考资料:http://www.hipony.com/post-610.html 22.执行时报错: 23., /comm ...
hadoop分布式集群环境搭建
参考 http://www.cnblogs.com/zhijianliutang/p/5736103.html 1 wget http://mirrors.shu.edu.cn/apache/hado ...
Hadoop,HBase集群环境搭建的问题集锦(二)
10.艾玛, Datanode也启动不了了? 找到log: Caused by: java.net.UnknownHostException: Invalid host name: local hos ...

随机推荐

[AMPPZ2014]Jaskinia
[AMPPZ2014]Jaskinia 题目大意: 一个\(n(n\le3\times10^5)\)的树,\(m(m\le3\times10^5)\)个约束条件\((a_i,b_i,d_i)\).请你 ...
C++程序设计方法2：基本语法
初始化列表 int a[] = {1,2,3}; int a[]{1,2,3} 以上两个式子等价 int a = 3+5: int a = {3+5}; int a(3+5); int a{3+5}; ...
Flask 三方组件 Flask-Session
使用 from flask import session, Flask from flask_session import Session from redis import Redis app = ...
Yii2 数据搜索类 PostSearch
数据搜索类 PostSearch /** * @Purpose : 添加 authorName 属性,使属性和搜索表单相对应 * @return array */ public function at ...
day3字典_字符串_文件操作
一.知识回顾 1.jmeter怎样增加压力机:在主控机配置文件 jmeter.perperties 文件中添加对应压力的IP和对应端口,多台压力机IP用","隔开,保证所有负载机和 ...
JS_高程5.引用类型（6）Array类型的位置方法，迭代方法，归并方法
一.位置方法 ECMAScript5为数组实例添加了两个位置:indexOf()和 lastIndexOf().这两个方法接收两个参数:要查找的项和(可选的)表示查找起点位置的索引(如在数组[7,8, ...
PHP01
1.服务端开发基础前端开发最终还是属于web端开发的一个分支,想要成为前端程序员,就要充分理解web的概念. 网站的概念: 可以在浏览器上通过一个地址直接访问使用用于提供一种或多种特定服务的一系列 ...
使用Spring AOP实现MySQL读写分离
spring aop , mysql 主从配置实现读写分离,下来把自己的配置过程,以及遇到的问题记录下来,方便下次操作,也希望给一些朋友带来帮助.mysql主从配置参看:http://blog.cs ...
JavaScript 中回调地狱的今生前世
1. 讲个笑话 JavaScript 是一门编程语言 2. 异步编程 JavaScript 由于某种原因是被设计为单线程的,同时由于 JavaScript 在设计之初是用于浏览器的 GUI 编程,这也 ...
手把手教你制作微信小程序，开源、免费、快速搞定
最近做了个"罗孚传车"的小程序一时兴起,做了一个小程序,将个人收集的同汽车相关的行业资讯和学习资料,分享到小程序中,既作为历史资料保存,又提供给更多的人学习和了解,还能装一下:) ...