spark on yarn安装

网上关于spark的安装说明很多了，这里就以spark pre-build with user provided hadoop 安装包为例讲解，

下载spark pre-build with user provided hadoop，这里版本为2.1.0

假设集群节点为

192.168.1.12（slave1）

192.168.1.13（slave2）

192.168.1.14（master）

假设这三个节点均实现ssh免密码登陆。

在master节点上，解压安装包，然后进入目录

cd spark-2.1./conf

复制两个文件

cp spark-env.sh.template spark-env.sh

cp slaves.template slaves

salves文件中添加如下两行

slave1

slave2

spark-env.sh文件添加如下

export JAVA_HOME=/usr/java/default

export SCALA_HOME=/usr/local/scala-2.12.

export SPARK_MASTER_IP=192.168.1.14

export HADOOP_HOME=/root/hadoop-2.8.

export HADOOP_CONF_DIR=/root/hadoop-2.8./etc/hadoop

SPARK_DIST_CLASSPATH=$(/root/hadoop-2.8./bin/hadoop classpath)

export SPARK_DIST_CLASSPATH=$SPARK_DIST_CLASSPATH:/root/hadoop-2.8./share/hadoop/tools/lib/*

注意，最后两行的设置是因为这里使用的是user provided hadoop，所有需要指定classpath，否则运行spark报错，参见这里

将spark-2.1.0文件夹复制到slave1和slave2上相同的目录下

设置/etc/hosts

192.168.1.12 slave1

192.168.1.13 slave2

192.168.1.14 master

如果不设置hosts文件，而在conf/slaves中使用节点IP，那么运行 ./sbin/start-all.sh时，将看不到worker节点，而需要手动将slave（worker）连接master，具体操作为：

如果spark集群web管理页面无法显示worker，则可以分别在每个worker节点上执行

[root@slave2 home]# spark/sbin/start-slave.sh spark://<master ip>:7077

设置/etc/profile

export JAVA_HOME=/..

export SCALA_HOME=/..

export SPARK_HOME=/..

PATH=$PATH:$SCALA_HOME/bin:$SPARK_HOME/bin

export PATH

设置完毕，启动spark

./sbin/start-all.sh

spark on yarn安装的更多相关文章

Ubuntu 14.10 下Spark on yarn安装
1 服务器分布服务器说明 192.168.1.100 NameNode 192.168.1.101 DataNode 192.168.1.102 DataNode 2 软件环境 2.1 安装JDK ...
spark on yarn 安装笔记
yarn版本:hadoop2.7.0 spark版本:spark1.4.0 0.前期环境准备: jdk 1.8.0_45 hadoop2.7.0 Apache Maven 3.3.3 1.编译spar ...
Spark on YARN模式的安装（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推荐）
说白了 Spark on YARN模式的安装,它是非常的简单,只需要下载编译好Spark安装包,在一台带有Hadoop YARN客户端的的机器上运行即可. Spark on YARN简介与运行wor ...
CDH5.5.1 安装Spark ON Yarn环境
CDH对我们已经封装了,我们如果需要Spark on Yarn,只需要yum安装几个包就可以了. 前面的文章我有写过如果搭建自己内网的CDH Yum服务器,请参考<CDH 5.5.1 Yum源服 ...
cdh 上安装spark on yarn
在cdh 上安装spark on yarn 还是比较简单的,不需要独立安装什么模块或者组件. 安装服务选择on yarn 模式:上面 Spark 在spark 服务中添加在yarn 服务中添加 g ...
Spark on YARN的部署
Spark on YARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop HDFS并且运行在yarn上,然后就可以开始部署spark on ...
spark 源码安装
clone 源码 git clone git://github.com/apache/spark.git maven编译源码国外镜像比较慢,此处修改maven仓库的镜像为阿里云镜像: <mir ...
Spark on Yarn
Spark on Yarn 1. Spark on Yarn模式优点与其他计算框架共享集群资源(eg.Spark框架与MapReduce框架同时运行,如果不用Yarn进行资源分配,MapReduce ...
Spark on Yarn遇到的问题及解决思路
原文:http://www.aboutyun.com/thread-9425-1-1.html 问题导读1.Connection Refused可能原因是什么?2.如何判断内存溢出,该如何解决?扩展: ...

随机推荐

Equalizing by Division
The only difference between easy and hard versions is the number of elements in the array. You are g ...
Centos安装docker+vulhub搭建
嫌弃平常因为复现搭建环境所带来的麻烦,所以打算用docker来管理搭建靶机准备一个纯净的Centos系统虚拟机安装,这里已经安装好了就不演示怎么在虚拟机安装安装Docker最基本的要求是Linux ...
[腾讯云]简单在腾讯云 CenTOS7.0 安装Nginx，Mysql(MariaDB),Memcache，解析PHP!
1.安装LNMP之前要安装EPEL,以便安装源以外的软件,如Nginx,phpMyAdmin等. yum install epel-release 2.安装Nginx a) yum install n ...
理解java容器底层原理--手动实现HashSet
HashSet的底层其实就是HashMap,换句话说HashSet就是简化版的HashMap. 直接上代码: package com.xzlf.collection2; import java.uti ...
Python爬取全球疫情数据，实现可视化显示地图数据（附代码）
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 武汉地区,目前已经实现住院患者清零了,国内疫情已经稳定,然而中国以外新冠确 ...
Linux 高 wio 分析
High IO wait Table of Contents 1. 现象 2. 分析 2.1. iotop或者pidstat 2.1.1. iotop 2.1.2. pidstat 2.2. 脚本 2 ...
一，连接Oracle 一
连接Oracle数据库方法: 一,使用sqlplus连接二,使用第三方软件连接 sqlplus sqlplus 工具简介 (1).概述:sqlplus是在Linux下操作oracle的工具 (2). ...
Spring5参考指南:AOP代理
文章目录 AOP代理 AOP Proxies原理 AOP代理通常来说Spring AOP有两种代理方式,一种默认的JDK代理,只能代理接口,一种是CGLIB代理,可以代理具体的类对象. Spring ...
SpringBoot应用操作Rabbitmq（topic交换器高级操作）
一.topic交换器为主题交换器,可以根据路由key模糊匹配实现模型图二.实战 1.引入maven <dependency> <groupId>org.springfram ...
js 运动函数篇(二) （加速度运动、弹性运动、重力场运动（多方向+碰撞检测+重力加速度+能量损失运动）拖拽运动）层层深入
前言: 本人纯小白一个,有很多地方理解的没有各位大牛那么透彻,如有错误,请各位大牛指出斧正!小弟感激不尽. 本篇文章为您分析一下原生JS写加速度运动.弹性运动.重力场运 ...

spark on yarn安装

spark on yarn安装的更多相关文章

随机推荐

热门专题