第一步：安装spark

将官网下载好的spark-2.0.0-bin-hadoop2.6.tgz上传到/usr/spark目录下。这里需注意的是spark和hadoop有对应版本关系

[root@spark1 spark]# chmod u+x spark-2.0.0-bin-hadoop2.6.tgz

[root@spark1 spark]# tar -zxvf spark-2.0.0-bin-hadoop2.6.tgz

[root@spark1 spark]# mv spark-2.0.0-bin-hadoop2.6 spark-2.0 #重命名

[root@spark1 spark-2.0]# vi /etc/profile

export SPARK_HOME=/usr/spark/spark-2.0

export PATH=$SPARK_HOME/bin

export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

[root@spark1 spark-2.0]# source /etc/profile

第二步：修改配置文件

[root@spark1 spark-2.0]# cd conf

[root@spark1 conf]# mv spark-env.sh.template spark-env.sh

[root@spark1 conf]# vi spark-env.sh #增加如下内容

# environment variables

export JAVA_HOME=/usr/java/jdk  #jdk安装目录

export SCALA_HOME=/usr/scala/scala-2.11   #Scala安装目录

export SPARK_MASTER_IP=192.168.220.144 ##spark集群节点的master的ip ，spark1

export SPARK_WORKER_MEMORY=1g  #指定work节点能够最大分配给Excutors的内存大小

export HADOOP_CONF_DIR=/usr/hadoop/hadoop-2.6.0/etc/hadoop #hadoop集群的配置文件目录 

[root@spark1 conf]# mv slaves.template slaves

[root@spark1 conf]# vi slaves #

# A Spark Worker will be started on each of the machines listed below.

spark1 #由于spark比较吃内存，可以不放主节点spark1

spark2

spark3

第三步：在spark2和spark3节点上也安装spark

传spark

[root@spark1 usr]# scp -r /usr/spark/ root@spark2:/usr/

[root@spark1 usr]# scp -r /usr/spark/ root@spark3:/usr/

传配置文件

[root@spark1 ~]# scp /etc/profile root@spark2:/etc/

[root@spark1 ~]# scp /etc/profile root@spark3:/etc/

使配置文件生效

[root@spark2 ~]# source /etc/profile

[root@spark3 ~]# source /etc/profile

[root@spark1 sbin]# start-all.sh #启动spark

[root@spark1 sbin]# jps

5555 ResourceManager

6019 Jps

5651 NodeManager

5351 SecondaryNameNode

5224 DataNode

5134 NameNode

第四步：验证spark以及进入spark-shell

[root@spark1 sbin]# spark-shell #进入spark环境

spark学习7（spark2.0集群搭建）的更多相关文章

spark学习1（hadoop集群搭建）
把原先搭建的集群环境给删除了,自己重新搭建了一次,将笔记整理在这里,方便自己以后查看第一步:安装主节点spark1 第一个节点:centos虚拟机安装,全名spark1,用户名hadoop,密码12 ...
spark学习5（hbase集群搭建）
第一步:Hbase安装 hadoop,zookeeper前面都安装好了将hbase-1.1.3-bin.tar.gz上传到/usr/HBase目录下 [root@spark1 HBase]# chm ...
[spark]-Spark2.x集群搭建与参数详解
在前面的Spark发展历程和基本概念中介绍了Spark的一些基本概念,熟悉了这些基本概念对于集群的搭建是很有必要的.我们可以了解到每个参数配置的作用是什么.这里将详细介绍Spark集群搭建以及xml参 ...
ZooKeeper学习笔记一：集群搭建
作者:Grey 原文地址:ZooKeeper学习笔记一:集群搭建说明单机版的zk安装和运行参考:https://zookeeper.apache.org/doc/r3.6.3/zookeeperS ...
Redis 3.0 集群搭建
Redis 3.0 集群搭建开启两个虚拟机分别在两个虚拟机上开启3个Redis实例 3主3从两个虚拟机里的实例互为主备下面分别在两个虚拟机上安装,网络设置参照codis集群的前两个主机分别关闭 ...
Redis 5.0 集群搭建
Redis 5.0 集群搭建单机版的 Redis 搭建 https://www.jianshu.com/p/b68e68bbd725 /usr/local/目录 mkdir redis-cluste ...
Ubuntu 12.04下Hadoop 2.2.0 集群搭建（原创）
现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机 ...
hadoop2.6.0集群搭建
p.MsoNormal { margin: 0pt; margin-bottom: .0001pt; text-align: justify; font-family: Calibri; font-s ...
centos下hadoop2.6.0集群搭建详细过程
一 .centos集群环境配置 1.创建一个namenode节点,5个datanode节点主机名 IP namenodezsw 192.168.129.158 datanode1zsw 192.16 ...

随机推荐

jquery动态生成html代码绑定事件
今天工作中需要在页面动态生成html代码,但发现新生成的代码的click事件失效了(非动态生成的代码已经绑定了click事件),于是在网上找了很多解决办法,很多都比较复杂,且使用的jquery都比较老 ...
通过创建脚本代替"scrapy crawl Test"命令
文件结构: 1.在命令行scrapy crawl Test正常运行的条件下在项目的根目录创建start.py文件(注意目录,同scrapy.cfg文件一个目录): start.py源代码: # -*- ...
Python菜鸟之路：Django 路由补充1：FBV和CBV - 补充2：url默认参数
一.FBV和CBV 在Python菜鸟之路:Django 路由.模板.Model(ORM)一节中,已经介绍了几种路由的写法及对应关系,那种写法可以称之为FBV: function base view ...
为什么要使用nonlocal
Python3中加入了新的关键字nonlocal,当在一个嵌套的函数中对变量申明为nonlocal时,就明确表示这个变量是外部函数中定义的变量.也许会有这么一个问题:按照python的LEGB原则,在 ...
文件操作 - 三元运算/chardet/文件操作r w/文件的操作方法
Alex:读书可以改变一个人的气质读书:豆瓣: 1年读20本你的问题:想法太多,读书太少书:追风筝的人,白鹿原电影:阿甘正传辛德勒名单---------------------------- ...
rest_framework之魔法类
视图 from rest_framework.viewsets import ViewSetMixin # 注意先后顺序,ViewSetMixin写在前面 class TestAll(ViewSetM ...
我的Android进阶之旅------>解决Error:Unable to find method 'org.gradle.api.internal.project.ProjectInternal.g
错误描述今天在Github上面下载了一份代码,然后导入到Android Studio中直接报了如下图所示的错误: 错误描述如下: Error: Unable to find method 'org. ...
《COM本质论》COM是一个更好的C++心得分享
昨天看了<COM本质论>的第一章"COM是一个更好的C++",认为非常有必要做一些笔记,于是整理成这篇文章.我相信你值得拥有. 这篇文章主要讲的内容是:一个实现了高速查 ...
R中apply函数族
参考于:http://blog.fens.me/r-apply/ 1. apply的家族函数 2. apply函数 apply函数是最常用的代替for循环的函数.apply函数可以对矩阵.数据框.数组 ...
corethink功能模块探索开发（十七）opencmf.php 配置文件
图样: opencmf.php存在于每个模块的根目录,是模块配置文件. 能进行持久化配置参数保存,一开始我以为是写文件或者做缓存,后来在数据库中发现admin_module表,存储了每个模块的配置参数 ...

spark学习7（spark2.0集群搭建）

第一步：安装spark

第二步：修改配置文件

第三步：在spark2和spark3节点上也安装spark

第四步：验证spark以及进入spark-shell

spark学习7（spark2.0集群搭建）的更多相关文章

随机推荐

热门专题