从0到1搭建spark集群---企业集群搭建

今天分享一篇从0到1搭建Spark集群的步骤，企业中大家亦可以参照次集群搭建自己的Spark集群。

一。下载Spark安装包

可以从官网下载，本集群选择的版本是spark-1.6.0-bin-hadoop2.6

在官网中找到对应的链接即可http://spark.apache.org/downloads.html

或者用本人云盘下载地址附上链接如下链接：https://pan.baidu.com/s/1o7Vrkue 密码：sc2z

二。部署和规划Spark集群

提前准备好四台虚拟主机，三台主机 node1 node2 node4 做Spark集群 develop做Spark客户端用于提交程序

集群规划如下：

node1 Master节点 node2，node4 Worker节点架构图如下：

在此之前需要配置Master节点到Worker的免密登陆因为在Master节点需要启动所有的Worker节点，所有需要配置Master到Worker的免密登陆只需要这一个免密配置即可不需要配置woker--worker worker-master节点的免密因为主要是在Master节点上启动集群

免密设置具体参考如下：http://blog.csdn.net/leexide/article/details/17252369

1.分别在三台集群下创建同名目录（目录一定要一致，方便集群部署）

本集群环境创建为/root/spark目录

2.使用Xshell将文件上传至其中某个节点即可（没有必要上传全部节点，因为后期还要重新配置）

上传至某个节点之后，假设上传到主节点Master节点后

3.解压目录，命令和结构如下

tar -zxf spark-1.6.0-bin-hadoop2.6.tar

然后重命名方便后期部署

mv spark-1.6.0-bin-hadoop2.6 spark-1.6.0

结构如下：

4.配置参数

进入到配置目录，路径为

/root/spark/spark-1.6.0/conf

后可看见文件如下

我们需要把template关键字去掉因为是个模板文件简单介绍下文件作用：

slaves文件---worker几点所在目录

spark-default.conf目录文件默认配置文件

spark-env.sh环境配置文件

这几个是我们主要用的

更改后的目录文件格式如下：

配置spark-env.sh

可以看到集群配置参数如下，我们主要配置这些参数

配置完后的截图如下：

解释一下参数意义：

SPARK_MASTER_IP=node1 #主节点主机名

SPARK_MASTER_PORT=7077 #主节点和Worker的通信端口

SPARK_WORKER_CORES=2 # 每个worker进程能管理两个核

SPARK_WORKER_MEMORY=2g # 每个worker进程能管理2g内存

SPARK_MASTER_WEBUI_PORT=8888 # 主节点WEB-UI展示图默认端口是8080

SPARK_WORKER_INSTANCES=1 #每个worker节点能够启动的worker进程默认是一个如果为2 则每一个worker几点能够启动2个Worker进程就这意思

根据这配置则 Master节点能够管路4core 4g内存（有两个Worker进程每一个worker进程管理两个核，2g内存）

配置slaves文件：配置从节点的ip 或主机名

截图如下

5.将主节点的配置分发到从节点同名目录下

命令如下:

回到spark的主目录配置文件

然后分发到node2 node4节点这里命令如下`pwd`即到当前目录

6、启动Spark集群：
执行安装包sbin目录下的start-all.sh脚本
./sbin/start-all.sh

7.查看集群状态

jps命令为jvm的命令与局之一专门查看java进程

Master节点状态：

Worker节点状态：

查看WEBUI是否能访问：

注意关闭Linux的防火墙：具体操作如下

/etc/init.d/iptables status

会得到一系列信息，说明防火墙开着。

/etc/init.d/iptables stop

永久关闭:

chkconfig --level 35 iptables off

在本机访问node1:8888（别忘配置host）

至此，集群搭建成功！

8.测试集群是否可用

将主节点中的spark文件同步到客户端develop节点

在develop节点中提交spark任务，由于本例测试所以直接提交spark自带测试用例计算Pi的值

注意别忘配置Client(develop)客户端的host 因为要提交任务到Master节点（node1）节点上去运行

即可看见运行状态

在WebUI也可以看见

到此集群测试完毕!!!

持续更新中。。。。，欢迎大家关注我的公众号LHWorld.

从0到1搭建spark集群---企业集群搭建的更多相关文章

沉淀，再出发——在Hadoop集群的基础上搭建Spark
在Hadoop集群的基础上搭建Spark 一.环境准备在搭建Spark环境之前必须搭建Hadoop平台,尽管以前的一些博客上说在单机的环境下使用本地FS不用搭建Hadoop集群,可是在新版spark ...
搭建Spark的单机版集群
一.创建用户 # useradd spark # passwd spark 二.下载软件 JDK,Scala,SBT,Maven 版本信息如下: JDK jdk-7u79-linux-x64.gz S ...
实验室中搭建Spark集群和PyCUDA开发环境
1.安装CUDA 1.1安装前工作 1.1.1选取实验器材实验中的每台计算机均装有双系统.选择其中一台计算机作为master节点,配置有GeForce GTX 650显卡,拥有384个CUDA核心. ...
(一) 从零开始搭建Spark Standalone集群环境搭建
本文主要讲解spark 环境的搭建主机配置 4核8线程,主频3.4G,16G内存虚拟环境: VMWare 虚拟环境系统:Ubuntu 14.10 虚拟机运行环境: jdk-1.7.0_79(64 ...
spark-2.2.0安装和部署——Spark集群学习日记
前言在安装后hadoop之后,接下来需要安装的就是Spark. scala-2.11.7下载与安装具体步骤参见上一篇博文 Spark下载为了方便,我直接是进入到了/usr/local文件夹下面进 ...
【原创 Hadoop&Spark 动手实践 5】Spark 基础入门，集群搭建以及Spark Shell
Spark 基础入门,集群搭建以及Spark Shell 主要借助Spark基础的PPT,再加上实际的动手操作来加强概念的理解和实践. Spark 安装部署理论已经了解的差不多了,接下来是实际动手实 ...
搭建spark集群
搭建spark集群 spark1.6和hadoop2.61.准备hadoop环境:2.准备下载包:3.解压安装包:tar -xf spark-1.6.0-bin-hadoop2.6.tgz4.修改配置 ...
基于 ZooKeeper 搭建 Spark 高可用集群
一.集群规划二.前置条件三.Spark集群搭建 3.1 下载解压 3.2 配置环境变量 3.3 集群配置 3.4 安装包分发四.启 ...
Spark学习之路（七）—— 基于ZooKeeper搭建Spark高可用集群
一.集群规划这里搭建一个3节点的Spark集群,其中三台主机上均部署Worker服务.同时为了保证高可用,除了在hadoop001上部署主Master服务外,还在hadoop002和hadoop00 ...

随机推荐

java 邮件发送的公共方法
protected static String host = "true"; protected static String auth = "smtp.163.com&q ...
js二级事件模型的处理细节
一.纠正网络上的一个误传--“IE不支持事件捕获” 可以在浏览器中运行上面demo,在各主流浏览器中,鼠标移上都可以分别触发捕获与冒泡事件的监听函数,所以IE也是支持事件捕获的,连IE6都支持,只是在 ...
less新手入门（二） Mixin 混合、带参数的Mixin
四.mixin 混合 "mix - in"属性来自现有的样式!! 你可以在类选择器和id选择器中使用mixin, .a,#b{ color: rebeccapurple; } . ...
资源向导之 "APUE"
APUE --- Advanced programming in the unix environment 这本书我看了好多遍.... 原因嘛, 第一次看到进程那里,看不懂了,前面基础没看好,从头再来 ...
Uva 12436 Rip Van Winkle's Code
Rip Van Winkle was fed up with everything except programming. One day he found a problem whichrequir ...
x86内存映射
Contents 1 "Low" memory (< 1 MiB) 1.1 Overview 1.2 BIOS Data Area (BDA) 1.3 Extended BI ...
自己手写WEB程序框架并执行
1.新建目录,起名MyWeb 2.目录下,新建两个目录 WEB-INF, META-INF,,还能够新建一些jsp,html文件 ,如 index.html 3在WEB-INF中必须存在一个文件WEB ...
hdu2601 An easy problem（数学）
题目意思: http://acm.hdu.edu.cn/showproblem.php? pid=2601 给出一个数N,求N=i*j+i+j一共同拥有多少种方案. 题目分析: 此题直接暴力模拟就可以 ...
Matlab 2014b For Mac安装破解
1.Matlab 2014b 的安装和破解文件下载: 安装文件:http://www.cncrk.com/downinfo/80718.html 破解文件:http://pan.baidu.com/s ...
RESTful 的通俗解释
转载自知乎,通俗易懂的讲解了RESTful链接:https://www.zhihu.com/question/28557115/answer/48094438 REST -- REpresentati ...

从0到1搭建spark集群---企业集群搭建

从0到1搭建spark集群---企业集群搭建的更多相关文章

随机推荐

热门专题