1. 主机规划

主机名称	IP地址	操作系统	部署软件	运行进程	备注
mini01	172.16.1.11【内网】 10.0.0.11 【外网】	CentOS 7.5	Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7【主】	QuorumPeerMain、
mini02	172.16.1.12【内网】 10.0.0.12 【外网】	CentOS 7.5	Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0	QuorumPeerMain、
mini03	172.16.1.13【内网】 10.0.0.13 【外网】	CentOS 7.5	Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7	QuorumPeerMain、
mini04	172.16.1.14【内网】 10.0.0.14 【外网】	CentOS 7.5	Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7	QuorumPeerMain、
mini05	172.16.1.15【内网】 10.0.0.15 【外网】	CentOS 7.5	Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7	QuorumPeerMain、

说明

该Spark集群安装，但是有一个很大的问题，那就是Master节点存在单点故障，要解决此问题，就要借助zookeeper，并且启动至少两个Master节点来实现高可靠。具体部署下节讲解。

2. 免密码登录

　　实现mini01到mini02、mini03、mini04、mini05通过秘钥免密码登录。

参见文章：Hadoop2.7.6_01_部署

3. Jdk【java8】

参见文章：Hadoop2.7.6_01_部署

4. Spark部署步骤

4.1. Spark安装

 [yun@mini01 software]$ pwd

 /app/software

 [yun@mini01 software]$ ll

 total

 -rw-r--r--   yun yun  Nov  : spark-2.4.-bin-hadoop2..tgz

 [yun@mini01 software]$ tar xf spark-2.4.-bin-hadoop2..tgz

 [yun@mini01 software]$ mv spark-2.4.-bin-hadoop2. /app/

 [yun@mini01 software]$ cd /app/

 [yun@mini01 ~]$ ln -s spark-2.4.-bin-hadoop2./ spark

 [yun@mini01 ~]$ ll -d spark-*

 drwxr-xr-x  yun yun  Oct  : spark-2.4.-bin-hadoop2.

 lrwxrwxrwx   yun yun   Nov  : spark -> spark-2.4.-bin-hadoop2./

4.2. 环境变量修改

　　根据规划，该环境变量的修改包括mini01、mini03、mini04、mini05。

 # 需要root权限去添加环境变量

 [root@mini01 ~]# tail /etc/profile

 ………………

 # spark环境变量

 export SPARK_HOME="/app/spark"

 export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

 [root@mini01 ~]# logout

 [yun@mini01 conf]$ source /etc/profile  # 重新加载该环境变量

4.3. 配置修改

 [yun@mini01 conf]$ pwd

 /app/spark/conf

 [yun@mini01 conf]$ cp -a spark-env.sh.template spark-env.sh

 [yun@mini01 conf]$ tail spark-env.sh  # 修改环境变量配置

 # Options for native BLAS, like Intel MKL, OpenBLAS, and so on.

 # You might get better performance to enable these options if using native BLAS (see SPARK-).

 # - MKL_NUM_THREADS=        Disable multi-threading of Intel MKL

 # - OPENBLAS_NUM_THREADS=   Disable multi-threading of OpenBLAS

 # 添加配置如下

 # 配置JAVA_HOME

 export JAVA_HOME=/app/jdk

 # 设置Master的主机名

 export SPARK_MASTER_IP=mini01

 # 每一个Worker最多可以使用的内存，我的虚拟机就2g

 # 真实服务器如果有128G，你可以设置为100G

 # 所以这里设置为1024m或1g

 export SPARK_WORKER_MEMORY=1024m

 # 每一个Worker最多可以使用的cpu core的个数，我虚拟机就一个...

 # 真实服务器如果有32个，你可以设置为32个

 export SPARK_WORKER_CORES=

 # 提交Application的端口，默认就是这个，万一要改呢，改这里

 export SPARK_MASTER_PORT=

 [yun@mini01 conf]$ pwd

 /app/spark/conf

 [yun@mini01 conf]$ cp -a slaves.template slaves

 [yun@mini01 conf]$ tail slaves  # 修改slaves 配置

 # distributed under the License is distributed on an "AS IS" BASIS,

 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 # See the License for the specific language governing permissions and

 # limitations under the License.

 #

 # A Spark Worker will be started on each of the machines listed below.

 mini03

 mini04

 mini05

4.4. 分发到其他机器

　　分发到mini03、mini04和mini05

 [yun@mini01 ~]$ scp -pr spark-2.4.-bin-hadoop2./ yun@mini03:/app  # 拷贝到mini03

 [yun@mini01 ~]$ scp -pr spark-2.4.-bin-hadoop2./ yun@mini04:/app  # 拷贝到mini04

 [yun@mini01 ~]$ scp -pr spark-2.4.-bin-hadoop2./ yun@mini05:/app  # 拷贝到mini05

在mini03、mini04和mini05上操作

 [yun@mini04 ~]$ pwd

 /app

 [yun@mini04 ~]$ ll -d spark-2.4.-bin-hadoop2.

 drwxr-xr-x  yun yun  Oct  : spark-2.4.-bin-hadoop2.

 [yun@mini04 ~]$ ln -s spark-2.4.-bin-hadoop2./ spark

 [yun@mini04 ~]$ ll -d spark-*

 drwxr-xr-x  yun yun  Oct  : spark-2.4.-bin-hadoop2.

 lrwxrwxrwx   yun yun   Nov  : spark -> spark-2.4.-bin-hadoop2./

4.5. 启动spark

在mini01上操作

 [yun@mini01 sbin]$ pwd

 /app/spark/sbin

 [yun@mini01 sbin]$ ./start-all.sh  # 关闭使用 stop-all.sh 脚本

 starting org.apache.spark.deploy.master.Master, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.master.Master--mini01.out

 mini03: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker--mini03.out

 mini05: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker--mini05.out

 mini04: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker--mini04.out

 [yun@mini01 ~]$

 [yun@mini01 ~]$ jps  # 查看进程状态

  Master

  Jps

mini03进程查看

 [yun@mini03 ~]$ jps

  Worker

  Jps

mini04进程查看

 [yun@mini04 ~]$ jps

  Jps

  Worker

mini05进程查看

 [yun@mini05 ~]$ jps

  Worker

  Jps

4.6. 浏览器访问

 http://mini01:8080/

spark-2.4.0-hadoop2.7-安装部署的更多相关文章

hadoop入门（3）——hadoop2.0理论基础：安装部署方法
一.hadoop2.0安装部署流程 1.自动安装部署:Ambari.Minos(小米).Cloudera Manager(收费) 2.使用RPM包安装部署:Apache ...
spark编译安装 spark 2.1.0 hadoop2.6.0-cdh5.7.0
1.准备: centos 6.5 jdk 1.7 Java SE安装包下载地址:http://www.oracle.com/technetwork/java/javase/downloads/java ...
spark 1.1.0 单机与yarn部署
环境:ubuntu 14.04, jdk 1.6, scala 2.11.4, spark 1.1.0, hadoop 2.5.1 一 spark 单机模式部分操作参考:http://www.cnb ...
spark 2.1.0 集群安装
jdk安装 http://www.cnblogs.com/xiaojf/p/6568426.html scala2.11 安装 http://www.cnblogs.com/xiaojf/p/6568 ...
jumpserverv0.5.0 基于 CentOS7安装部署
基于 CentOS 7 一步一步安装 Jumpserver 0.5.0 环境系统: CentOS 7 IP: 192.168.244.144 关闭 selinux和防火墙 # CentOS 7 $ ...
ElasticSearch 5.0.0 集群安装部署文档
1. 搭建环境 3台物理机操作系统 centos7 es1 192.168.31.141 4g内存 2核 es2 192.168.31.142 4g内存 2核 es3 ...
Apache Mesos1.0.1 编译安装部署教程(ubuntu)
参考资料官方文档:http://mesos.apache.org/documentation 中文翻译:http://mesos.mydoc.io/ GitHub:https://github.co ...
Spark（一）-- Standalone HA的部署
首先交代一下集群的规模和配置集群有六台机器,均是VM虚拟机,每台256M的内存(原谅楼主物理机硬件不太给力) 主机名分别是cloud1~cloud6 每台机器上都装有jdk6,和hadoop-2.2 ...
Redis （一）Redis简介、安装部署
Redis是一个开源的,先进的 key-value 存储可用于构建高性能,可扩展的 Web 应用程序的解决方案. 既然是key-value,对于Java开发来说更熟悉的是Map集合.那就有问题了,有M ...
（转）实验文档1：跟我一步步安装部署kubernetes集群
实验环境基础架构主机名角色 ip HDSS7-11.host.com k8s代理节点1 10.4.7.11 HDSS7-12.host.com k8s代理节点2 10.4.7.12 HDSS7- ...

随机推荐

Docker折腾手记-安装
安装 docker红的发紫,所以博主耳闻这么久,也要来折腾折腾了研究不多,个人目前认为docker给我们带来了以下好处开发机器因为开发原因,需要配置各种各校的环境,繁琐且耗费资源.配来配去还容易环 ...
Android总结篇系列：Activity中几个主要函数详解
Activity作为Android系统中四大基本组件之一,包含大量的与其他的各大组件.intent.widget以及系统各项服务等之间的交互的函数.在此,本文主要选取实际项目开发中常用的,但完全理解又 ...
Java架构师趣谈Hbase之宏观架构
相关文章五分钟轻松了解Hbase列式存储 Hbase给初学者的“下马威” Hbase王国游记之:Hbase客户端API初体验
以语音评测的PC端demo代码为例，讲解口语评测如何实现
本文由云+社区发表作者:腾讯智慧教育概述腾讯云智聆口语评测(英文版)(Smart Oral Evaluation-English,SOE-E)是腾讯云推出的语音评测产品,是基于英语口语类教育培训 ...
4.镜像管理【Docker每天5分钟】
Docker给PaaS世界带来的“降维打击”,其实是提供了一种非常便利的打包机制.该机制打包了应用运行所需要的整个操作系统,从而保证了本地环境和云端环境的高度一致,避免了用户通过“试错”来匹配不同运行 ...
DNS服务器和CDN
整个网页请求的流程如下: 我们先在浏览器输入域名,然后通过DNS(Domain Name System) 域名解析系统解析出来域名的对应的IP,然后发送请求得到响应返回给客户端,整个流程如下: 我们 ...
babel版本兼容报错处理：Plugin/Preset files are not allowed to export objects
原文地址: https://www.cnblogs.com/jiebba/p/9618930.html 1.为什么会报错 ? 这里抱着错误是因为 babel 的版本冲突. 多是因为你的 babel 依 ...
_C#发送邮箱
public ActionResult lead() { SendEmail("邮箱号", "吃饭么?", "你要吃什么啊"); retur ...
【小o地图Excel插件版】不止能做图表，还能抓58、大众点评网页数据...
小o地图Excel插件版:一款基于Excel软件开发的地图软件,提供基于Excel表格进行地理数据挖掘.地理数据分析.地图绘制.地图图表等功能的工具类软件.具有易用.高效.稳定的特点,能够满足地理数据 ...
PHP 脚本不报错
场景当运行PHP脚本,访问数组中不存在的key时,脚本不报错,如下: <?php $arr = [1,2,3]; // 不报错,返回null var_dump($arr['abc']); 解决 ...

spark-2.4.0-hadoop2.7-安装部署