HA分布式集群配置三 spark集群配置

（一）HA下配置spark

1，spark版本型号：spark-2.1.0-bin-hadoop2.7

2，解压，修改配置环境变量

tar -zxvf spark-2.1.0-bin-hadoop2.7.tgz

mv spark-2.1.0-bin-hadoop2.7 /usr/spark-2.1.0

vim /etc/profile

export JAVA_HOME=/usr/java

export SCALA_HOME=/usr/scala

export HADOOP_HOME=/usr/hadoop-2.7.3

export ZK_HOME=/usr/zookeeper-3.4.8

export MYSQL_HOME=/usr/local/mysql

export HIVE_HOME=/usr/hive-2.1.1

export SPARK_HOME=/usr/spark-2.1.0

export PATH=$SPARK_HOME/bin:$HIVE_HOME/bin:$MYSQL_HOME/bin:$ZK_HOME/bin:$JAVA_HOME/bin:$SCALA_HOME/bin:$HADOOP_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

3，修改spark-env.sh文件

cd $SPARK_HOME/conf

vim spark-env.sh

#添加

export JAVA_HOME=/usr/java

export SCALA_HOME=/usr/scala

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=ha1:2181,ha2:2181,ha3:2181 -Dspark.deploy.zookeeper.dir=/spark"

export HADOOP_CONF_DIR=/usr/hadoop-2.7.3/conf/etc/hadoop

export SPARK_MASTER_PORT=7077

export SPARK_EXECUTOR_INSTANCES=1

export SPARK_WORKER_INSTANCES=1

export SPARK_WORKER_CORES=1

export SPARK_WORKER_MEMORY=1024M

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_CONF_DIR=/usr/spark-2.1.0/conf

4，修改slaves文件

vim slaves

#添加

ha2

ha3

ha4

5，分发及启动

cd /usr

scp -r spark-2.1.0 root@ha4:/usr

scp -r spark-2.1.0 root@ha3:/usr

scp -r spark-2.1.0 root@ha2:/usr

scp -r spark-2.1.0 root@ha1:/usr

#在ha1上

./$SPARK_HOME/sbin/start-all.sh

#ha2,ha3上

./$SPARK_HOME/sbin/start-master.sh

各个节点jps情况：

[root@ha1 spark-2.1.0]# jps

2464 NameNode

2880 ResourceManager

2771 DFSZKFailoverController

3699 Jps

2309 QuorumPeerMain

3622 Master

[root@ha2 zookeeper-3.4.8]# jps

2706 NodeManager

3236 Jps

2485 JournalNode

3189 Worker

2375 DataNode

2586 DFSZKFailoverController

2236 QuorumPeerMain

2303 NameNode

3622 Master

[root@ha3 zookeeper-3.4.8]# jps

2258 DataNode

2466 NodeManager

2197 QuorumPeerMain

2920 Jps

2873 Worker

2331 JournalNode

3622 Master

[root@ha4 ~]# jps

2896 Jps

2849 Worker

2307 JournalNode

2443 NodeManager

2237 DataNode

6，关机，快照 sparkok

#启动集群顺序

#ha1,ha2,ha3

cd $ZK_HOME

./bin/zkServer.sh start

#ha1

cd $HADOOP_HOME

./sbin/start-all.sh

cd $SPARK_HOME

./sbin/start-all.sh

#ha2,ha3

./sbin/start-master.sh

HA分布式集群配置三 spark集群配置的更多相关文章

Redis集群（三）：主从配置一
一.本文目的 Redis的主从配置分为两篇文章,第一篇主要介绍了Redis主从配置的搭建过程及使用,第二篇主要说明各种情况下Redis主从状态,如Master挂掉,Slaver挂掉, ...
Hadoop集群搭建(三)~centos6.8网络配置
安装完centos之后,进入系统,进行网络配置.主要分为五个部分: 修改虚拟机网络编辑器:配置Winodws访问虚拟机:配置centos网卡:通过网络名访问虚拟机配置网络服务. (一)虚拟机网络编辑器 ...
Spark入门：第2节 Spark集群安装：1 - 3；第3节 Spark HA高可用部署：1 - 2
三. Spark集群安装 3.1 下载spark安装包下载地址spark官网:http://spark.apache.org/downloads.html 这里我们使用 spark-2.1.3-bi ...
HA下的Spark集群工作原理解密
实验环境: zookeeper-3.4.6 Spark:1.6.0 简介: 本篇博客将从以下几点组织文章: 一:Spark 构建高可用HA架构二:动手实战构建高可用HA 三:提交程序测试HA 一:S ...
Spark集群管理器介绍
Spark可以运行在各种集群管理器上,并通过集群管理器访问集群中的其他机器.Spark主要有三种集群管理器,如果只是想让spark运行起来,可以采用spark自带的独立集群管理器,采用独立部署的模式: ...
使用Docker搭建Spark集群（用于实现网站流量实时分析模块）
上一篇使用Docker搭建了Hadoop的完全分布式:使用Docker搭建Hadoop集群(伪分布式与完全分布式),本次记录搭建spark集群,使用两者同时来实现之前一直未完成的项目:网站日志流量分析 ...
Spark集群搭建中的问题
参照<Spark实战高手之路>学习的,书籍电子版在51CTO网站资料链接 Hadoop下载[链接](http://archive.apache.org/dist/hadoop/core/ ...
Spark新手入门——3.Spark集群(standalone模式)安装
主要包括以下三部分,本文为第三部分: 一. Scala环境准备查看二. Hadoop集群(伪分布模式)安装查看三. Spark集群(standalone模式)安装 Spark集群(standalo ...
大数据平台搭建-spark集群安装
版本要求 java 版本:1.8.*(1.8.0_60) 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downl ...

随机推荐

swap增加
#创建17G的文件dd if=/dev/zero of=/data/swap/swap-1 bs=1024 count=16255000#设置为swap分区/sbin/mkswap /data/swa ...
Mac-item+zsh
$brew cask install iterm2 $ sh -c "$(curl -fsSL https://raw.github.com/robbyrussell/oh-my-zsh/m ...
PHPstorm创建注释模版
/** * $NAME$ * @param * @return * @since $DATE$ * @author Name */$END$ /** * xxxx -- Controller – 类 ...
Selenium2+python自动化23-富文本（自动发帖）【转载】
前言富文本编辑框是做web自动化最常见的场景,有很多小伙伴遇到了不知道无从下手,本篇以博客园的编辑器为例,解决如何定位富文本,输入文本内容一.加载配置 1.打开博客园写随笔,首先需要登录,这里为了 ...
C++-二维vector初始化大小方法-备忘
来源: C++——二维vector初始化大小方法 1.直接用初始化方法名字为vec,大小为n*m,初始值为0的二维vector. vector<vector<)); 2.用resize( ...
曼哈顿距离、欧几里得距离、闵氏距离(p→∞为切比雪夫距离)
曼哈顿距离: 是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和. 曼哈顿距离——两点在南北方向上的距离加上在东西方向上的距离, ...
HDU 2612 Find a way【多起点多终点BFS/两次BFS】
Find a way Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Su ...
HDU 3045 Picnic Cows
$dp$,斜率优化. 设$dp[i]$表示$1$至$i$位置的最小费用,则$dp[i]=min(dp[j]+s[i]-s[j]-(i-j)*x[j+1])$,$dp[n]$为答案. 然后斜率优化就可以 ...
The 15th Zhejiang Provincial Collegiate Programming Contest Sponsored by TuSimple - J CONTINUE...?
CONTINUE...? Time Limit: 1 Second Memory Limit: 65536 KB Special Judge DreamGrid has clas ...
17、Django实战第17天：机构详情展示
1.进入xadmin添加测试数据(教师.课程) 2.把以下4个前端页面复制到templates中先打开这几个页面分析,它们和之前的课程机构列表页是不一样的机构,且没有共同的部分,但是这4个页面却是类 ...

HA分布式集群配置三 spark集群配置

HA分布式集群配置三 spark集群配置的更多相关文章

随机推荐

热门专题