spark-2.1.1 yarn(高可用)搭建

一、概述

　　spark分布式搭建方式大致分为三种：standalone、yarn、mesos。三种分类的区别这里就不一一介绍了，不明白可自行了解。standalone是官方提供的一种集群方式，企业一般不使用。yarn集群方式在企业中应用是比较广泛的，这里也是介绍yarn的集群安装方式。mesos安装适合于超大型集群。

集群节点分配：

hadoop01:Zookeeper、NameNode(active)、ResourceManager(active)

hadoop02:Zookeeper、NameNode(standby)

hadoop03:Zookeeper、　　　　　　　　　 ResourceManager(standby)

hadoop04:　　　　　　DataNode、　　　　NodeManager、　　　　　　JournalNode、　　spark

hadoop05:　　　　　　DataNode、　　　　NodeManager、　　　　　　JournalNode、　　spark

hadoop06:　　　　　　DataNode、　　　　NodeManager、　　　　　　JournalNode、　　spark

二、安装

　　说明一下：

　　①选spark的时候要注意与hadoop版本对应。因为hadoop用的是2.7的，所以spark选的是spark-2.1.1-bin-hadoop2.7

　　②因为spark基于yarn来管理，spark只能安装在NodeManager节点上。

　　③spark安装放在/home/software目录下。

　　1、hadoop基于yarn（ha）的搭建，这里介绍步骤了。在我的上一个教程里有详细介绍。

　　2、安装scala,并配置好环境变量。

　　3、在NodeManager节点上解压spark文件。

　　　　tar -xvf spark-2.1.1-bin-hadoop2.7

　　3、修改spark-2.1.1-bin-hadoop2.7/conf/spark-env.sh,在文件尾部加上以下内容，其中HADOOP_CONF_DIR是必填项

　　　　export JAVA_HOME=/home/jack/jdk1.8.0_144
　　　　export SCALA_HOME=/home/jack/scala-2.12.3
　　　　export HADOOP_HOME=/home/software/hadoop-2.7.4
　　　　export HADOOP_CONF_DIR=/home/software/hadoop-2.7.4/etc/hadoop
　　　　export SPARK_MASTER_PORT=7077
　　　　export SPARK_EXECUTOR_CORES=2
　　　　export SPARK_EXECUTOR_MEMORY=1024m
　　　　export SPARK_EXECUTOR_INSTANCES=1

　　4、修改spark-2.1.1-bin-hadoop2.7/conf/slave文件,添加以下内容：

　　　　hadoop04

　　　　hadoop05

　　　　hadoop06

　　5、在hdfs上传spark的jar包，并修改/home/software/spark-2.1.1-bin-hadoop2.7/conf/spark-defaults.conf（可不做）

　　　　①hadoop fs -mkdir /spark_jars

　　　　②hadoop fs -put /home/software/spark-2.1.1-bin-hadoop2.7/jars/* /spark_jars

　　　　③修改/home/software/spark-2.1.1-bin-hadoop2.7/conf/spark-defaults.conf，添加以下内容：

　　　　　　spark.yarn.jars=hdfs://hadoop01:9000/spark_jars/*

　　6、完成以上操作就完成了spark基于yarn的安装。下面是验证部分：

　　　在安装有spark的节点上执行以下命令：　　

　　　　spark-submit --class org.apache.spark.examples.SparkPi \
　　　　--master yarn \
　　　　--deploy-mode cluster \
　　　　--driver-memory 1g \
　　　　--executor-memory 1g \
　　　　--executor-cores 1 \
　　　　--num-executors 3 \
　　　　/home/software/spark-2.1.1-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.1.1.jar \
　　　　10

能看以上三张图就说明安装成功了！

备注：如果执行spark-shell --master yarn --deploy-mode client失败，报rpc连接失败，解决方法如下：

在hadoop的配置文件yarn-site.xml中加入：

<property>
<name>yarn.nodemanager.pmem-check-enabled</name>
<value>false</value>
</property>

<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>

报错的原因是：内存资源给的过小，yarn直接kill掉进程，则报rpc连接失败、ClosedChannelException等错误。

spark-2.1.1 yarn(高可用)搭建的更多相关文章

hadoop2.6.0高可靠及yarn 高可靠搭建
以前用hadoop2.2.0只搭建了hadoop的高可用,但在hadoop2.2.0中始终没有完成YARN HA的搭建,直接下载了hadoop最新稳定版本2.6.0完成了YARN HA及HADOOP ...
hadoop 集群HA高可用搭建以及问题解决方案
hadoop 集群HA高可用搭建目录大纲 1. hadoop HA原理 2. hadoop HA特点 3. Zookeeper 配置 4. 安装Hadoop集群 5. Hadoop HA配置搭建环 ...
hadoop+zookeeper集群高可用搭建
hadoop+zookeeper集群高可用搭建 Senerity 发布于 2 ...
七、Hadoop3.3.1 HA 高可用集群QJM （基于Zookeeper，NameNode高可用+Yarn高可用）
目录前文 Hadoop3.3.1 HA 高可用集群的搭建 QJM 的 NameNode HA Hadoop HA模式搭建(高可用) 1.集群规划 2.Zookeeper集群搭建: 3.修改Hadoo ...
10-Flink集群的高可用(搭建篇补充)
戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Fli ...
Hadoop入门学习笔记-第三天（Yarn高可用集群配置及计算案例）
什么是mapreduce 首先让我们来重温一下 hadoop 的四大组件:HDFS:分布式存储系统MapReduce:分布式计算系统YARN: hadoop 的资源调度系统Common: 以上三大组件 ...
Qingcloud_MySQL Plus(Xenon) 高可用搭建实验
实验:Xenon on 5.7.30 Xenon (MySQL Plus) 是青云Qingcloud的一个开源项目,号称金融级别强一致性的高可用解决方案,项目地址为 https://github.co ...
Spring Cloud(Dalston.SR5)--Eureka 注册中心高可用搭建
高可用集群在微服务架构这样的分布式环境中,我们需要充分考虑发生故障的情况,所以在生产环境中必须对各个组件进行高可用部署,对与微服务和服务注册中心都需要高可用部署,Eureka 高可用实际上就是将自己 ...
kudu集群高可用搭建
首先咱得有KUDU安装包这里就不提供直接下载地址了(因为有5G,我的服务器网卡只有4M,你们下的很慢) 这里使用的是CDH版本官方下载地址http://archive.cloudera.com/ ...

随机推荐

测开之路一百二十五：flask之urlencode参数传递和解析
当get请求传参时,用?分隔参数和域名,用&分隔参数,如果参数里面本身就有&符号就会识别不出来,还是会当成分隔符,所以这些数据在传输的时候,就需要转义,现在普遍是转成urlencode ...
Unity3D-Rigidbody
挂载Rigidbody的Gameobject受物理引擎的作用,有真实的物理力学. Mass质量:物体的质量(任意单位).建议一个物体的质量不要多余或少于其他单位的100倍. Drag阻力:当受力移动时 ...
一文学会Go - 2 数据结构与算法实践篇
练习:使用go语言实现冒泡排序和归并排序冒泡排序是所有排序算法中最简单的,练习时先实现它: func bubbleSort(array []int) { n := len(array) ; j &l ...
struts2默认action设置了却访问不到
1.错误原因我的package中共有两个action,第一个是默认action,用于访问的action不存在时候的出错处理,第二个是通配符方式写的action,name采用*_*形式的全通配符.配置 ...
struts2 2.5.16 通配符方式调用action中的方法报404
1.问题描述在struts.xml中配置用通配符方式调用action中的add()方法,访问 http://localhost:8080/Struts2Demo/helloworld_add.act ...
Elasticsearch5安装以及部署Head插件
请看完再动手,两篇文章都是找来的,合并在一起了,前半部分是参考,我是按照后半部分做的,而且执行中间也有坑. Elasticsearch5.X及 head插件安装说明: 1.下载elasticsear ...
【HANA系列】SAP HANA SQL获取本周的周一
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列]SAP HANA SQL获取本周 ...
axios入门使用
vue项目中axios的基本使用和简单封装 axios中文文档官网 http://www.axios-js.com/docs/ 一:不封装直接使用 npm install axios 在main.js ...
DataAdapter的Fill方法(转)
使用DataAdapter填充DataSet(1) 在选择了DataAdapter的类型(SqlDataAdapter或OleDbDataAdapter)并配置了DataAdapter来执行所需的任务 ...
ubuntu 安装企业级容器 docker harbor
安装docker harbor 企业级容器环境说明: 操作系统: ubuntu16.04.5 LTS IP地址: 192.168.31.129 https://github.com/goh ...

spark-2.1.1 yarn(高可用)搭建

spark-2.1.1 yarn(高可用)搭建的更多相关文章

随机推荐

热门专题