4. 安装Spark

4.1. 准备目录

tar -xf /home/hadoop/install/spark-2.1.-bin-without-hadoop.tgz -C /opt/cloud/packages/

ln -s /opt/cloud/packages/spark-2.1.-bin-without-hadoop  /opt/cloud/bin/spark

ln -s /opt/cloud/packages/spark-2.1.-bin-without-hadoop/conf  /opt/cloud/etc/spark

mkdir -p /opt/cloud/logs/spark

mkdir -p /opt/cloud/data/spark

4.2. 设置环境变量

vi ~/.bashrc

export SPARK_HOME=/opt/cloud/bin/spark

export PATH=$SPARK_HOME/bin:$PATH

即刻生效

source ~/.bashrc

4.3. 修改配置文件

4.3.1. spark-env.sh

cd /opt/cloud/etc/spark

mv spark-env.sh.template spark-env.sh

vi spark-env.sh

export JAVA_HOME=/usr/lib/jvm/java

export HADOOP_HOME=/opt/cloud/bin/hadoop

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SPARK_DIST_CLASSPATH=$(hadoop classpath)[]

export SPARK_LOCAL_DIRS=/opt/cloud/data/spark

export SPARK_LOG_DIR=/opt/cloud/logs/spark

export SPARK_PID_DIR=/opt/cloud/hdfs/tmp

4.3.2. spark-defaults.conf

mv spark-defaults.conf.template spark-defaults.conf

vi spark-defaults.conf

spark.driver.memory              512m

4.4. 测试

通过修改MASTER临时变量，测试yarn模式

export MASTER=yarn

./bin/run-example SparkPi

4.5. 卸载

复原环境变量，删除spark相关行

vi ~/.bashrc

删除临时数据和目录

rm /opt/cloud/bin/spark

rm /opt/cloud/etc/spark -rf

rm /opt/cloud/packages/spark-2.1.-bin-without-hadoop/ -rf

rm /opt/cloud/data/spark/ -rf

rm /opt/cloud/logs/spark/ -rf

[1] without hadoop 时需要

安装高可用Hadoop生态（四）安装Spark的更多相关文章

安装高可用Hadoop生态（三）安装Hadoop
3. 安装Hadoop 3.1. 解压程序 ※ 3台服务器分别执行 .tar.gz -C/opt/cloud/packages /opt/cloud/bin/hadoop /etc/hadoop ...
安装高可用Hadoop生态（一）准备环境
为了学习Hadoop生态的部署和调优技术,在笔记本上的3台虚拟机部署Hadoop集群环境,要求保证HA,即主要服务没有单点故障,能够执行最基本功能,完成小内存模式的参数调整. 1. 准备环境 1 ...
安装高可用Hadoop生态（二）安装Zookeeper
2. 安装Zookeeper 2.1. 解压程序 ※ 3台服务器分别执行 .tar.gz -C/opt/cloud/packages /opt/cloud/bin/zookeeper /conf ...
基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
kubernetes实战(二十五)：kubeadm 安装高可用 k8s v1.13.x
1.系统环境使用kubeadm安装高可用k8s v.13.x较为简单,相比以往的版本省去了很多步骤. kubeadm安装高可用k8s v.11 和 v1.12 点我主机信息主机名 IP地址说明 ...
企业运维实践-还不会部署高可用的kubernetes集群?使用kubeadm方式安装高可用k8s集群v1.23.7
关注「WeiyiGeek」公众号设为「特别关注」每天带你玩转网络安全运维.应用开发.物联网IOT学习! 希望各位看友[关注.点赞.评论.收藏.投币],助力每一个梦想. 文章目录: 0x00 前言简述 ...
高可用Hadoop平台－Hue In Hadoop
1.概述前面一篇博客<高可用Hadoop平台-Ganglia安装部署>,为大家介绍了Ganglia在Hadoop中的集成,今天为大家介绍另一款工具——Hue,该工具功能比较丰富,下面是今 ...
高可用Hadoop平台－探索
1.概述上篇<高可用Hadoop平台-启航>博客已经让我们初步了解了Hadoop平台:接下来,我们对Hadoop做进一步的探索,一步一步的揭开Hadoop的神秘面纱.下面,我们开始赘述今 ...
高可用Hadoop平台－Flume NG实战图解篇
1.概述今天补充一篇关于Flume的博客,前面在讲解高可用的Hadoop平台的时候遗漏了这篇,本篇博客为大家讲述以下内容: Flume NG简述单点Flume NG搭建.运行高可用Flume N ...

随机推荐

Java面试-动态规划与组合数
最近在刷力扣上的题目,刷到了65不同路径,当初上大学的时候,曾在hihocoder上刷到过这道题目,但是现在已经几乎全忘光了,大概的知识点是动态规划,如今就让我们一起来回顾一下. 从题目说起题目原文 ...
centos7 kubernetes单机安装
单机版的kubernetes 适合初学者,对kuber有个很好的入门. 因为centos系统内置了安装源.我们可以直接安装 1.yum install -y etco kubernetes 2.whe ...
MyBatis基础之几道常见面试题详解
(原文链接:http://www.studyshare.cn/blog/details/1178/1 一.开发中到底应该使用resultType还是resultMap? 强制使用resultMap,不 ...
hdu 1007 Quoit Design 题解
原题地址题目大意查询平面内最近点对的距离,输出距离的一半. 暴力做法枚举每一个点对的距离直接判断,时间复杂度是 $ O(n^2) $,对于这题来说会超时. 那么我们考虑去优化这一个过程,我们在求 ...
android小工具-系统音量管理器
简介:调节系统音量的小工具,能够快捷的调节系统铃声,媒体音乐.闹钟和通话声音.你可能会想,手机自带的音量键还不够快捷吗?还得写个程序?首先,用音量键调音只能调节一种声音,像闹钟这种声音不能直接调.其次 ...
记录一次oracle的坑
背景:程序正常运行中,突然技术支持人员反映数据库数据好久没有增加,于是乎各种排查问题,但是一直没有找到原因,由于代码比较久,也不是本人所写,更气的是居然用的是oracle数据库,并且是通过java代码 ...
表达式树练习实践：C# 五类运算符的表达式树表达
目录表达式树练习实践:C# 运算符一,算术运算符 + 与 Add() - 与 Subtract() 乘除.取模自增自减二,关系运算符 ==.!=.>.<.>=.<= 三 ...
Python中使用pip安装库时提示：远程主机强迫关闭了一个现有的连接
场景在cmd中使用pip install moviepy时,需要安装一些依赖库,很长时间后提示: 远程主机中断了一个现有的连接. 原因是默认镜像源下载过慢,将其修改为国内或者设置安装时的源. 这里以 ...
Kubernetes监控实践
一.Kubernetes介绍 Kubernetes(K8s)是一个开源平台,能够有效简化应用管理.应用部署和应用扩展环节的手动操作流程,让用户更加灵活地部署管理云端应用. 作为可扩展的容错平台,K8s ...
[大数据学习研究] 4. Zookeeper-分布式服务的协同管理神器
本来这一节想写Hadoop的分布式高可用环境的搭建,写到一半,发现还是有必要先介绍一下ZooKeeper这个东西. ZooKeeper理念介绍 ZooKeeper是为分布式应用来提供协同服务的,而且Z ...

安装高可用Hadoop生态 （四） 安装Spark

4. 安装Spark

4.1. 准备目录

4.2. 设置环境变量

4.3. 修改配置文件

4.3.1. spark-env.sh

4.3.2. spark-defaults.conf

4.4. 测试

4.5. 卸载

安装高可用Hadoop生态 （四） 安装Spark的更多相关文章

随机推荐

热门专题

安装高可用Hadoop生态（四）安装Spark

安装高可用Hadoop生态（四）安装Spark的更多相关文章