centos7安装Scala、Spark(伪分布式)

centos7安装spark(伪分布式)

spark是由scala语言开发的，首先需要安装scala.

Scala安装

下载scala-2.11.8,（与spark版本要对应）

命令：wget https://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.tgz

解压到文件夹并配置环境变量

vim /etc/profile

#scala

export SCALA_HOME=/home/zck/software/scala

export PATH=$PATH:$SCALA_HOME/bin

使配置文件生效

测试：scala -version

配置伪分布式spark;

解压到文件夹并配置环境变量

vim /etc/profile

末尾添加以下内容

#spark

export SPARK_HOME=/home/zck/software/spark

export PATH=$SPARK_HOME/bin:$PATH测试

修改配置文件spark/conf/spark-env.sh

加入内容

export JAVA_HOME=/home/zck/software/jdk

export SCALA_HOME=/home/zck/software/scala

export HADOOP_HOME=/home/zck/software/hadoop

export HADOOP_CONF_DIR=/home/zck/software/hadoop/etc/hadoop

export SPARK_MASTER_IP=192.168.13.101

export SPARK_MASTER_PORT=7077

启动spark服务

进入spark文件夹，sbin/start-all.sh

然后再去浏览器看看

Spark yarn模式配置

1、修改hadoop配置文件yarn-site.xml,添加如下内容：

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

2、修改spark-env.sh，添加如下配置：

export YARN_CONF_DIR=/opt/module/hadoop-2.7.2/etc/hadoop

3、日志配置

修改配置文件spark-defaults.conf

添加如下内容：

spark.yarn.historyServer.address=hadoop102:18080

spark.history.ui.port=18080

4、重启spark历史服务

sbin/stop-history-server.sh

sbin/start-history-server.sh

Spark几种模式对比

模式	Spark安装机器数	需启动的进程	所属者
Local	1	无	Spark
Standalone	3	Master及Worker	Spark
Yarn	1	Yarn及HDFS	Hadoop

centos7安装Scala、Spark(伪分布式)的更多相关文章

ZooKeeper：win7上安装单机及伪分布式安装
zookeeper是一个为分布式应用所设计的分布式的.开源的调度服务,它主要用来解决分布式应用中经常遇到的一些数据管理问题,简化分布式应用,协调及其管理的难度,提高性能的分布式服务. 本章的目的:如何 ...
Hadoop的HDFS和MapReduce的安装（三台伪分布式集群）
一.创建虚拟机 1.从网上下载一个Centos6.X的镜像(http://vault.centos.org/) 2.安装一台虚拟机配置如下:cpu1个.内存1G.磁盘分配20G(看个人配置和需求,本人 ...
大数据：Hadoop（JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作）
所有的内容都来源与 Hadoop 官方文档一.Hadoop 伪分布式安装步骤 1)JDK安装解压:tar -zxvf jdk-7u79-linux-x64.tar.gz -C ~/app 添加到系 ...
Hadoop安装教程_伪分布式
文章更新于:2020-04-09 注1:hadoop 的安装及单机配置参见:Hadoop安装教程_单机(含Java.ssh安装配置) 注2:hadoop 的完全分布式配置参见:Hadoop安装教程_分 ...
Mac环境下安装配置Hadoop伪分布式
伪分布式需要修改5个配置文件(hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop) 第一个:hadoop-env.sh #vim hadoop-env.sh #第25行,由于新 ...
第5章选举模式和ZooKeeper的集群安装 5-2 单机伪分布式安装zookeeper集群
先搭建伪分布式集群,再去搭建真分布式集群.有些的人的电脑内存.性能比较低,所以在搭建真实的一个分布式环境的话,可能会相对来说比较卡,所以两种都会做一下,首先会在单机上搭建一个集群.单机上的集群主要就是 ...
Spark学习之路（五）Spark伪分布式安装
一.JDK的安装 JDK使用root用户安装 1.1 上传安装包并解压 [root@hadoop1 soft]# tar -zxvf jdk-8u73-linux-x64.tar.gz -C /usr ...
Spark学习之路（五）Spark伪分布式安装[转]
JDK的安装 JDK使用root用户安装上传安装包并解压 [root@hadoop1 soft]# tar -zxvf jdk-8u73-linux-x64.tar.gz -C /usr/local ...
spark伪分布式安装
一,在官网下载对应的版本http://spark.apache.org/downloads.html 二在linux中解压下来的spark包三:配置环境变量 (1)在/etc/profi ...

随机推荐

js原型补充
js定义函数: <script> function A() {} let a1 = new A(); let a2 = new A(); // 为A类添加原型 => 类似于类属性 A ...
Centos7静态ip设置（亲测有效）
本文引自:https://www.cnblogs.com/toov5/p/10340395.html,特此鸣谢最近想测试消息中间件等各类web集群相关技术,这就需要解决linux主机之间互联互通的若 ...
canvas drawImage图片不显示问题
初次学习canvas,用来做笔记记录下遇到的问题及解决方案这里是要将一张图片写到canvas里,按照网上搜索,初写了段代码,可是却没显示,以为是路径问题,不能跨域名使用,后来改为相对路径后,仍然无效 ...
Break 和 Continue 语句
break 语句用于跳出循环. continue 用于跳过循环中的一个迭代. 1.break关键字可以用来退出switch或循环语句不能在IF语句中使用break和continue 示例:在if ...
springbootdruidmybatismysql多数据源事务管理
springboot+druid+mybatis+mysql+多数据源事务管理分布式事务在java中的解决方案就是JTA(即Java Transaction API):springboot官方提供了 ...
Codeforces Round #346 (Div. 2) A题 [一道让我生气的思维题·]
A. Round House Vasya lives in a round building, whose entrances are numbered sequentially by integer ...
ubuntu配置pip3以及scrapy
.安装支持pip3 sudo apt-get install python3-pip .安装scrapy 首先需要安装scrapy依赖项,否则scrapy安装失败,执行如下命令: sudo apt-g ...
php shmop windows 信号量锁
if (!function_exists('sem_get')) { function sem_get($key) { return fopen(__FILE__ . '.sem.' . $key, ...
新版iTunes connect上传iOS应用
http://www.brianjcoleman.com/tutorial-distribute-apps-using-new-itunes-connect/ Recently Apple updat ...
【零基础】斯坦福四足机器人DIY指引
可以后空翻的机器狗近日斯坦福开源了一个四足机器人项目“Stanford Doggo”,“只需”3000美金就可以DIY一个能跳一米高兼后空翻的电子小狗,一段时间研究后我们写了这篇简单的指引帮助大家快 ...

centos7安装Scala、Spark(伪分布式)

Spark几种模式对比

centos7安装Scala、Spark(伪分布式)的更多相关文章

随机推荐

热门专题