spark1.6.0伪分布式搭建

环境：

　　hadoop2.6.0

　　jdk1.8

　　ubuntu 14.04 64位

1 安装scala环境

版本是scala-2.10.6，官网下载地址http://www.scala-lang.org/download/

然后配置scala的环境变量：sudo vim /etc/profile

export SCALA_HOME=/usr/scala/scala-2.10.

export PATH=$PATH:$SCALA_HOME/bin

执行命令source /etc/profile 让环境变量生效

scala检测：在任意目录执行scala -version，结果如下：

2 spark配置

首先下载spark的压缩包，官网下载地址http://spark.apache.org/downloads.html

按照上图所示选取，然后下载spark-1.6.0-bin-hadoop2.6.tgz压缩包

解压到安装目录下，比如我是解压到/usr/local目录下，并且重命名为spark

进入spark/conf目录，把 spark-env.sh.template文件复制并且重命名为 spark-env.sh，并且在文件末尾加上如下配置

export JAVA_HOME=/usr/java/jdk1.8.0_141

export SCALA_HOME=/usr/scala/scala-2.10.6

export SPARK_MASTER_IP=master

export SPARK_WORKER_CORES=2

export SPARK_WORKER_MEMORY=1g

export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

其中export SPARK_MASTER_IP是指master的ip，由于我是伪分布式搭建，ip就是本机，而我在hosts中配置过本机ip为master

然后把 slaves.template文件复制重命名为slaves，文件的默认内容是localhost，把localhost删除，并添加内容master

（如果是完全分布式，就要把每个salve中的spark-env.sh文件中的SPARK_MASTER_IP参数改成master的ip，把master和每个slave上的slaves文件内容写成每一行一个slave的ip地址）

以上就完成了，然后进行再打开hadoop的dfs和yarn的服务后，再spark的目录下，执行sbin/start-all.sh,就启动spark进程了，然后执行jps查看，如下图，多了Master和Worker两个进程，就说明ok了。

spark1.6.0伪分布式搭建的更多相关文章

bayaim_hadoop1_2.2.0伪分布式搭建
------------------bayaim_hadoop1_2.2.0伪分布式搭建_2018年11月06日09:21:46--------------------------------- 1. ...
hadoop2.4.0伪分布式搭建以及分布式关机重启后datanode没起来的解决办法
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip ...
hadoop2.2.0伪分布式搭建3--安装Hadoop
3.1上传hadoop安装包 3.2解压hadoop安装包 mkdir /cloud #解压到/cloud/目录下 tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/ 3 ...
hadoop2.2.0伪分布式搭建1--准备Linux环境
1.0修改网关点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:19 ...
hadoop2.2.0伪分布式搭建
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ...
Hadoop2.6.0伪分布式搭建
环境: 1.Ubuntu14.04 首先要在linux系统上新建一个账户,比如就叫做hadoop,用于专门运行hadoop. 2.配置jdk 我是使用的版本是jdk1.8. 解压:创建/usr/jav ...
hadoop2.2.0伪分布式搭建2--安装JDK
2.1上传FileZilla 上传 https://filezilla-project.org/ 2.2解压jdk #创建文件夹 mkdir /usr/java #解压 tar -zxvf jdk-7 ...
[b0006] Spark 2.0.1 伪分布式搭建练手
环境: 已经安装好: hadoop 2.6.4 yarn 参考: [b0001] 伪分布式 hadoop 2.6.4 准备: spark-2.0.1-bin-hadoop2.6.tgz 下载地址: ...
Spark2.4.0伪分布式环境搭建
一.搭建环境的前提条件环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161. spark-2.4.0-bin-hadoop2.6.这里的环境不一定需要和我一样,基本版 ...

随机推荐

iOS9全新的联系人相关框架——Contacts Framework
iOS9全新的联系人相关框架——Contacts Framework 一.引言在以前iOS开发中,涉及联系人相关的编程,代码都非常繁琐,并且框架的设计也不是Objective-C风格的,这使开发者用 ...
【TOJ 3369】CD（二分）
描述 Jack and Jill have decided to sell some of their Compact Discs, while they still have some value. ...
(搬运以学习)flask 上下文的实现
引言本文主要梳理了flask的current_app, request, session, g的实现原理源码说明本文使用flask 0.5 版本 application context 和req ...
全盘解决eclipse之maven项目报错
每次新建maven的web(war包方式)项目时都会报错而且都要手动改,很麻烦解决:(注意里面的jdk版本换成自己的) 改变maven配置文件 settings.xml 在文件的<prof ...
springmvc请求数据的流程。
验证了我说的,从model层中拿来的数据,不管什么类型,都是通过隐含模型,中转,放入request中的.除非你特意把这些数据放到session域中流程含义解释:(来自网友)(1)HTTP请求到达we ...
课时102.CSS精灵图（掌握）
我们这节课来介绍一个和背景图片相关的东西,精灵图 1.设么是css精灵图? css精灵图是一种图像合成技术 2.css精灵图作用可以减少请求的次数,以及可以降低服务器处理压力 3.如何使用css精灵 ...
Hadoop(15)-MapReduce框架原理-FileInputFormat的实现类
1. TextInputFormat 2.KeyValueTextInputFormat 3. NLineInputFormat
Hadoop(11)-MapReduce概述和简单实操
1.MapReduce的定义 2.MapReduce的优缺点优点缺点 3.MapReduce的核心思想 4.MapReduce进程 5.常用数据序列化类型 6.MapReduce的编程规范用户编 ...
JAVA 基础编程练习题
1 [程序 1 不死神兔] 题目:古典问题:有一对兔子,从出生后第 3 个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子对数为多少?程序分析: 兔子的规 ...
（数据科学学习手札29）KNN分类的原理详解&Python与R实现
一.简介 KNN(k-nearst neighbors,KNN)作为机器学习算法中的一种非常基本的算法,也正是因为其原理简单,被广泛应用于电影/音乐推荐等方面,即有些时候我们很难去建立确切的模型来描述 ...

spark1.6.0伪分布式搭建

spark1.6.0伪分布式搭建的更多相关文章

随机推荐

热门专题