Spark在集群中的安装

今天由于所以要安装spark做一些实验。我已有的环境是：

操作系统：CentOS6.5

hadoop：hadoop2.4.1

JDK：1.7

集群环境：四个节点

闲话不说，以下是我的安装步骤：

说明：下边的这些安装都是先在master节点上安装。安装完成后将scala和spark传到其他节点。

Spark采用的是sala语言编写的，需要依赖scala的。所以首先需要安装scala

安装scala

下载地址：http://www.scala-lang.org/download/ 我这里下载的是最新的2.11.4版本

解压：tar -zxvf scala-2.11.4.tgz

配置环境变量：

vi /etc/profile

添加

export SCALA_HOME=/hadoop/scala-2.11.4

export PATH=$PATH:$SCALA_HOME/bin

生效 source /etc/profile

很简单，scala就安装好了（虽然我不会用，没接触过啊~~~~~）

安装Spark

下载：http://spark.apache.org/downloads.html

要选择与自己集群对用的下载

解压：tar -zxvf <安装包>

配置环境变量（这部可选，主要就是方便打开）

export SPARK_HOME=/hadoop/spark-1.1.0-bin-hadoop2.4

export PATH=$PATH:$SCALA_HOME/bin:$SPARK_HOME/bin

环境变量生效

配置Spark

进入到spark的conf中：cd /hadoop/spark-1.1.0-bin-hadoop2.4/conf

修改slaves，添加你的spark节点，我这里添加了三个

Master.domain.dev

Slave1.domain.dev

Slave2.domain.dev

cp spark-env.sh.template spark-env.sh

修改spark-env.sh，添加

export HADOOP_HOME=/usr/lib/hadoop

export JAVA_HOME=/usr/jdk64/jdk1.7.0_45

export SCALA_HOME=/hadoop/scala-2.11.4

master节点spark配置完成，很简单吧，接下来只需要把spark和scala的安装目录拷贝到slave1和salve2节点就可以了。需要注意的是，拷贝过去后的目录和master中的目录一样。

scp -r scala-2.11.4/ slave2:/hadoop/

scp -r spark-1.1.0-bin-hadoop2.4/ slave2:/hadoop/

拷贝成功后需要配置一下slave1和slave2节点中的环境变量，也就是配置/etc/profile文件。

大功告成，开始启动吧~~~~~~~~~~

测试spark

启动spark：spark-all.sh

哈哈，没报错，一次启动成功。

jps一下，会看到多出两个进程Master和Worker。

在其他两个节点中只有Worker进程的。

用一个例子跑一下吧。

我这里跑了一个WordCount的例子。跑例子前先在hdfs中存一个文件。

启动Spark-Shell

scala>val file = sc.textFile("hdfs://master:8020/testdata/input/README.md")

scala>val count = file.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey(_+_)

scala> count.collect()

运行这三天语句之后你会神奇的发现竟然出结果了。对scala语言不太了解，就不具体讲解了。要想深入学习spark，必须要先学习scala啊。

Spark在集群中的安装的更多相关文章

Hadoop实战1：MapR在ubuntu集群中的安装
由于机器学习算法在处理大数据处理的时候在所难免的会效率降低,公司需要搭建hadoop集群,最后采用了商业版的Hadoop2(MapR). 官网: http://doc.mapr.com/display ...
安装spark ha集群
安装spark ha集群 1.默认安装好hadoop+zookeeper 2.安装scala 1.解压安装包 tar zxvf scala-2.11.7.tgz 2.配置环境变量 vim /etc/p ...
Spark新手入门——3.Spark集群(standalone模式)安装
主要包括以下三部分,本文为第三部分: 一. Scala环境准备查看二. Hadoop集群(伪分布模式)安装查看三. Spark集群(standalone模式)安装 Spark集群(standalo ...
Spark新手入门——2.Hadoop集群(伪分布模式)安装
主要包括以下三部分,本文为第二部分: 一. Scala环境准备查看二. Hadoop集群(伪分布模式)安装三. Spark集群(standalone模式)安装查看 Hadoop集群(伪分布模式 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十七）：kafka manager安装
一.kafka-manager简介为了简化开发者和服务工程师维护Kafka集群的工作,yahoo构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager.这个管理工具可以很容 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十一）NIFI1.7.1安装
一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120 master 192.168.0.121 slave1 192.168.0.122 sla ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十七）Elasticsearch-6.2.2集群安装，组件安装
1.集群安装es ES内部索引原理: <时间序列数据库的秘密(1)—— 介绍> <时间序列数据库的秘密 (2)——索引> <时间序列数据库的秘密(3)——加载和分布式计算 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（九）安装kafka_2.11-1.1.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...

随机推荐

hdu 3944 DP? 组合数取模(Lucas定理+预处理+帕斯卡公式优化)
DP? Problem Description Figure 1 shows the Yang Hui Triangle. We number the row from top to bottom 0 ...
2016041601 - linux上安装maven
在linux系统中安装maven,个人目前使用ubuntu15.1系统. 要想使用maven,前提条件必须配置好java. 1.检查java信息. 命令:echo $JAVA_HOME 和java - ...
windows下使用eclipse调试C程序
一.环境描述 Eclipse IDE for C/C++ Developers version 4.4.0 MinGW gcc/g++ version 4.8.1;gdb version 7.6.1 ...
SQL2008附加数据库提示错误:5120
前几天在附加数据库时,出现了这个错误在win7 x64系统上使用sql2008进行附加数据库(包括在x86系统正在使用的数据库文件,直接拷贝附加在X64系统中)时,提示无法打开文 ...
H5动画优化之路
H5动画60fps之路在移动端,和Native相比,H5一直都被人吐槽性能差,尤其是在动画方面. 谈到整个Web app的生命周期,一般分为四个部分: 加载等待用户响应用户动画一般情况下,首 ...
shell 练习
shell 练习 iii= ] do iii=$[$iii+] echo -n "$iii " done iii= ] do iii=$[$iii+] echo -n " ...
小米MIUI 360wifi掉线解决方案落雨
问: 360WIFI 小米WIFI 联网无网速的解决办法方法1.退出电脑和手机上的360安全卫士(我抱着试试的态度退出了之后,我艹,速度立马有了!),估计是这些安全软件太强大,导致的. 方法2.我用 ...
网上测试了很多关于PYTHON的WEBSOCKET样例，下面这个才成功了
这是最底层的, 嘿嘿,我还是习惯搞个框架来实现急需要的功能... 这个东东玩得很有意思的.. 服务器端的代码: import simplejson import socket import sys ...
利用ZABBIX的RPC-JSON作API扩展应用示例
计划将ZABBIX的一些状态可以在另一个应用的显示GRAPH及链接. 故而在网上找了几个文档,作了一个测试. https://www.zabbix.com/documentation/2.4/manu ...
android usb host 读写USB设备
自android3.1以后android增加了操作USB设备的API. 官网地址:http://developer.android.com/guide/topics/connectivity/usb/ ...

Spark在集群中的安装

Spark在集群中的安装的更多相关文章

随机推荐

热门专题