最新版spark1.1.0集群安装配置

和分布式文件系统和NoSQL数据库相比而言，spark集群的安装配置还算是比较简单的：

很多教程提到要安装java和scala，但我发现spark最新版本是包含scala的，JRE采用linux内嵌的版本也是可以的！

在主节点（bluejoe0）上安装spark1.1.0：

wget http://mirror.bit.edu.cn/apache/spark/spark-1.1.0/spark-1.1.0-bin-hadoop2.3.tgz

tar -zxvf spark-1.1.0-bin-hadoop2.3.tgz

ln -s spark-1.1.0-bin-hadoop2.3 spark
启动spark-shell：

cd /usr/local/spark/bin

./spark-shell

可以看到spark已经自带了scala 2.10：
输入测试程序：

scala> val data = Array(1, 2, 3, 4, 5)

data: Array[Int] = Array(1, 2, 3, 4, 5)

scala> val distData = sc.parallelize(data)

distData: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:14

scala> distData.reduce(_+_)
可以观察4040端口：
也可以测试PI的计算：

./bin/run-example SparkPi

14/11/23 16:08:25 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 1.008332384 s

Pi is roughly 3.1403
也可以采用spark-submit来提交任务：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master local[6] /usr/local/spark/lib/spark-examples-1.1.0-hadoop2.3.0.jar 1000

14/11/23 16:07:30 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 46.220537186 s

Pi is roughly 3.14172056
现在安装几个从节点，scp spark.tgz文件到其它节点，如：bluejoe4,bluejoe5,bluejoe9
注意设置好ssh无密码登录；
修改conf/slaves

# A Spark Worker will be started on each of the machines listed below.

bluejoe4

bluejoe5

bluejoe9
在bluejoe0上启动spark集群：

./sbin/start-all.sh

此时可以在浏览器上观察到3个从节点的情况：
再测试在集群上计算PI的程序：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://bluejoe0:7077 /usr/local/spark/lib/spark-examples-1.1.0-hadoop2.3.0.jar 1000

14/11/23 16:05:00 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 26.322514766 s

Pi is roughly 3.14159516

此时观察浏览器的显示：

随机推荐

浅谈 html- table换行
这么久都没有来发表点总结了,看了园里的盆友发表的文章中,我发现自己也长进了不少. 但是,最近两天遇见了一个比较棘手的问题,就是在做web页面时,我用了一个table,这个页面是要供手机端调用的,所以在 ...
[C++]VAssistX函数添加注释功能设置
问题情况:每次手写注释太慢,而且不系一.问题原因:C++可以利用宏写注释,也可以使用VAssistX提供的方法.问题处理:1.安装VAssistX在VS2010上 2.VS2010菜单->VAs ...
mssql游标demo
declare @billIds varchar(400) declare @billId varchar(40) DECLARE c1 CURSOR FOR select top 5 SaleNo ...
Web- 一些标签样式
网上找来的.有点用 1.只有下划线的文本框:<input style="border:0;border-bottom:1 solid black;background:;"& ...
java 对视频和图片进行加密解密
import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java. ...
怎样通过iPhone Safari 来安装测试版ipa
http://www.cocoachina.com/bbs/read.php?tid=94101# <?xml version="1.0" encoding="UT ...
理解C++ 宏
1.什么是宏,它解决什么问题? 宏的本质是文本替换,考虑下面的需求,程序中多次使用圆周率Pi,在每个地方都使用3.1415,显然很愚蠢.有没有好的办法呢?使用宏,如下: #define Pi 3.14 ...
Java算法实例集合（2）
这是Standford一位计算机老师的私藏,里面包含了不少Java/C++的算法实现代码.有兴趣的朋友可以看看.
Android 屏幕画笔实现
Tuya.rar
C 栈链式存储
#ifndef _MY_LINKSTACK_H_ #define _MY_LINKSTACK_H_ typedef void LinkStack; LinkStack* LinkStack_Creat ...

最新版spark1.1.0集群安装配置

最新版spark1.1.0集群安装配置的更多相关文章

随机推荐

热门专题