Spark 集群搭建

0. 说明

　　Spark 集群搭建

　　【集群规划】

服务器主机名	ip	节点配置
s101	192.168.23.101	Master
s102	192.168.23.102	Worker
s103	192.168.23.103	Worker
s104	192.168.23.104	Worker

1. Spark 集群搭建

　　1.0 前提

　　完成 Spark 单节点的安装，参照 Spark 基本概念 & 安装安装部分

　　基于 Hadoop 完全分布式集群

　　1.1 配置 JAVA_HOME 环境变量

# 复制 spark-env.sh
cd /soft/spark/conf
cp spark-env.sh.template spark-env.sh

# 配置 JAVA_HOME 环境变量

nano spark-env.sh

export JAVA_HOME=/soft/jdk

　　1.2 在 Spark 的 conf 目录下创建 Hadoop 的 core-site.xml 和 hdfs-site.xml 符号连接

ln -s /soft/hadoop/etc/hadoop/core-site.xml /soft/spark/conf/core-site.xml

ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml /soft/spark/conf/hdfs-site.xml

　　1.3 修改 slaves 文件

# 复制 slaves
cd /soft/spark/conf
cp slaves.template slaves

# 修改 slaves 文件

nano  slaves

s102

s103

s104

　　1.4 分发 Spark

# 分发 Spark 符号链接

xsync.sh /soft/spark

# 分发 Spark 安装目录

xsync.sh /soft/spark-2.1.-bin-hadoop2.

　　1.5 分发环境变量

# 切换 root 用户
su root

# 分发环境变量配置文件

xsync.sh /etc/profile

# 退出 root 用户

exit

　　1.6 生效环境变量

# 分别在s102-s104生效环境变量

source /etc/profile

2. 启动 Spark 集群

　　2.1 启动 ZooKeeper

# 在 s101 执行

xzk.sh start

　　2.2 启动 HDFS

start-dfs.sh

　　2.3 启动 Spark

# 进入目录

cd /soft/spark/sbin

# 启动

./start-all.sh

　　2.4 进入 Spark 的 Web UI
　　http://s101:8080

　　2.5 上传文件到 HDFS 中

　　文件内容为以空格分隔的文本。

hdfs dfs -put wc1.txt /

　　2.6 启动 spark shell，连接到 Spark 集群

# 启动 spark shell，连接到 Spark 集群

spark-shell --master spark://s101:7077

# 测试

sc.textFile("/wc1.txt").flatMap(_.split(" ")).map((_,)).reduceByKey(_+_).collect()

3. 配置 s105 作为 Client [可选]

　　【说明】

　　配置 s105 作为 Cluster 模式提交 Spark job

　　【过程】

　　参照以上步骤完成，在有需要的时候配置

Spark 集群搭建的更多相关文章

（四）Spark集群搭建-Java&Python版Spark
Spark集群搭建视频教程 1.优酷 2.YouTube 安装scala环境下载地址http://www.scala-lang.org/download/ 上传scala-2.10.5.tgz到m ...
Spark集群搭建简要
Spark集群搭建 1 Spark编译 1.1 下载源代码 git clone git://github.com/apache/spark.git -b branch-1.6 1.2 修改pom文件 ...
Spark集群搭建简配+它到底有多快？【单挑纯C/CPP/HADOOP】
最近耳闻Spark风生水起,这两天利用休息时间研究了一下,果然还是给人不少惊喜.可惜,笔者不善JAVA,只有PYTHON和SCALA接口.花了不少时间从零开始认识PYTHON和SCALA,不少时间答了 ...
Spark集群搭建中的问题
参照<Spark实战高手之路>学习的,书籍电子版在51CTO网站资料链接 Hadoop下载[链接](http://archive.apache.org/dist/hadoop/core/ ...
Spark集群搭建_Standalone
2017年3月1日, 星期三 Spark集群搭建_Standalone Driver: node1 Worker: node2 Worker: node3 1.下载安装下载地址 ...
Spark集群搭建_YARN
2017年3月1日, 星期三 Spark集群搭建_YARN 前提:参考Spark集群搭建_Standalone 1.修改spark中conf中的spark-env.sh 2.Spark on ...
spark集群搭建
文中的所有操作都是在之前的文章scala的安装及使用文章基础上建立的,重复操作已经简写: 配置中使用了master01.slave01.slave02.slave03: 一.虚拟机中操作(启动网卡)s ...
hadoop+spark集群搭建入门
忽略元数据末尾回到原数据开始处 Hadoop+spark集群搭建说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
Spark集群搭建（local、standalone、yarn）
Spark集群搭建 local本地模式下载安装包解压即可使用,测试(2.2版本)./bin/spark-submit --class org.apache.spark.examples.SparkP ...

随机推荐

Visual Studio自带的的Developer Command Prompt对话框
简单了解Visual Studio的Developer Command Prompt VS2008的命令为:Visual Studio 2008 Command Prompt 目录是: 其详细信息如下 ...
OopMap介绍
摘自:http://blog.csdn.net/woaigaolaoshi/article/details/51439227 在HotSpot中,对象的类型信息里有记录自己的OopMap,记录了在该类 ...
offsetTop、offsetLeft、offsetWidth、offsetHeight的用法
假设 obj 为某个 HTML 控件. obj.offsetTop 指 obj 相对于版面或由 offsetParent 属性指定的父坐标的计算上侧位置,整型,单位像素. obj.offsetLeft ...
go程序性能测量和分析
性能测量在很多情况之下,通过分析代码是很难确定某个模块性能好坏的.请看下面的例子,你觉得哪一个函数性能最优? //斐波那契数 package fib import "math" ...
android手机安全性测试手段
罗列一下自己常用的android手机安全性测试攻击手段: 1. fiddler和tcpdump+wireshark抓包分析,模拟修改http请求参数,检验漏洞 2. 修改AndroidManifest ...
SHA-1退休：数千万用户通向加密网站之路被阻
Facebook和Cloudflare警告道:上千万用户将无法访问只使用SHA-2签名证书的HTTPS网站.2016年-2017年是SHA-1算法的缓冲期.2017年开始CA机构将不能颁发含有sh ...
对datagridview进行增删改(B)
create DATABASE stu ON ( name='stu.mdf', filename='F:\胡浴东\数据库\stu数据库\stu.mdf', size=, filegrowth= ) ...
ADO.NET 【类库】【与数据库的连接】
ADO.NET是什么,有什么用数据库访问技术 ado.net可让开发人员以一致的方式存取资料来源, 资料共用的消费者应用程序可使用ado.net 来连接至这些资料来源,并且撷取.处理及更新其中所含的 ...
【Mysql】可视化工具
一.navicat 破解方法:http://www.jianshu.com/p/b1f9194e1e31 二. MySQL Workbench(GUI TOOL)一款专为MySQL设计的ER/数据库建 ...
wei
 JAVASCRIPT: <script charset="Shift_JIS" src=&q ...

Spark 集群搭建

0. 说明

1. Spark 集群搭建

2. 启动 Spark 集群

3. 配置 s105 作为 Client [可选]

Spark 集群搭建的更多相关文章

随机推荐

热门专题