Spark 集群搭建

0. 说明

　　Spark 集群搭建

　　【集群规划】

服务器主机名	ip	节点配置
s101	192.168.23.101	Master
s102	192.168.23.102	Worker
s103	192.168.23.103	Worker
s104	192.168.23.104	Worker

1. Spark 集群搭建

　　1.0 前提

　　完成 Spark 单节点的安装，参照 Spark 基本概念 & 安装安装部分

　　基于 Hadoop 完全分布式集群

　　1.1 配置 JAVA_HOME 环境变量

# 复制 spark-env.sh
cd /soft/spark/conf
cp spark-env.sh.template spark-env.sh

# 配置 JAVA_HOME 环境变量

nano spark-env.sh

export JAVA_HOME=/soft/jdk

　　1.2 在 Spark 的 conf 目录下创建 Hadoop 的 core-site.xml 和 hdfs-site.xml 符号连接

ln -s /soft/hadoop/etc/hadoop/core-site.xml /soft/spark/conf/core-site.xml

ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml /soft/spark/conf/hdfs-site.xml

　　1.3 修改 slaves 文件

# 复制 slaves
cd /soft/spark/conf
cp slaves.template slaves

# 修改 slaves 文件

nano  slaves

s102

s103

s104

　　1.4 分发 Spark

# 分发 Spark 符号链接

xsync.sh /soft/spark

# 分发 Spark 安装目录

xsync.sh /soft/spark-2.1.-bin-hadoop2.

　　1.5 分发环境变量

# 切换 root 用户
su root

# 分发环境变量配置文件

xsync.sh /etc/profile

# 退出 root 用户

exit

　　1.6 生效环境变量

# 分别在s102-s104生效环境变量

source /etc/profile

2. 启动 Spark 集群

　　2.1 启动 ZooKeeper

# 在 s101 执行

xzk.sh start

　　2.2 启动 HDFS

start-dfs.sh

　　2.3 启动 Spark

# 进入目录

cd /soft/spark/sbin

# 启动

./start-all.sh

　　2.4 进入 Spark 的 Web UI
　　http://s101:8080

　　2.5 上传文件到 HDFS 中

　　文件内容为以空格分隔的文本。

hdfs dfs -put wc1.txt /

　　2.6 启动 spark shell，连接到 Spark 集群

# 启动 spark shell，连接到 Spark 集群

spark-shell --master spark://s101:7077

# 测试

sc.textFile("/wc1.txt").flatMap(_.split(" ")).map((_,)).reduceByKey(_+_).collect()

3. 配置 s105 作为 Client [可选]

　　【说明】

　　配置 s105 作为 Cluster 模式提交 Spark job

　　【过程】

　　参照以上步骤完成，在有需要的时候配置

Spark 集群搭建的更多相关文章

（四）Spark集群搭建-Java&Python版Spark
Spark集群搭建视频教程 1.优酷 2.YouTube 安装scala环境下载地址http://www.scala-lang.org/download/ 上传scala-2.10.5.tgz到m ...
Spark集群搭建简要
Spark集群搭建 1 Spark编译 1.1 下载源代码 git clone git://github.com/apache/spark.git -b branch-1.6 1.2 修改pom文件 ...
Spark集群搭建简配+它到底有多快？【单挑纯C/CPP/HADOOP】
最近耳闻Spark风生水起,这两天利用休息时间研究了一下,果然还是给人不少惊喜.可惜,笔者不善JAVA,只有PYTHON和SCALA接口.花了不少时间从零开始认识PYTHON和SCALA,不少时间答了 ...
Spark集群搭建中的问题
参照<Spark实战高手之路>学习的,书籍电子版在51CTO网站资料链接 Hadoop下载[链接](http://archive.apache.org/dist/hadoop/core/ ...
Spark集群搭建_Standalone
2017年3月1日, 星期三 Spark集群搭建_Standalone Driver: node1 Worker: node2 Worker: node3 1.下载安装下载地址 ...
Spark集群搭建_YARN
2017年3月1日, 星期三 Spark集群搭建_YARN 前提:参考Spark集群搭建_Standalone 1.修改spark中conf中的spark-env.sh 2.Spark on ...
spark集群搭建
文中的所有操作都是在之前的文章scala的安装及使用文章基础上建立的,重复操作已经简写: 配置中使用了master01.slave01.slave02.slave03: 一.虚拟机中操作(启动网卡)s ...
hadoop+spark集群搭建入门
忽略元数据末尾回到原数据开始处 Hadoop+spark集群搭建说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
Spark集群搭建（local、standalone、yarn）
Spark集群搭建 local本地模式下载安装包解压即可使用,测试(2.2版本)./bin/spark-submit --class org.apache.spark.examples.SparkP ...

随机推荐

Makefile中.PHONY的作用
单词phony (即phoney)的意思是:伪造的,假的.来自collins的解释是: If you describe something as phoney, you disapprove of i ...
最短路径算法----floyd（转）
一.Floyd算法假设从i到j的最短路径上要经过若干个顶点,这些中间顶点中最大的顶点编号为k,最小的顶点为t,因此要求算dist[i][j]的最小值,那么只需要求算dist[i][s]+dist[s ...
Java 8 新特性-菜鸟教程 (3) -Java 8 函数式接口
Java 8 函数式接口函数式接口(Functional Interface)就是一个有且仅有一个抽象方法,但是可以有多个非抽象方法的接口. 函数式接口可以被隐式转换为lambda表达式. 函数式接 ...
Java转义emoji等特殊符号
写在前面网上找了很多转emoji等方法,大多有两种方法更改数据库编码格式为utf8mb4 过滤字符串中的emoji 都不是很优雅更改数据库编码,势必影响其他数据库过滤emoj效率比较低处理E ...
开源方案搭建可离线的精美矢量切片地图服务-8.mapbox 之sprite大图图标文件生成（附源码）
项目成果展示(所有项目文件都在阿里云的共享云虚拟主机上,访问地图可以会有点慢,请多多包涵). 01:中国地图:http://test.sharegis.cn/mapbox/html/3china.ht ...
JAVA里的VO、BO、PO分别指什么？
VO(value object) 值对象通常用于业务层之间的数据传递,和PO一样也是仅仅包含数据而已.但应是抽象出的业务对象,可以和表对应,也可以不,这根据业务的需要.个人觉得同DTO(数据传输对象 ...
HTTPS知识小结
HTTPS知识小结背景1:TCP握手 internet上的两台机器A,B要建立起HTTP连接了,在这之前要先建立TCP连接,情景大概是这样子的: A:你好,我跟你建立一个TCP好吗? B:好啊. A ...
Java中异常发生时代码执行流程
异常与错误: 异常: 在Java中程序的错误主要是语法错误和语义错误,一个程序在编译和运行时出现的错误我们统一称之为异常,它是VM(虚拟机)通知你的一种方式,通过这种方式,VM让你知道,你(开发人员) ...
C# Web 数据注解Data Annotations、模型状态ModelState、数据验证
C#中的模型状态与数据注解,为我们提供了很便利的请求数据的验证. 1. ModelState ModelState在进行数据验证的时候很有用的,它是: 1)验证数据,以及保存数据对应的错误信息. 2) ...
[C#]使用RabbitMQ模拟抽奖系统的例子
背景:在实际的项目中,经常有客户需要做抽奖的活动,大部分的都是注册送产品.送红包这些需求.这都是有直接的利益效果,所以经常会遇见系统被盗刷的情况,每一次遇见这种项目的上线都是绷紧神经,客户又都喜欢在过 ...

Spark 集群搭建

0. 说明

1. Spark 集群搭建

2. 启动 Spark 集群

3. 配置 s105 作为 Client [可选]

Spark 集群搭建的更多相关文章

随机推荐

热门专题