Spark安装部署

原创文章，转载请注明：转载自www.cnblogs.com/tovin/p/3820979.html

一、系统环境配置

　　参照http://www.cnblogs.com/tovin/p/3818908.html文章的第一、二部分配置好基本环境

　　在集群所有节点下载并解压spark的安装包：

　　　　su hdp

　　　　cd /home/hdp

　　　　wget http://d3kbcqa49mib13.cloudfront.net/spark-1.0.0-bin-hadoop2.tgz

　　　　sudo mv /home/hdp/spark-1.0.0-bin-hadoop2.tgz /usr/local/

　　　　cd /usr/local/

　　　　sudo tar zxvf spark-1.0.0-bin-hadoop2.tgz

　　　　sudo ln -s spark-1.0.0-bin-hadoop2 spark

　　　　sudo chown -R hdp:hdp spark-1.0.0-bin-hadoop2

　　　　sudo rm -rf spark-1.0.0-bin-hadoop2.tgz

二、Spark部署（spark standalone模式）

　　以node01为master节点，node02、node03为slave节点安装为例说明：

　　1、修改集群所有节点spark环境配置文件
   　　　cd /usr/local/spark/conf/
   　　　mv spark-env.sh.template spark-env.sh
   　　vim spark-env.sh 添加如下内容：　　　　　　

　　　　上面参数可以根据机器实际资源情况进行设置其中：
       　　　　SPARK_WORKER_CORES表示每个Worker进程使用core数目
              　 SPARK_WORKER_MEMORY表示每个Worker进程使用内存
           　　　 SPARK_WORKER_INSTANCES表示每台机器Worker数目

　　2、启动集群

　　　　 /usr/local/spark/sbin/start-all.sh

　　3、验证集群是否启动成功

　　　 node01节点：（出现Master进程）
　　

　　node02节点：（出现Worker进程）
　　

　　 node03节点：（出现Worker进程）
　　

4、集群web ui
　　访问http://node01:8080查看集群管理页面

　　5、执行SparkPi测试程序

　　　　/usr/local/spark/bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://node01:7077 /usr/local/spark/lib/spark-examples-1.0.0-hadoop2.2.0.jar

　　　　注意：红色node01必须与配置文件中配置的SPARK_MASTER_IP保持一样，否则会出现问题

三、Spark部署（spark on yarn模式）

　　此模式部署只需要把安装包解压放到yarn集群所有机器即可

　　Client Driver部署：

　　　　1、下载spark、hadoop安装包
       　　　　参照系统环境配置部分进行设置
   　　　2、修改配置文件
       　　　　hadoop配置文件使用与集群一致的文件
       　　　　su hdp
       　　　　cd /usr/local/spark

　　　　 vim conf/spark-env.sh添加内容

　　　　　　3、spark测试程序
　　　　　　 /usr/local/spark/bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster /usr/local/spark/lib/spark-examples-1.0.0-hadoop2.2.0.jar

原创文章，转载请注明：转载自www.cnblogs.com/tovin/p/3820979.html

Spark安装部署的更多相关文章

Spark安装部署（local和standalone模式）
Spark运行的4中模式: Local Standalone Yarn Mesos 一.安装spark前期准备 1.安装java $ sudo tar -zxvf jdk-7u67-linux-x64 ...

Spark 安装部署与快速上手
Spark 介绍核心概念 Spark 是 UC Berkeley AMP lab 开发的一个集群计算的框架,类似于 Hadoop,但有很多的区别. 最大的优化是让计算任务的中间结果可以存储在内存中, ...

Spark安装部署| 运行模式
Spark 一种基于内存的快速.通用.可扩展的大数据分析引擎: 内置模块: Spark Core(封装了rdd.任务调度.内存管理.错误恢复.与存储系统交互): Spark SQL(处理结构化数据). ...

spark2.10安装部署（集成hadoop2.7+）
这里默认你的hadoop是已经安装好的,master是node1,slaver是node2-3,hdfs启动在node1,yarn启动在node2,如果没安装好hadoop可以看我前面的文章因为这里 ...

【Spark学习】Spark 1.1.0 with CDH5.2 安装部署
[时间]2014年11月18日 [平台]Centos 6.5 [工具]scp [软件]jdk-7u67-linux-x64.rpm spark-worker-1.1.0+cdh5.2.0+56-1.c ...

Spark、Shark集群安装部署及遇到的问题解决
1.部署环境 OS:Red Hat Enterprise Linux Server release 6.4 (Santiago) Hadoop:Hadoop 2.4.1 Hive:0.11.0 JDK ...

使用docker安装部署Spark集群来训练CNN（含Python实例）
使用docker安装部署Spark集群来训练CNN(含Python实例) http://blog.csdn.net/cyh_24/article/details/49683221 实验室有4台神服务器 ...

【原创 Hadoop&Spark 动手实践 1】Hadoop2.7.3 安装部署实践
目录: 第一部分:操作系统准备工作: 1. 安装部署CentOS7.3 1611 2. CentOS7软件安装(net-tools, wget, vim等) 3. 更新CentOS7的Yum源,更新软 ...

Spark介绍及安装部署
一.Spark介绍 1.1 Apache Spark Apache Spark是一个围绕速度.易用性和复杂分析构建的大数据处理框架(没有数据存储).最初在2009年由加州大学伯克利分校的AMPLab开 ...

随机推荐

如何在Ubuntu下使用TF/SD 卡制作Exynos 4412 u-boot启动盘
/** ****************************************************************************** * @author Maox ...

2013-07-23 IT 要闻速记快想
### ========================= ###苹果的新动向今天华尔街日报称,苹果正在测试13英寸的大号iPad,以及更大屏幕的iPhone.而早在五月份,韩国资讯网站 ET New ...

logstash 统计告警
在实际的项目中需要对线上日志做实时分析跟统计,这一套方案可以用现有的ELK(ElasticSearch, Logstash, Kibana)方案既可以满足,关于这个方案的具体的步骤可以参考网上的解决方 ...

require.js入门指南(二)
*:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !important; } /* ...

用Python作GIS之四：Tkinter基本界面的搭建
Python下的主窗口可以定义如下:def start(self): #self.project = Project("temp") #self.pro ...

Apache网站根目录
Apache环境配置好了,把项目放到网站根目录下的htdocs文件夹下,运行网站的时候不需要加上该文件夹的名称,Apache直接在上面找对应的项目

margin-top相对谁的问题
根据规范,一个盒子如果没有上补白(padding-top)和上边框(border-top),那么这个盒子的上边距会和其内部文档流中的第一个子元素的上边距重叠.意思便是:如果你只想margin相对于父标 ...

How to Implement Bluetooth Low Energy (BLE) in Ice Cream Sandwich
ShareThis - By Vikas Verma Bluetooth low energy (BLE) is a feature of Bluetooth 4.0 wireless radio t ...

C#之多态
多态是面向对象编程中三大机制之一,其原理建立在"从父类继承而来的子类可以转换为其父类"这个规则之上,换句话说,能用父类的地方,就能用该类的子类.当从父类派生了很多子类时,由于每个子 ...

【Leetcode】 - Divide Two Integers 位运算实现整数除法
实现两个整数的除法,不许用乘法.除法和求模.题目被贴上了BinarySearch,但我没理解为什么会和BinarySearch有关系.我想的方法也和BS一点关系都没有. 很早以前我就猜想,整数的乘法是 ...

Spark安装部署

Spark安装部署的更多相关文章

随机推荐

热门专题