spark 1.1.0 单机与yarn部署

环境：ubuntu 14.04, jdk 1.6, scala 2.11.4, spark 1.1.0, hadoop 2.5.1

一 spark 单机模式

部分操作参考：http://www.cnblogs.com/chenfool/p/3858930.html，我之前写的spark 1.0.1部署

1 安装scala，具体操作参考我之前的博文

2 解压spark1.1.0包，这里我下载的是编译好的包，spark-1.1.0-bin-hadoop2.4.tgz

tar -zxvf spark-1.1.-bin-hadoop2..tgz

3 拷贝一下conf/spark-env.sh.template文件，改名为spark-env.sh，修改配置文件

export HADOOP_HOME=/opt/hadoop-2.5.

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SCALA_HOME=/opt/scala-2.11.

export SPARK_MASTER_IP=spark

export JAVA_HOME=/opt/jdk1..0_45

SPARK_EXECUTOR_INSTANCES=

SPARK_EXECUTOR_CORES=

SPARK_EXECUTOR_MEMORY=1G

SPARK_DRIVER_MEMORY=1G

SPARK_YARN_APP_NAME="Spark 1.1.0"

4 修改conf/slaves 文件，添加slave节点的hosname

spark

5 启动spark， jps 检查是否启动成功

sbin/start-all.sh

17400 Jps

15569 DataNode

17111 Master

15800 ResourceManager

15927 NodeManager

17333 Worker

15440 NameNode

这个列表里包含了hadoop的相关进程，spark的进程时Master 和 Worker进程

6 运行计算PI值的测试用例

bin/run-example SparkPi

测试通过，证明部署成功

二 Yarn部署模式

其实这个模式更简单，将单机的spark进程停止后，直接就能使用yarn来跑spark的程序了

运行wordcount程序

SPARK_JAR="/opt/spark-1.1.0-bin-hadoop2.4/lib/spark-assembly-1.1.0-hadoop2.4.0.jar" \

./bin/spark-class org.apache.spark.deploy.yarn.Client \

--jar /opt/spark-1.1.-bin-hadoop2./lib/spark-examples-1.1.-hadoop2.4.0.jar \

--class org.apache.spark.examples.JavaWordCount \

--args hdfs://hadoop:9000/test/in/test.txt \

--num-executors  \

--executor-cores  \

--driver-memory 1024M \

--executor-memory 1000M \

--name "word count on spark"

运行计算PI值

./bin/spark-submit --class org.apache.spark.examples.SparkPi \

    --master yarn-cluster \

    --num-executors  \

    --driver-memory 1g \

    --executor-memory 1g \

    --executor-cores  \

    lib/spark-examples*.jar \

在hadoop的yarn页面能看到运行结果

spark 1.1.0 的单机部署，参考我之间的博客：http://www.cnblogs.com/chenfool/p/3858930.html

spark 1.1.0 单机与yarn部署的更多相关文章

Spark 1.3.0 单机安装
一.试验环境: CentOS6.6 最小化安装:主机名spark-test,IP:10.10.10.26 OpenStack虚拟云主机. 注:安装流程:进入linux->安装JDK->安装 ...
【Spark学习】Spark 1.1.0 with CDH5.2 安装部署
[时间]2014年11月18日 [平台]Centos 6.5 [工具]scp [软件]jdk-7u67-linux-x64.rpm spark-worker-1.1.0+cdh5.2.0+56-1.c ...
hadoop入门（3）——hadoop2.0理论基础：安装部署方法
一.hadoop2.0安装部署流程 1.自动安装部署:Ambari.Minos(小米).Cloudera Manager(收费) 2.使用RPM包安装部署:Apache ...
Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎 ...
Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
Spark 编程指南概述 Spark 依赖初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合外部 Datasets(数据集) RDD 操作基础传递 Functio ...
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingContext Discretized Streams (DStreams)(离散化流) Inp ...
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门起始点: SparkSession ...
Hadoop概念学习系列之谈hadoop/spark里为什么都有，YARN呢？（四十一）
在Hadoop集群里,有三种模式: 1.本地模式 2.伪分布模式 3.全分布模式在Spark集群里,有四种模式: 1.local单机模式结果xshell可见: ./bin/spark-submit ...
Spark（一）-- Standalone HA的部署
首先交代一下集群的规模和配置集群有六台机器,均是VM虚拟机,每台256M的内存(原谅楼主物理机硬件不太给力) 主机名分别是cloud1~cloud6 每台机器上都装有jdk6,和hadoop-2.2 ...

随机推荐

开源流媒体服务器EasyDarwin支持epoll网络模型,大大提升流媒体服务器网络并发性能
经过春节前后将近2个月的开发和稳定调试.测试,EasyDarwin开源流媒体服务器终于成功将底层select网络模型修改优化成epoll网络模型,将EasyDarwin流媒体服务器在网络处理的效率上提 ...
java基础知识查漏二
一.java基本数据类型所占的内存大小在Java中一共有8种基本数据类型,其中有4种整型,2种浮点类型,1种用于表示Unicode编码的字符单元的字符类型和1种用于表示真值的boolean类型.( ...
九度OJ 1110：小白鼠排队（排序）
时间限制:1 秒内存限制:32 兆特殊判题:否提交:1734 解决:1054 题目描述: N只小白鼠(1 <= N <= 100),每只鼠头上戴着一顶有颜色的帽子.现在称出每只白鼠的 ...
Linux环境下安装ActiveMq
一.准备安装的tar包 1.将安装包放在服务器上:apache-activemq-5.10.2.tar.gz 2.将安装包解压:tar -zxvf apache-activemq-5.10.2.tar ...
《打造Facebook》
王淮的<打造Facebook>一书不厚,花半天时间轻松读完.书中没有大段的说教,只有近乎流水的陈述.正如作者所说,打造Facebook这本书由巴克伯格来写再合适不过.可惜他至少在近几年内没 ...
jni native macOS
参考自:http://mrjoelkemp.com/2012/01/getting-started-with-jni-and-c-on-osx-lion/ 1 ,创建HelloWorld,如: 说明: ...
《unix环境高级编程》学习笔记【原创】
本文基于unix环境高级编程的学习的笔记,写的比较简如有不对,欢迎指点. 简单的描述下面函数的功能改变ctr+c信号原本的作用终止程序,在按下中断键的时候输出一句话. while循环主要读取用户的输入 ...
HDU4848 Wow! Such Conquering! —— dfs + 剪枝
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4848 题解: 一开始读错题目.以为每个点只能访问一遍.其实只要每个点都有被访问就可以了. 首先是用弗洛 ...
zkui部署
1.拉取代码 #git clone https://github.com/DeemOpen/zkui.git 2.构建并安装程序 #cd zkui/ #yum install -y maven #mv ...
谈谈javaScript
谈谈javaScript (杰我学习) 一. 什么是JavaScript 人们通常所说的JavaScript,其正式名称为ECMAScript.这个标准由ECMA组织发展和维护.ECMA ...

spark 1.1.0 单机与yarn部署

spark 1.1.0 单机与yarn部署的更多相关文章

随机推荐

热门专题