spark on yarn 集群部署

概述

hadoop2.7.1

spark 1.5.1

192.168.31.62 resourcemanager, namenode, master

192.168.31.63 nodemanager, datanode, worker

192.168.31.64 nodemanager, datanode, worker

Hadoop配置

hadoop-env.sh mapred-env.sh yarn-env.sh至少配置JAVA_HOME

core-site.xml

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://192.168.31.62:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>file:/opt/local/hadoop/tmp</value>

        </property>

        <property>

                <name>io.file.buffer.size</name>

                <value></value>

        </property>

        <property>

                <name>hadoop.native.lib</name>

                <value>true</value>

        </property>

hdfs-site.xml

 <property>

                <name>dfs.replication</name>

                <value></value>

        </property>

        <property>

                <name>dfs.namenode.name.dir</name>

                <value>file:/opt/local/hadoop/dfs/name</value>

        </property>

        <property>

                <name>dfs.datanode.data.dir</name>

                <value>file:/opt/local/hadoop/dfs/data</value>

        </property>

        <property>

                <name>dfs.permissions.enabled</name>

                <value>false</value>

        </property>

        <property>

                <name>dfs.namenode.secondary.http-address</name>

                <value>192.168.31.62:</value>

        </property>

mapred-site.xml

 <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

yarn-site.xml

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

        <property>

                <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>

                <value>org.apache.hadoop.mapred.ShuffleHandler</value>

        </property>

<!--

        <property>

                <name>yarn.resourcemanager.hostname</name>

                <value>192.168.31.62</value>

        </property>

-->

        <property>

                <name>yarn.resourcemanager.resource-tracker.address</name>

                <value>192.168.31.62:</value>

        </property>

        <property>

                <name>yarn.resourcemanager.address</name>

                <value>192.168.31.62:</value>

        </property>

        <property>

        <name>yarn.resourcemanager.scheduler.address</name>

        <value>192.168.31.62:</value>

        </property>

        <property>

                <name>yarn.log-aggregation-enable</name>

                <value>true</value>

        </property>

slaves

slave1

slave2

Spark配置

spark-env.sh

export JAVA_HOME=/opt/local/java/jdk

export SCALA_HOME=/opt/local/scala

export SPARK_WORKER_MEMORY=1g

export SPARK_MASTER_IP=192.168.31.62

export SPARK_DRIVER_MEORY=1G

export SPARK_LOCAL_DIRS=/opt/local/spark

export HADOOP_CONF_DIR=/opt/local/hadoop/etc/hadoop

export HADOOP_HOME=/opt/local/hadoop

slaves

slave1

slave2

http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/ClusterSetup.html

spark on yarn 集群部署的更多相关文章

Spark on Yarn 集群运行要点
实验版本:spark-1.6.0-bin-hadoop2.6 本次实验主要是想在已有的Hadoop集群上使用Spark,无需过多配置 1.下载&解压到一台使用spark的机器上即可 2.修改配 ...
Spark概述及集群部署
Spark概述什么是Spark (官网:http://spark.apache.org) Spark是一种快速.通用.可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010 ...
Spark on Yarn集群搭建
软件环境: linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8 主机配置: 一共m1, m2, m3这五部机, 每部主机的用户名都为centos ...
Ha-Federation-hdfs +Yarn集群部署方式
经过一下午的尝试,终于把这个集群的搭建好了,搭完感觉也没有太大的必要,就当是学习了吧,为之后搭建真实环境做基础. 以下搭建的是一个Ha-Federation-hdfs+Yarn的集群部署. 首先讲一下 ...
大数据【三】YARN集群部署
一概述 YARN是一个资源管理.任务调度的框架,采用master/slave架构,主要包含三大模块:ResourceManager(RM).NodeManager(NM).ApplicationMa ...
hadoop - spark on yarn 集群搭建
一.环境准备 1. 机器: 3 台虚拟机机器角色 l-qta3.sp.beta.cn0 NameNode,ResourceManager,spark的master l-querydiff1.sp ...
配置Spark on YARN集群内存
参考原文:http://blog.javachen.com/2015/06/09/memory-in-spark-on-yarn.html?utm_source=tuicool 运行文件有几个G大,默 ...
（转）yarn 集群部署，遇到的问题小结
link:http://blog.csdn.net/uniquechao/article/details/26449761 版本信息: hadoop 2.3.0 hive 0.11.0 1. ...
yarn 集群部署，遇到的问题小结
版本号信息: hadoop 2.3.0 hive 0.11.0 1. Application Master 无法訪问点击application mater 链接,出现 http 500 错 ...

随机推荐

【转载】阿里云Windows服务器快速部署PHP运行环境
PHP也是一种常用的网站脚本语言,时常用于网站应用程序的编写,PHP运行环境包含几个要素:PHP.Apache服务器.MySql数据库,此3个要素是Php网站运行的必要条件.在阿里云的Windows服 ...
python基础学习（十二）变量进阶
目录 1. 变量的引用 1.1 引用的概念 1.2 变量引用的实例 1.3 函数的参数和返回值的传递 2. 可变和不可变类型哈希 (hash) 3. 局部变量和全局变量 3.1 局部变量 3.2 ...
Redirect all output to file
That part is written to stderr, use 2> to redirect it. For example: foo > stdout.txt 2> std ...
Fzreo matlab
fzero Root of nonlinear function collapse all in page Syntax x = fzero(fun,x0) example x = fzero(fun ...
CommandLineRunner和ApplicationRunner的区别
CommandLineRunner和ApplicationRunner的区别二者的功能和官方文档一模一样,都是在Spring容器初始化完毕之后执行起run方法不同点在于,前者的run方法参数是St ...
减少页面加载时间的n种方法
减少HTTP请求 1:减少调用其他页面.文件的数量 2:使用css spirit , 减少图片加载次数压缩js,css代码 1:一般js.css文件中存在大量的空格.换行.注释,这些利于阅读,如果能 ...
#WEB安全基础 : HTML/CSS | 0x3文件夹管理网站
没有头脑的管理方式会酿成大灾难,应该使用文件夹管理网站这是一个典型的管理方法,现在传授给你,听好了下面是0x3初识a标签里使用的网站的目录,我把它重新配置了一下
Jenkins 利用Build With Parameters Plugin实现Jenkins参数化构建
利用Build With Parameters Plugin实现Jenkins参数化构建 by:授客 QQ:1033553122 测试环境 Build With Parameters Plugin ...
RTP 流媒体
RTMP协议是Adobe的私有协议,未完全公开,RTSP协议和HTTP协议是共有协议,并有专门机构做维护. RTMP协议一般传输的是flv,f4v格式流,RTSP协议一般传输的是ts,mp4格式的流. ...
mumu模拟器安装xposed--如何在android模拟器上进行root
问题描述安装xposed表示failed to access root权限,新版的mumu模拟器没有了root选项,需要自己root. 1.先关掉应用兼容性,然后重启电脑一般都是x86的,mumu ...

spark on yarn 集群部署

spark on yarn 集群部署的更多相关文章

随机推荐

热门专题