017 Spark的运行模式（yarn模式）

1.关于mapreduce on yarn 来提交job的流程

　　yarn=resourcemanager（RM）+nodemanager（NM）

　　client向RM提交任务

　　RM向NM分配applicationMaster（AM），并找到有一个容器，生成一个MR app mstr

　　MR app mstr向RM申请资源　　

　　在NM容器中找到MR app mstr，启动开来

　　MR app mstr监控和调度TASK的运行

　　MR app mstr向RM提交信息

2.配置

　　将Hadoop的配置文件添加到Spark的classpath中，即配置spark-env.sh中的HADOOP_CONF_DIR配置信息

　　在前面local或者standalone已经配置过。

3.启动HDFS，YARN

4.启动Spark命令(后来经过验证，发现不需要也可以计算出结果)

　　在标题上说明不需要启动spark服务，这这里说一下原因：

　　因为程序在yarn框架上运行，所以需要的服务是yarn，至于spark服务，程序跑在yarn上用不到。

　　所以这里的截图被删除。

　　经过验证，想法完全正确。

5.测试client　　

　　bin/spark-submit \
　　--master yarn \
　　--deploy-mode client \
　　--class com.ibeifeng.bigdata.spark.core.TOPNSparkCore \
　　--conf "spark.ui.port=5050" \
　　/etc/opt/datas/logs-analyzer.jar

6.测试cluster 　　

　　bin/spark-submit \
　　--master yarn \
　　--deploy-mode cluster \
　　--class com.ibeifeng.bigdata.spark.core.TOPNSparkCore \
　　--conf "spark.ui.port=5050" \
　　/etc/opt/datas/logs-analyzer.jar

　　这时候，程序结果不会显示在控制台上，因为driver运行在集群上。

7.结果

017 Spark的运行模式（yarn模式）的更多相关文章

flink on yarn模式下两种提交job方式
yarn集群搭建,参见hadoop 完全分布式集群搭建通过yarn进行资源管理,flink的任务直接提交到hadoop集群 1.hadoop集群启动,yarn需要运行起来.确保配置HADOOP_HO ...
012 Spark在IDEA中打jar包，并在集群上运行（包括local模式，standalone模式，yarn模式的集群运行）
一:打包成jar 1.修改代码 2.使用maven打包但是目录中有中文,会出现打包错误 3.第二种方式 4.下一步 5.下一步 6.下一步 7.下一步 8.下一步 9.完成二:在集群上运行(loc ...
spark（四）yarn上的运行模式
架构图 yarn-cluster yarn-client 区别 Yarn-cluster spark的driver运行在applicationMaster内,启动流程为: 这张图可能比较直观 Yarn ...
Spark部署三种方式介绍：YARN模式、Standalone模式、HA模式
参考自:Spark部署三种方式介绍:YARN模式.Standalone模式.HA模式http://www.aboutyun.com/forum.php?mod=viewthread&tid=7 ...
【Spark篇】---Spark中yarn模式两种提交任务方式
一.前述 Spark可以和Yarn整合,将Application提交到Yarn上运行,和StandAlone提交模式一样,Yarn也有两种提交任务的方式. 二.具体 1.yarn-clien ...
spark的运行模式
1.local(本地模式) 单机模式,通常用来测试将spark应用以多线程方式,直接运行在本地本地模式可以启动多个executor不过上限不能超过cpu数 2.standalone(独立模式) 独 ...
Spark的运行模式(2)--Yarn-Cluster和Yarn-Client
3. Yarn-Cluster Yarn是一种统一资源管理机制,可以在上面运行多种计算框架.Spark on Yarn模式分为两种:Yarn-Cluster和Yarn-Client,前者Driver运 ...
Spark的运行模式详解
Spark的运行模式是多种多样的,那么在这篇博客中谈一下Spark的运行模式一:Spark On Local 此种模式下,我们只需要在安装Spark时不进行hadoop和Yarn的环境配置,只要将S ...
Spark on YARN模式的安装（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推荐）
说白了 Spark on YARN模式的安装,它是非常的简单,只需要下载编译好Spark安装包,在一台带有Hadoop YARN客户端的的机器上运行即可. Spark on YARN简介与运行wor ...

随机推荐

C# HTTP上传多个文件及传递参数
1.HTTP上传文件及传递参数 #region 6.0 上传多个文件和参数 /// <summary> /// HttpUploadFile /// </summary> // ...
Hadop 基础
HDFS 体系结构 mapreduce 体系结构和算法 haddop 集群 zookeeper 操作:HBase 体系结构Hive /Sqoop 体系结构和基本操作: mapreduce 逻辑处理数据 ...
Java中在特定区间产生随机数
生成指定范围内的随机数这个是最常用的技术之一.程序员希望通过随机数的方式来处理众多的业务逻辑,测试过程中也希望通过随机数的方式生成包含大量数字的测试用例.问题往往类似于: 如何随机生成 1~100 ...
Flex布局和Bootstrap布局两者的比较
在Bootstrap中采用12栅格的布局,12份随意分配,但是不能解决5等分,7等分的问题.所以flex布局来协助. bootstrap的布局方式 <div class="row&qu ...
【Mysql sql inject】【入门篇】SQLi-Labs使用 part 1【01-11】
人员流动性过大一直是乙方公司痛点.虽然试用期间都有岗前学习,但老员工忙于项目无暇带新人成长,入职新人的学习基本靠自己不断摸索.期望看相关文档就可以一蹴而是不现实的.而按部就班的学习又很难短期内将知识有 ...
windows安装anaconda 报错failed to create anacoda menu ？
windows安装anaconda 报错failed to create anacoda menu ? 装了无数次,每次都是 failed to create anacoda menu然后无选择忽略, ...
一步步实现windows版ijkplayer系列文章之五——使用automake生成makefile
一步步实现windows版ijkplayer系列文章之一--Windows10平台编译ffmpeg 4.0.2,生成ffplay 一步步实现windows版ijkplayer系列文章之二--Ijkpl ...
JavaScript——封装
封装:使用对象封装的好处是可以减少全局变量污染的机会,讲属性,函数都隶属一个对象. 封装前: <script> var name="foo"; //name是全局的,被 ...
linux 平台core dump文件生成
1. 在终端中输入ulimit -c 如果结果为0,说明当程序崩溃时,系统并不能生成core dump. root@hbg:/# ulimit -c0root@hbg:/# 2.使用ulimit -c ...
Window下通过charles代理抓取iphone/android手机Https请求乱码问题处理
Window下通过charles代理抓取iphone手机Https请求乱码问题如果保持默认设置,https的reqeust和response都是乱码,设置完之后https就可以抓包了手机端操作: ...

017 Spark的运行模式（yarn模式）

017 Spark的运行模式（yarn模式）的更多相关文章

随机推荐

热门专题