013 Spark中的资源调优

1.平常的资源使用情况

2.官网

3.资源参数调优

　　cores

　　memory

　　JVM

4.具体参数　　

　　可以在--conf参数中给定资源配置相关信息(配置的一般是JVM的一些垃圾回收机制)
　　--driver-memory

　　　　　　MEM Memory for driver (e.g. 1000M, 2G) (Default: 1024M).

　　　　　　给定driver运行的时候申请的内存，默认是1G
　　--executor-memory

　　　　　　MEM Memory per executor (e.g. 1000M, 2G) (Default: 1G).

　　　　　　给定Executor运行的时候申请的内存，默认1G
　　--driver-cores

　　　　　　 NUM Cores for driver (Default: 1).

　　　　　　 standalone的cluster运行模式下，driver运行需要的core数量
　　--supervise

　　　　 If given, restarts the driver on failure.

　　　　　　当运行在standalone上的时候如果driver宕机，会重启
　　--total-executor-cores

　　　　　NUM Total cores for all executors.

　　　　给定针对所有executor上总共申请多少个cores，默认全部
　　--executor-cores

　　　　 NUM Number of cores per executor. (Default: 1 in YARN mode,or all available cores on the worker in standalone mode)

　　　　Standalone模式下，每个executor分配多少cores，默认全部；

　　　　以及yanr模式下，每个executor分配多少cores，默认1个
　　--driver-cores

　　　　 NUM Number of cores used by the driver, only in cluster mode(Default: 1).

　　　　 yarn运行模式下(cluster)，driver需要的cores数量，默认一个
　　--num-executors

　　　　 NUM Number of executors to launch (Default: 2).

　　　　yarn运行模式下总的executors数量

5.示例

1.命令

　　为啥要设置，因为自己一个人把集群的资源给使用了，别人就会没有资源可以使用。

bin/spark-submit \
--master spark://linux-hadoop3.ibeifeng.com:6066 \
--deploy-mode cluster \
--class com.ibeifeng.bigdata.spark.core.TOPNSparkCore \
--conf "spark.ui.port=5050" \
--driver-memory 512M \
--supervise \
--executor-memory 1500M \
--total-executor-cores 1 \
--executor-cores 1 \
/etc/opt/datas/logs-analyzer.jar

2.运行

013 Spark中的资源调优的更多相关文章

(转)WebSphere 中池资源调优 - 线程池、连接池和 ORB
WebSphere 中池资源调优 - 线程池.连接池和 ORB 来自:https://www.ibm.com/developerworks/cn/websphere/library/techartic ...
Spark（六）Spark之开发调优以及资源调优
Spark调优主要分为开发调优.资源调优.数据倾斜调优.shuffle调优几个部分.开发调优和资源调优是所有Spark作业都需要注意和遵循的一些基本原则,是高性能Spark作业的基础:数据倾斜调优,主 ...
Spark性能优化--开发调优与资源调优
参考: https://tech.meituan.com/spark-tuning-basic.html https://zhuanlan.zhihu.com/p/22024169 一.开发调优 1. ...
CentOS7安装CDH 第十二章：YARN的资源调优
相关文章链接 CentOS7安装CDH 第一章:CentOS7系统安装 CentOS7安装CDH 第二章:CentOS7各个软件安装和启动 CentOS7安装CDH 第三章:CDH中的问题和解决方法 ...
Spark面试题（八）——Spark的Shuffle配置调优
Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)--数据倾斜调优 Spark面试题(六)--Spark资源调 ...
【原创 Hadoop&Spark 动手实践 8】Spark 应用经验、调优与动手实践
[原创 Hadoop&Spark 动手实践 7]Spark 应用经验.调优与动手实践目标: 1. 了解Spark 应用经验与调优的理论与方法,如果遇到Spark调优的事情,有理论思考框架. ...
（转）Spark性能优化：资源调优篇
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何 ...
【转载】 Spark性能优化：资源调优篇
在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都可以在spark-submit命令中作为参数设置.很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置 ...
Spark学习之路（十二）SparkCore的调优之资源调优
摘抄自:https://tech.meituan.com/spark-tuning-basic.html 一.概述在开发完Spark作业之后,就该为作业配置合适的资源了.Spark的资源参数,基本都 ...

随机推荐

DTP协议攻击
DTP协议动态中继协议DTP(Dynamic Trunking Protocol)是一种Cisco私有协议.DTP用于两台交换机的直连二层端口探测对端的配置,自动协商出二层端口的链路类型和以太网封装 ...
UBUNTU18.04安装网易云音乐并直接图标启动
这是一个网友改的程序,安装好以后把 ~/.cache/netcase-cloud-music 这个目录删除掉,就可以正常使用了,不用root权限
2、SpringBoot接口Http协议开发实战8节课（1-6）
1.SpringBoot2.xHTTP请求配置讲解简介:SpringBoot2.xHTTP请求注解讲解和简化注解配置技巧 1.@RestController and @RequestMapping是 ...
【tomcat】sessionId学习(未完待续)
这里主要研究tomcat中session的管理方式以及sessionId的原理,下文将研究sessionid存到redis中以及基于redis实现session共享. 平时也就是了解session是基 ...
OGG实现两台Oracle数据库的同步
今天通过最简单的一个例子,给大家讲解下 goldengate 实现两台Oracle数据库的同步.内容如下:1.配置数据库信息.2.安装golden gate.3.配置golden gate.4.测试同 ...
【vim】跳转到上/下一个修改的位置
当你编辑一个很大的文件时,经常要做的事是在某处进行修改,然后跳到另外一处.如果你想跳回之前修改的地方,使用命令: Ctrl+o 来回到之前修改的地方类似的: Ctrl+i 会回退上面的跳动.
通过全备+binlog_server同步恢复被drop的库或表
MySQL 中drop 等高危误操作后恢复方法实验目的: 本次实验以恢复drop操作为例,使用不同方法进行误操作的数据恢复. 方法: 利用master同步 :伪master+Binlog+同步(本文 ...
HTML学习笔记05-文本格式化
HTML格式化标签 HTML使用标签<b>与<i>对输出的文本进行格式,如:粗体or斜体这些HTML标签称为格式化标签 <!DOCTYPE HTML> <h ...
本体【Ontology】综述
原文地址:http://blog.csdn.net/moonsheep_liu/article/details/22329873 本体作为一种能在语义和知识层次上描述领域概念的建模工具,其目标是捕获相 ...
aliyun添加数据盘后的物理分区和lvm逻辑卷两种挂载方式
一.普通磁盘分区管理方式 1.对磁盘进行分区列出磁盘 # fdisk -l # fdisk /dev/vdb Welcome to fdisk (util-linux 2.23.2). Change ...

013 Spark中的资源调优

013 Spark中的资源调优的更多相关文章

随机推荐

热门专题