Spark记录-spark-env.sh配置

环境变量	含义
`SPARK_MASTER_IP`	master实例绑定的IP地址，例如，绑定到一个公网IP
`SPARK_MASTER_PORT`	mater实例绑定的端口（默认7077）
`SPARK_MASTER_WEBUI_PORT`	master web UI的端口（默认8080）
`SPARK_MASTER_OPTS`	master专用配置属性，格式如”-Dx=y” （默认空），可能的选项请参考下面的列表。
`SPARK_LOCAL_DIRS`	Spark的本地工作目录，包括：映射输出的临时文件和RDD保存到磁盘上的临时数据。这个目录需要快速访问，最好设成本地磁盘上的目录。也可以通过使用逗号分隔列表，将其设成多个磁盘上的不同路径。
`SPARK_WORKER_CORES`	本机上Spark应用可以使用的CPU core上限（默认所有CPU core）
`SPARK_WORKER_MEMORY`	本机上Spark应用可以使用的内存上限，如：1000m，2g（默认为本机所有内存减去1GB）；注意每个应用单独使用的内存大小要用 spark.executor.memory 属性配置的。
`SPARK_WORKER_PORT`	Spark worker绑定的端口（默认随机）
`SPARK_WORKER_WEBUI_PORT`	worker web UI端口（默认8081）
`SPARK_WORKER_INSTANCES`	每个slave机器上启动的worker实例个数（默认：1）。如果你的slave机器非常强劲，可以把这个值设为大于1；相应的，你需要设置SPARK_WORKER_CORES参数来显式地限制每个worker实例使用的CPU个数，否则每个worker实例都会使用所有的CPU。
`SPARK_WORKER_DIR`	Spark worker的工作目录，包括worker的日志以及临时存储空间（默认：${SPARK_HOME}/work）
`SPARK_WORKER_OPTS`	worker的专用配置属性，格式为：”-Dx=y”，可能的选项请参考下面的列表。
`SPARK_DAEMON_MEMORY`	Spark master和worker后台进程所使用的内存（默认：1g）
`SPARK_DAEMON_JAVA_OPTS`	Spark master和workers后台进程所使用的JVM选项，格式为：”-Dx=y”（默认空）
`SPARK_PUBLIC_DNS`	Spark master和workers使用的公共DNS（默认空）

注意: 启动脚本目前不支持Windows。如需在Windows上运行，请手工启动master和workers。

SPARK_MASTER_OPTS支持以下属性：

属性名	默认值	含义
`spark.deploy.retainedApplications`	200	web UI上最多展示几个已结束应用。更早的应用的数将被删除。
`spark.deploy.retainedDrivers`	200	web UI上最多展示几个已结束的驱动器。更早的驱动器进程数据将被删除。
`spark.deploy.spreadOut`	true	独立部署集群的master是否应该尽可能将应用分布到更多的节点上；设为true，对数据本地性支持较好；设为false，计算会收缩到少数几台机器上，这对计算密集型任务比较有利。
`spark.deploy.defaultCores`	(无限制)	Spark独立模式下应用程序默认使用的CPU个数（没有设置spark.cores.max的情况下）。如果不设置，则为所有可用CPU个数（除非设置了spark.cores.max）。如果集群是共享的，最好将此值设小一些，以避免用户占满整个集群。
`spark.worker.timeout`	60	如果master没有收到worker的心跳，那么将在这么多秒之后，master将丢弃该worker。

SPARK_WORKER_OPTS支持以下属性：

属性名	默认值	含义
`spark.worker.cleanup.enabled`	false	是否定期清理 worker 和应用的工作目录。注意，该设置仅在独立模式下有效，YARN有自己的清理方式；同时，只会清理已经结束的应用对应的目录。
`spark.worker.cleanup.interval`	1800 (30 minutes)	worker清理本地应用工作目录的时间间隔（秒）
`spark.worker.cleanup.appDataTtl`	7 * 24 * 3600 (7 days)	清理多久以前的应用的工作目录。这个选项值将取决于你的磁盘总量。spark应用会将日志和jar包都放在其对应的工作目录下。随着时间流逝，应用的工作目录很快会占满磁盘，尤其是在你的应用提交比较频繁的情况下。

Spark记录-spark-env.sh配置的更多相关文章

Spark记录-官网学习配置篇（二）
### Spark SQL Running the SET -v command will show the entire list of the SQL configuration. #scala/ ...
Spark记录-官网学习配置篇（一）
参考http://spark.apache.org/docs/latest/configuration.html Spark提供三个位置来配置系统: Spark属性控制大多数应用程序参数,可以使用Sp ...
Spark记录-Spark性能优化解决方案
Spark性能优化的10大问题及其解决方案问题1:reduce task数目不合适解决方式:需根据实际情况调节默认配置,调整方式是修改参数spark.default.parallelism.通常,r ...
Spark记录-Spark On YARN内存分配（转载）
Spark On YARN内存分配(转载) 说明按照Spark应用程序中的driver分布方式不同,Spark on YARN有两种模式: yarn-client模式.yarn-cluster模式. ...
Spark记录-spark编程介绍
Spark核心编程 Spark 核心是整个项目的基础.它提供了分布式任务调度,调度和基本的 I/O 功能.Spark 使用一种称为RDD(弹性分布式数据集)一个专门的基础数据结构,是整个机器分区数据的 ...
Spark记录-spark报错Unable to load native-hadoop library for your platform
解决方案一: #cp $HADOOP_HOME/lib/native/libhadoop.so $JAVA_HOME/jre/lib/amd64 #源码编译snappy---./configure ...
Spark记录-spark介绍
Apache Spark是一个集群计算设计的快速计算.它是建立在Hadoop MapReduce之上,它扩展了 MapReduce 模式,有效地使用更多类型的计算,其中包括交互式查询和流处理.这是一个 ...
Spark记录-Spark on mesos配置
1.安装mesos #用centos6的源yum安装 # rpm -Uvh http://repos.mesosphere.io/el/6/noarch/RPMS/mesosphere-el-repo ...
Spark记录-Spark on Yarn框架
一.客户端进行操作 1.根据yarnConf来初始化yarnClient,并启动yarnClient2.创建客户端Application,并获取Application的ID,进一步判断集群中的资源是否 ...
Spark记录-Spark作业调试
在本地IDE里直接运行spark程序操作远程集群一般运行spark作业的方式有两种: 本机调试,通过设置master为local模式运行spark作业,这种方式一般用于调试,不用连接远程集群. 集群 ...

随机推荐

iOS推送证书生成pem文件（详细步骤）
1.pem文件概述 pem文件是服务器向苹果服务器做推送时候需要的文件,主要是给php向苹果服务器验证时使用,下面介绍一下pem文件的生成. 2.生成pem文件步骤 1.打开钥匙串,选择需要生成的推送 ...
Notepad++找回Plugin Manager{在v7.50后（包括7.50）不带有插件管理器(Plugin Manager)}
https://github.com/notepad-plus-plus/notepad-plus-plus/issues/2459 64 bit Plugin Manager is now avai ...
activiti-explorer disable demo
https://community.alfresco.com/thread/203012-activiti-explorer engine.properties # demo data propert ...
[书摘]Windows内存管理术语
1. Virtual Address space 虚拟地址空间一个应用程序能够访问的最大的内存地址空间, 32位的机器上面最大的就是4GB 但是并不是所有的内存都放到主存里面, 可能放到pagef ...
p3c安装使用编码规范扫描阿里巴巴出品，挺好用的
https://github.com/alibaba/p3c/wiki/IDEA%E6%8F%92%E4%BB%B6%E4%BD%BF%E7%94%A8%E6%96%87%E6%A1%A3
delphi try except语句和 try finally语句用法以及区别
try//尝试执行{SomeCode} except//出错的时候执行, Except有特定的错误类型 {SomeCode} end; try//尝试执行{SomeCode} finally//无论如 ...
selenium之封装登陆操作
# selenium 封装登录操作举例 import os, time # from selenium import webdriver class LoginPage(): '''登录模块''' d ...
codeforces518B
Tanya and Postcard CodeForces - 518B 有个小女孩决定给他的爸爸寄明信片.她已经想好了一句话(即长度为n的字符串s),包括大写和小写英文字母.但是他不会写字,所以她决 ...
PHP生成二维码并上传到七牛云
参考资料 qr-code生成二维码七牛云上传图片实现步骤 //拿到插入后的id $res = DB::table('book_book')->insertGetId($data); i ...
The Chinese Postman Problem HIT - 2739(有向图中国邮路问题)
无向图的问题,如果每个点的度数为偶数,则就是欧拉回路,而对于一个点只有两种情况,奇数和偶数,那么就把都为奇数的一对点连一条边权为原图中这两点最短路的值的边是不是就好了无向图中国邮路问 ...

Spark记录-spark-env.sh配置

Spark记录-spark-env.sh配置的更多相关文章

随机推荐

热门专题