转载自:http://blog.csdn.net/zrc199021/article/details/54020692

关于所在节点核数怎么看?

======================================================================

# 总核数 = 物理CPU个数 X 每颗物理CPU的核数

# 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数

# 查看物理CPU个数

cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

# 查看每个物理CPU中core的个数(即核数)

cat /proc/cpuinfo| grep "cpu cores"| uniq

# 查看逻辑CPU的个数

cat /proc/cpuinfo| grep "processor"| wc -l

======================================================================

spark资源主要就是core和memery。

spark主题功能分三部分:spark RDD,sparkSQL,spark shell,如果每个部分的功能都要用,那么每块都要占用资源。

其中,spark RDD和spark shell 是动态分配占用资源的,sparkSQL是静态分配资源的(启动后即一直占着分配的资源)

spark分配的总体资源在哪里看?

  1. cat /home/mr/spark/conf/spark-env.sh
  1. JAVA_HOME=/usr/java/jdk
  2. SPARK_HOME=/home/mr/spark
  3. SPARK_PID_DIR=/home/mr/spark/pids
  4. SPARK_LOCAL_DIRS=/data2/zdh/spark/tmp,/data3/zdh/spark/tmp,/data4/zdh/spark/tmp
  5. SPARK_WORKER_DIR=/data2/zdh/spark/work
  6. SPARK_LOG_DIR=/data1/zdh/spark/logs
  7. SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18088-Dspark.history.retainedApplications=500"
  8. SPARK_MASTER_WEBUI_PORT=18080
  9. SPARK_WORKER_WEBUI_PORT=18081
  10. SPARK_WORKER_CORES=25
  11. SPARK_WORKER_MEMORY=150g
  12. SPARK_DAEMON_MEMORY=2g
  13. SPARK_LOCAL_HOSTNAME=`hostname`
  14. YARN_CONF_DIR=/home/mr/yarn/etc/hadoop​

SparkSQL的总体资源在哪看?

  1. [root@vmax47 conf]# cat sparksql-defaults.conf
  2. spark.serializer=org.apache.spark.serializer.KryoSerializer
  3. spark.driver.extraJavaOptions=-Xss32m-XX:PermSize=128M-XX:MaxPermSize=512m
  4. spark.driver.extraClassPath=/home/mr/spark/libext/*
  5. spark.executor.extraClassPath=/home/mr/spark/libext/*
  6. spark.executor.memory=10g
  7. spark.eventLog.enabled=true
  8. spark.eventLog.dir=/data1/zdh/spark/logs/eventLog
  9. spark.history.fs.logDirectory=/data1/zdh/spark/logs/eventLog
  10. spark.worker.cleanup.enabled=true
  11. spark.shuffle.consolidateFiles=true
  12. spark.ui.retainedJobs=200
  13. spark.ui.retainedStages=200
  14. spark.deploy.retainedApplications=100
  15. spark.deploy.retainedDrivers=100
  16. spark.speculation=true
  17. spark.speculation.interval=1000
  18. spark.speculation.multiplier=4
  19. spark.speculation.quantile=0.85
  20. spark.shuffle.service.enabled=false
  21. spark.dynamicAllocation.enabled=false
  22. spark.dynamicAllocation.minExecutors=0
  23. spark.dynamicAllocation.maxExecutors=2147483647
  24. spark.sql.broadcastTimeout=600
  25. spark.yarn.queue=mr
  26. spark.master=spark://vmax47:7077,SPARK49:7077
  27. spark.deploy.recoveryMode=ZOOKEEPER
  28. spark.deploy.zookeeper.url=SPARK49:2181,HADOOP50:2181,vmax47:2181
  29. spark.ui.port=4100
  30. spark.driver.memory=40G
  31. spark.cores.max=30​

查看Spark资源可从18080端口查看:

Spark资源配置(核数与内存)的更多相关文章

  1. Spark内核| 调度策略| SparkShuffle| 内存管理| 内存空间分配| 核心组件

    1. 调度策略 TaskScheduler会先把DAGScheduler给过来的TaskSet封装成TaskSetManager扔到任务队列里,然后再从任务队列里按照一定的规则把它们取出来在Sched ...

  2. Spark Tungsten揭秘 Day4 内存和CPU优化使用

    Spark Tungsten揭秘 Day4 内存和CPU优化使用 今天聚焦于内存和CPU的优化使用,这是Spark2.0提供的关于执行时的非常大的优化部分. 对过去的代码研究,我们会发现,抽象的提高, ...

  3. Spark Tungsten揭秘 Day3 内存分配和管理内幕

    Spark Tungsten揭秘 Day3 内存分配和管理内幕 恭喜Spark2.0发布,今天会看一下2.0的源码. 今天会讲下Tungsten内存分配和管理的内幕.Tungsten想要工作,要有数据 ...

  4. [Spark性能调优] 第四章 : Spark Shuffle 中 JVM 内存使用及配置内幕详情

    本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified Mem ...

  5. 【Spark调优】内存模型与参数调优

    [Spark内存模型] Spark在一个executor中的内存分为3块:storage内存.execution内存.other内存. 1. storage内存:存储broadcast,cache,p ...

  6. Spark 1.x 爆内存相关问题汇总及解

    Spark 1.x 爆内存相关问题汇总及解决 OOM # 包括GC Overhead limitjava.lang.OutOfMemoryError # on yarn org.apache.hado ...

  7. spark性能调优(四) spark shuffle中JVM内存使用及配置内幕详情

    转载:http://www.cnblogs.com/jcchoiling/p/6494652.html 引言 Spark 从1.6.x 开始对 JVM 的内存使用作出了一种全新的改变,Spark 1. ...

  8. Spark Shuffle 中 JVM 内存使用及配置内幕详情

      本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified M ...

  9. Spark 介绍(基于内存计算的大数据并行计算框架)

    Spark 介绍(基于内存计算的大数据并行计算框架)  Hadoop与Spark 行业广泛使用Hadoop来分析他们的数据集.原因是Hadoop框架基于一个简单的编程模型(MapReduce),它支持 ...

  10. 获取指定订阅下所有Azure ARM虚拟机配置(CPU核数,内存大小,磁盘信息)的使用情况

    脚本内容: <# .SYNOPSIS This script grab all ARM VM VHD file in the subscription and caculate VHD size ...

随机推荐

  1. Java中如何设置表格处于不可编辑状态

    代码片段如下: 这样的话就可以将表格设置为不可编辑状态

  2. nginx upstream的五种分配方式

    Nginx负载均衡选项upstream用法举例 1.轮询(weight=1) 默认选项,当weight不指定时,各服务器weight相同,每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器d ...

  3. iTerm2 + oh my zsh +agnoster 打造最强Mac终端

    链接: http://www.siguoya.name/pc/home/article/256 http://www.jianshu.com/p/fabd40cf83fe http://www.jia ...

  4. coursera-斯坦福-机器学习-吴恩达-笔记week1

    1 Introduction 1.1 概念:一个程序被认为能从经验E中学习,解决任务 T,达到性能度量值P,当且仅当, 有了经验E后,经过P评判, 程序在处理 T 时的性能有所提升. 1.2 机器学习 ...

  5. Win10系列:C#应用控件基础14

    ProgressBar控件 有时候用户需要执行比较复杂的任务,等待任务完成需要很长时间,在等待的过程中一般会使用进度条提示当前任务的执行进度,让用户更好的掌握任务的执行状态,例如在下载资源时会显示下载 ...

  6. java子类继承父类的方法(代码简略版)

    父类:public class Subjects { public void b() { System.out.println("学科"); } public void a(){ ...

  7. iOS sqlite大数据分段加载的实现,sqlite数据库的操作

    数据库管理类(自己封装的,挺简单的) // //  MyDataBaseManger.m //  DB_Test // //  Created by admin on 17/2/7. //  Copy ...

  8. OLAP了解与OLAP引擎——Mondrian入门

    一.  OLAP的基本概念 OLAP(On-Line Analysis Processing)在线分析处理是一种共享多维信息的快速分析技术:OLAP利用多维数据库技术使用户从不同角度观察数据:OLAP ...

  9. Java连接数据库的driver和url写法

    oracle driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@localhost:1521 ...

  10. componentWillMount和componentDidMount的区别

    1.componentWillMount  将要装载,在render之前调用: componentDidMount,(装载完成),在render之后调用 2.componentWillMount  每 ...