hadoop版本:3.1.1

yarn-site.xml

yarn.log-aggregation-enable

作用:是否开启任务日志收集

默认值:false

我的设置:true

yarn.log-aggregation.retain-seconds

作用:日志自动清理前保存多长时间,单位秒。

默认值:-1

我的设置:864000

yarn.log-aggregation.retain-check-interval-seconds

作用:检查日志保留与否的时间间隔,单位秒。

默认值:-1 如果为0或负值,则计算为yarn.log-aggregation.retain-seconds的1/10.

我的设置:-1

yarn.resourcemanager.nodes.include-path

yarn.resourcemanager.nodes.exclude-path

作用:控制或排除nodemanager。可以是文件名的完整路经名,文件每一行是一台结点机器的IP或hostname。

默认值:空

我的设置:空

yarn.scheduler.minimum-allocation-mb

yarn.scheduler.maximum-allocation-mb

作用:每个容器向ResourceManager可申请的最小/最大内存,单位MB。

默认值:1024/8192

我的设置:随需要调整。

mapred-site.xml

mapreduce.map.memory.mb

作用:每个mapper申请的内存大小,单位MB

默认值:-1

我的设置:随需要调整。

mapreduce.map.java.opts

作用:为运行JVM程序准备的。mapper的child jvm的最大堆大小,单位MB

默认值:?

我的设置:-Xmx1014M,随需要调整。

mapreduce.reduce.memory.mb

作用:每个reducer申请的内存大小,单位MB

默认值:-1

我的设置:随需要调整。

mapreduce.reduce.java.opts

作用:为运行JVM程序准备的。reducer的child jvm的最大堆大小,单位MB

默认值:?

我的设置:-Xmx2560M,随需要调整。

mapreduce.task.timeout

作用:mr任务超时时间,超时将被自动杀死。超时的定义:既不读input,又不写output,还不更新status string。单位毫秒,设置为0则disable此配置。

默认值:600000 (10分钟)

我的设置:默认。随需要调整。

mapreduce.map.maxattempts

mapreduce.reduce.maxattempts

作用:map和reduce任务的最多尝试次数。

注意任务尝试(task attempt)被中止(killed)与任务失败(task failure)不同,前者不计入。

默认值:4

我的设置:默认。随需要调整。

mapreduce.map.failures.maxpercent

mapreduce.reduce.failures.maxpercent

作用:map和reduce任务的最多失败百分比。

默认值:?

我的设置:5。随需要调整。

mapreduce.task.io.sort.mb

作用:shuffle阶段排序时,mapper任务输出的内存缓冲区总大小,单位MB。

默认值:100

我的设置:默认。随需要调整。

mapreduce.map.sort.spill.percent

作用:shuffle阶段排序时,将内容写进磁盘的缓冲区阈值百分比。

默认值:0.80

我的设置:默认。随需要调整。

mapreduce.map.combine.minspills

作用:shuffle阶段排序时,运行combiner所需要的最少spill files数。

默认值:0.80

我的设置:默认。随需要调整。

mapreduce.task.io.sort.factor

作用:shuffle阶段排序时,每次内存缓存溢出阈值,都会生成一个溢出文件(spill file)。多个spill file会被合并,此配置项控制reducer一次最多合并多少流。

默认值:10

我的设置:默认。随需要调整,建议适当提高。

mapreduce.reduce.shuffle.parallelcopies

作用:shuffle阶段排序时,reduce并行复制mapper输出的线程数。

默认值:5.

我的设置:默认。随需要调整。

hadoop配置项笔记 - yarn的更多相关文章

  1. Hadoop学习笔记—Yarn

    目录 一些基本知识 ResourceManager 的恢复 Resource Manager的HA YARN Node Labels YARN Node Attributes Web Applicat ...

  2. hadoop配置项笔记 - hdfs

    hadoop版本:3.1.1 core-site.xml dfs.namenode.rpc-address 作用:rpc地址.我在使用distcp时显式使用到了. 默认值:port是8020 我的设置 ...

  3. hadoop配置项笔记 - streaming

    stream.map.input.ignoreKey 作用:是否忽略key,只传递值. 默认值:false 我的设置:按需要更改 stream.map.input.field.separator st ...

  4. Hadoop学习笔记—HDFS

    目录 搭建安装 三个核心组件 安装 配置环境变量 配置各上述三组件守护进程的相关属性 启停 监控和性能 Hadoop Rack Awareness yarn的NodeManagers监控 命令 hdf ...

  5. Hadoop学习笔记—22.Hadoop2.x环境搭建与配置

    自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...

  6. Hadoop阅读笔记(一)——强大的MapReduce

    前言:来园子已经有8个月了,当初入园凭着满腔热血和一脑门子冲动,给自己起了个响亮的旗号“大数据 小世界”,顿时有了种世界都是我的,世界都在我手中的赶脚.可是......时光飞逝,岁月如梭~~~随手一翻 ...

  7. Hadoop学习之YARN框架

    转自:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/,非常感谢分享! 对于业界的大数据存储及分布式处理系统来说,H ...

  8. Hadoop读书笔记(四)HDFS体系结构

    Hadoop读书笔记(一)Hadoop介绍:http://blog.csdn.net/caicongyang/article/details/39898629 Hadoop读书笔记(二)HDFS的sh ...

  9. Hadoop阅读笔记(七)——代理模式

    关于Hadoop已经小记了六篇,<Hadoop实战>也已经翻完7章.仔细想想,这么好的一个框架,不能只是流于应用层面,跑跑数据排序.单表链接等,想得其精髓,还需深入内部. 按照<Ha ...

随机推荐

  1. pc端字体大小自适应几种方法

    $(window).resize(function ()// 绑定到窗口的这个事件中 {  var whdef = 100/1920;// 表示1920的设计图,使用100PX的默认值  var wH ...

  2. c语言中对于移位运算符的用法

    //1 << 0 是把1 按2进制 左移0位,结果还是 1 ,2进制 0000 0001 //1 << 1, 是把1 按2进制 左移1位,结果是2,2进制 0000 0010 ...

  3. yum 运行失败

    https://stackoverflow.com/questions/47633870/rpm-lib64-liblzma-so-5-version-xz-5-1-2alpha-not-found- ...

  4. MFC关于.rc文件 .rc2文件

    .rc文件和.rc2文件 c和rc2都是资源文件,包含了应用程序中用到的所有的资源. 两者不同在于:rc文件中的资源可以直接在VC集成环境中以可视化的方法进行编辑和修改; 而rc2中的资源不能在VC的 ...

  5. git三、上传项目到github

    1.创建github仓库 2.git clone url (克隆仓库到本地,如profect) 3.将项目复制到本地文件夹profect下 4.git add . (添加项目至缓存区) 5.git c ...

  6. .htaccess实现php网站伪静态

    伪静态是啥?很简单,就是假的静态网页...例如有个网页是:www.xxx.com/index.php?id=1这是动态网页,php后缀的如果改成:www.xxx.com/index-1.html那么这 ...

  7. JAVA多线程实现的四种方式(转自https://www.cnblogs.com/felixzh/p/6036074.html)

    Java多线程实现方式主要有四种:继承Thread类.实现Runnable接口.实现Callable接口通过FutureTask包装器来创建Thread线程.使用ExecutorService.Cal ...

  8. 缺陷的背后---LIMIT M,N 分页查找

    一.问题发现篇 最近组内做了一次典型缺陷分享时,翻阅2018年的缺陷,找到了一个让我觉得“有料”的bug(别的同事测试发现的),先大致简单的描述下这个问题: 需要实现的功能:从一个DB库同步某一段时间 ...

  9. (转)MERGE语法详解

    merge语法是根据源表对目标表进行匹配查询,匹配成功时更新,不成功时插入. 其基本语法规则是 merge into 目标表 a using 源表 b on(a.条件字段1=b.条件字段1 and a ...

  10. 重装@angular/cli reason: write EPROTO 139955972261696:error:1408F10B:SSL routines:ssl3_get_record:wrong version number:../deps/openssl/openssl/ssl/record/ssl3_record.c:252:

    前几天不小心卸载了 angular@cli,然后重装的时候发现,一直报错.如下: ××××××××@××××ln622653:/$ npm install -g @angular/clinpm ERR ...