Hadoop2配置详解
|
进程值
|
环境变量
|
|
NameNode
|
HADOOP_NAMENODE_OPTS
|
|
DataNode
|
HADOOP_DATANODE_OPTS
|
|
Secondary NameNode
|
HADOOP_SECONDARYNAMENODE_OPTS
|
|
ResourceManager
|
YARN_RESOURCEMANAGER_OPTS
|
|
NodeManager
|
YARN_NODEMANAGER_OPTS
|
|
WebAppProxy
|
YARN_PROXYSERVER_OPTS
|
|
Map Reduce Job History Server
|
HADOOP_JOB_HISTORYSERVER_OPTS
|
- export HADOOP_NAMENODE_OPTS="-XX:+UseParallelGC ${HADOOP_NAMENODE_OPTS}"
复制代码
其他有用的配置参数,你可以自定义包括:
- 守护进程环境变量ResourceManagerYARN_RESOURCEMANAGER_HEAPSIZENodeManagerYARN_NODEMANAGER_HEAPSIZEWebAppProxyYARN_PROXYSERVER_HEAPSIZEMap Reduce Job History ServerHADOOP_JOB_HISTORYSERVER_HEAPSIZE
- conf/core-site.xml
参数值注释fs.defaultFSNameNode URIhdfs://host:port/io.file.buffer.size131072SequenceFiles文件中.读写缓存size设定
- conf/hdfs-site.xml:配置 NameNode:
- 参数值Notesdfs.namenode.name.dir在本地文件系统所在的NameNode的存储空间和持续化处理日志如果这是一个以逗号分隔的目录列表,然后将名称表被复制的所有目录,以备不时之需。dfs.namenode.hosts /dfs.namenode.hosts.excludeDatanodes
permitted/excluded列表如有必要,可以使用这些文件来控制允许数据节点的列表dfs.blocksize268435456大型的文件系统HDFS块大小为256MBdfs.namenode.handler.count100设置更多的namenode线程,处理从datanode发出的大量RPC请求 - Configurations for DataNode:
ParameterValueNotesdfs.datanode.data.dir逗号分隔的一个DataNode上,它应该保存它的块的本地文件系统的路径列表如果这是一个以逗号分隔的目录列表,那么数据将被存储在所有命名的目录,通常在不同的设备。
- conf/yarn-site.xml
- 配置ResourceManager 和 NodeManager:
参数值备注yarn.acl.enabletrue /false启用ACL的?默认为false。yarn.admin.aclAdmin ACL访问控制列表,在群集上设置管理员。 ACL是为逗号分隔usersspacecomma分隔组。默认为*特殊值这意味着任何人。只是空间的特殊值意味着没有人进入。yarn.log-aggregation-enablefalse配置来启用或禁用日志聚合
- 配置 ResourceManager:
参数值备注yarn.resourcemanager.address客户端对ResourceManager主机通过 host:port 提交作业host:portyarn.resourcemanager.scheduler.addressApplicationMasters 通过ResourceManager 主机访问host:port 跟踪调度程序获资源host:portyarn.resourcemanager.resource-tracker.addressNodeManagers通过ResourceManager主机访问 host:porthost:portyarn.resourcemanager.admin.address管理命令通过ResourceManager 主机访问host:porthost:portyarn.resourcemanager.webapp.addressResourceManager web页面host:port.host:portyarn.resourcemanager.scheduler.classResourceManager 调度类(Scheduler class)CapacityScheduler(推荐),FairScheduler(也推荐),orFifoScheduleryarn.scheduler.minimum-allocation-mb每个容器内存最低限额分配到的资源管理器要求I以MB为单位yarn.scheduler.maximum-allocation-mb资源管理器分配给每个容器的内存最大限制以MB为单位yarn.resourcemanager.nodes.include-path /yarn.resourcemanager.nodes.exclude-pathNodeManagers 的permitted/excluded列表如有必要,可使用这些文件来控制允许NodeManagers列表。 - 配置 NodeManager:
参数值备注yarn.nodemanager.resource.memory-mbgivenNodeManager即资源的可用物理内存,以MB为单位定义在节点管理器总的可用资源,以提供给运行容器yarn.nodemanager.vmem-pmem-ratio最大比率为一些任务的虚拟内存使用量可能会超过物理内存率每个任务的虚拟内存的使用可以通过这个比例超过了物理内存的限制。虚拟内存的使用上的节点管理器任务的总量可以通过这个比率超过其物理内存的使用。yarn.nodemanager.local-dirs数据写入本地文件系统路径的列表用逗号分隔多条存储路径可以提高磁盘的读写速度yarn.nodemanager.log-dirs本地文件系统日志路径的列表逗号分隔。多条存储路径可以提高磁盘的读写速度yarn.nodemanager.log.retain-seconds10800如果日志聚合被禁用。默认的时间(以秒为单位)保留在节点管理器只适用日志文件,yarn.nodemanager.remote-app-log-dir/logsHDFS目录下的应用程序日志移动应用上完成。需要设置相应的权限。仅适用日志聚合功能。yarn.nodemanager.remote-app-log-dir-suffixlogs后缀追加到远程日志目录。日志将被汇总到 ${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam} 仅适用日志聚合功能。yarn.nodemanager.aux-servicesmapreduce_shuffleShuffle service 需要加以设置的Map Reduce的应用程序服务。 - 配置历史记录服务器(需要被移到别处):
参数值备注yarn.log-aggregation.retain-seconds-1如何长期保持聚集日志删除之前。 -1禁用。请注意,设置这个太小了,你将名称节点的垃圾邮件yarn.log-aggregation.retain-check-interval-seconds-1检查汇总的日志保留的时间。如果设置为0或负值,则该值被计算为十分之一的聚合日志保留时间。请注意,设置这个太小了,你将称为名称节点的垃圾邮件。
- 配置ResourceManager 和 NodeManager:
- conf/mapred-site.xml
- 配置 MapReduce 应用程序:
参数值备注mapreduce.framework.nameyarn执行框架设置为 Hadoop YARN.mapreduce.map.memory.mb1536对maps更大的资源限制的.mapreduce.map.java.opts-Xmx1024Mmaps 中对jvm child设置更大的堆大小mapreduce.reduce.memory.mb3072设置 reduces对于较大的资源限制mapreduce.reduce.java.opts-Xmx2560Mreduces对 child jvms Larger heap-size 设置mapreduce.task.io.sort.mb512更高的内存限制,而对数据进行排序的效率。mapreduce.task.io.sort.factor100在文件排序中更多的流合并为一次mapreduce.reduce.shuffle.parallelcopies50通过reduces从非常多的map中读取较多的平行副本
- 配置MapReduce的JobHistory服务器:
ParameterValueNotesmapreduce.jobhistory.addressMapReduce JobHistory Server host:port默认端口号 10020.mapreduce.jobhistory.webapp.addressMapReduce JobHistory Server Web UIhost:port默认端口号 19888.mapreduce.jobhistory.intermediate-done-dir/mr-history/tmp在历史文件被写入由MapReduce作业mapreduce.jobhistory.done-dir/mr-history/done目录中的历史文件是由MR JobHistory Server管理。
- 配置 MapReduce 应用程序:
Hadoop2配置详解的更多相关文章
- 超详细的Hadoop2配置详解
1. 集群环境 Master 192.168.2.100 Slave1 192.168.2.101 Slave2 192.168.2.102 2. 下载安装包 Master wget http://m ...
- Flume NG 配置详解(转)
原文链接:[转]Flume NG 配置详解 (说明,名词对应解释 源-Source,接收器-Sink,通道-Channel) 配置 设置代理 Flume代理配置存储在本地配置文件.这是一个文本文件格式 ...
- 大数据学习day11------hbase_day01----1. zk的监控机制,2动态感知服务上下线案例 3.HDFS-HA的高可用基本的工作原理 4. HDFS-HA的配置详解 5. HBASE(简介,安装,shell客户端,java客户端)
1. ZK的监控机制 1.1 监听数据的变化 (1)监听一次 public class ChangeDataWacher { public static void main(String[] arg ...
- Log4j配置详解(转)
一.Log4j简介 Log4j有三个主要的组件:Loggers(记录器),Appenders (输出源)和Layouts(布局).这里可简单理解为日志类别,日志要输出的地方和日志以何种形式输出.综合使 ...
- logback 常用配置详解<appender>
logback 常用配置详解 <appender> <appender>: <appender>是<configuration>的子节点,是负责写日志的 ...
- [转]阿里巴巴数据库连接池 druid配置详解
一.背景 java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,又不得不使用数据库连接池.数据库连接池有很多选择,c3p.dhcp.proxool等,druid作为一名后起之秀,凭借其出色 ...
- libCURL开源库在VS2010环境下编译安装,配置详解
libCURL开源库在VS2010环境下编译安装,配置详解 转自:http://my.oschina.net/u/1420791/blog/198247 http://blog.csdn.net/su ...
- logback配置详解3<filter>
logback 常用配置详解(三) <filter> <filter>: 过滤器,执行一个过滤器会有返回个枚举值,即DENY,NEUTRAL,ACCEPT其中之一.返回DENY ...
- logback配置详解2<appender>
logback 常用配置详解(二) <appender> <appender>: <appender>是<configuration>的子节点,是负责写 ...
随机推荐
- CentOS7.0重置Root的密码
CentOS7.0重置Root的密码 首先进入开启菜单,按下e键进入编辑现有的内核,如下图所示 然后滚动列表,找到ro,将它替换成rw,并加上init=/sysroot/bin/sh,最终变为如下图 ...
- 初识layer 快速入门
http://layer.layui.com/hello.html 如果,你初识layer,你对她不知所措,你甚至不知如何绑定事件… 那或许你应该用秒做单位,去认识她. 开始了解 第一步:部署 下载l ...
- [排序] 快排 && 冒泡(自己写)
#include <iostream> using namespace std; /* 快速排序 通过一趟排序,以轴点为界 分割为两部分:左部分 <= 轴点 <= 右部分 再分 ...
- javascript中的JSON序列化与反序列化
简单粗暴上代码: function create() { this.name = "jack"; this.sex = "man"; } create.prot ...
- HTML5 webSQL
https://www.ibm.com/developerworks/cn/web/1108_zhaifeng_websqldb/ <!DOCTYPE HTML> <html&g ...
- CodeIgniter 常量ENVIRONMENT设置要注意的地方
http://bbs.phpchina.com/thread-274514-1-1.html index.php ,这是CodeIgniter的入口文件,做开发是,都会设置一下define('ENVI ...
- Nginx状态监控
通过配置nginx.conf文件来实现对Nginx状态信息的监控. 1.配置nginx.conf vim /usr/local/nginx/conf/nginx.conf 再server块配置项中添加 ...
- C# 和Jsonp的一个小demo 用jQuery与JSONP轻松解决跨域访问的问题
客服端: 在A项目下面 建立一个 JsonpClient.aspx页面,代码如下: <%@ Page Language="C#" AutoEventWireup=& ...
- MyEclipse编码设置
(1)windows---->Preferences (2)general---->Workspace (3)设置编码
- vim不保存退出
对于刚开始使用vi/vim文本编辑器的新手来说,如何在不保存更改而退出vi/vim 文本编辑器呢? 当你使用linux vi/vim 文本编辑器对linux下某个配置文件做编辑操作,当你更改完之后,可 ...