hadoop(四):配置参数

hadoop参数配置，主要是配置 core-site.xml,hdfs-site.xml,mapred-site.xml 三个配置文件，core-site.xml是全局配置,hdfs-site.xml和mapred-site.xml分别是hdfs和mapred的局部配置，core-default.xml,hdfs-default.xml,mapred-default.xml 是集群的默认配置，HDP2.4 安装包中 hadoop 版本为2.7，分别可从下面的地址获取到默认的参数说明：

目录：

core-site常用参数
hsdf-site常用参数

core-site常用参数：

ha.zookeeper.quorum： ZooKeeper集群的地址和端口。注意，数量一定是奇数，且不少于三个节点，如（hdp3:2181,hdp2:2181,r:2181）
fs.trash.interval：这个是开启hdfs文件删除自动转移到垃圾箱的选项，值为垃圾箱文件清除时间，单位是分钟，默认：360
io.file.buffer.size： SequenceFiles在读写中可以使用的缓存大小，默认设置：131072
net.topology.script.file.name：机架感知脚本位置
ipc.client.connect.max.retrie：建立与服务器连接的重试次数，默认为50

hsdf-site常用参数： 文档中的默认值是指基于 hdp2.4安装后的默认值

dfs.blocksize：每个文件块的大小，我们用128M
dfs.replication： hdfs数据块的复制份数，默认3
dfs.heartbeat.interval： DN的心跳检测时间间隔，默认3秒
dfs.permissions.enabled： dfs权限是否打开， 建议设为false,否则可能存在数据因为权限问题访问不了的情况
dfs.permissions.superusergroup: 设置hdfs超级权限的组，默认是hdfs
dfs.cluster.administrators： hdfs超级管理员，默认：hdfs
dfs.datanode.data.dir： NN保存元数据和事务日志的本地目录,可用逗号分隔的目录列表用于指定多份数据的冗余备份.
dfs.datanode.data.dir.perm: dn所使用的本地文件夹的路径权限，默认755
dfs.datanode.du.reserved: 表示在datanode对磁盘写时候，保留多少非dfs的磁盘空间，从而避免dfs将所在的磁盘写满,默认为0
dfs.datanode.failed.volumes.tolerated： dn允许磁盘损坏的个数,默认为0，（dn启动时候会使用dfs.data.dir下配置的文件夹,若是有一些不可以用且个数>上面配置的那个值，启动失败)
dfs.datanode.balance.bandwidthPerSec： balancer时，hdfs移动数据的速度，默认值为1M/S的速度。一般情况下设置为10M
dfs.datanode.max.transfer.threads: 数据传输最大线程，默认：16384
dfs.datanode.address： DN的服务监听端口，端口为0的话会随机监听端口，通过心跳通知NN，默认：50010
dfs.datanode.http.address： dn WebUI, 默认：50075
dfs.datanode.https.address： DN的HTTPS服务器和端口, 默认：50475
dfs.datanode.ipc.address： DN的IPC监听端口，写0的话监听在随机端口通过心跳传输给NN，默认：8010
dfs.namenode.checkpoint.dir： standy NN节点存储 checkpoint 文件目录，默认：/hadoop/hdfs/namesecondary
dfs.namenode.stale.datanode.interval: 标记一个dn为“down机”时间间隔,即:如果 nn没有接到一个dn心跳超过这个时间间隔,dn将标记为“过期”,过期的间隔不能太小 (默认: 3000)
dfs.journalnode.http-address: JournalNode web UI监听。如果端口是0,那么服务器将启动将自定义端口, 默认：8480
dfs.support.append: 是否允许文件追加，（hbase 的 wal 就是追加方式吧）
dfs.blockreport.intervalMsec：控制DN定期将当前该结点上所有的BLOCK信息报告给NN的时间间隔，默认21600000ms = 1小时
dfs.blockreport.initialDelay：初始值为0
说明：dn启动后第一次报告自己的block信息的时间是在(0,$(dfs.blockreport.initialDelay ))之间的一个随机数 initTime，然后从initTime（不同datanode上的这个随即肯定是不一样的）开始每隔dfs.blockreport.intervalMsec 时间，该datanode会向namenode报告自己的所有block的信息,如果没有initTime，多有datanode都从启动的那一刻开始发，这样会造成大量数据发往nn，造成堵塞
dfs.replication.min 最小复制份数，默认为1
dfs.replication.max 最大复制份数，默认为512
dfs.namenode.safemode.threshold-pct 指定应有多少比例的数据块满足最小副本数要求,默认0.999f
说明： (NN在启动的时候首先进入安全模式，如果DN丢失的block达到此参数设置的比例，则系统会一直处于安全模式状态即只读状态。如果设为1则HDFS永远是处于SafeMode）

hadoop(四):配置参数的更多相关文章

Hadoop YARN配置参数剖析—RM与NM相关参数
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 1. ResourceManager相关配置参数 (1) ...
hadoop YARN配置参数剖析—MapReduce相关参数
MapReduce相关配置参数分为两部分,分别是JobHistory Server和应用程序参数,Job History可运行在一个独立节点上,而应用程序参数则可存放在mapred-site.xml中 ...
Hadoop YARN配置参数剖析(3)—MapReduce相关参数
MapReduce相关配置参数分为两部分,分别是JobHistory Server和应用程序参数,Job History可运行在一个独立节点上,而应用程序参数则可存放在mapred-site.xml中 ...
Hadoop yarn配置参数
参照site:http://hadoop.apache.org/docs/r2.6.0/hadoop-yarn/hadoop-yarn-common/yarn-default.xml 我们在配置yar ...
Hadoop集群参数和常用端口
一.Hadoop集群参数配置在hadoop集群中,需要配置的文件主要包括四个,分别是core-site.xml.hdfs-site.xml.mapred-site.xml和yarn-site.xml ...
hadoop之 YARN配置参数剖析—RM与NM相关参数
参数均需要在yarn-site.xml中配置: 1. ResourceManager相关配置参数 (1) yarn.resourcemanager.address 参数解释:ResourceManag ...
hibernate篇章四-- Hibernate配置文件中hiberante.hbm2ddl.auto四个参数的配置
我们在搭建环境的时候,在配置文件中有一个属性标签为: <property name="hibernate.hbm2ddl.auto"> </propert ...
Hibernate配置文件中hiberante.hbm2ddl.auto四个参数的配置
我们在搭建环境的时候,在配置文件中有一个属性标签为: <property name="hibernate.hbm2ddl.auto"> </propert ...
JVM知识（四）：GC配置参数
JVM配置参数分为三类参数:跟踪参数.堆分配参数.栈分配参数这三类参数分别用于跟踪监控JVM状态,分配堆内存以及分配栈内存. 跟踪参数跟踪参数用户跟踪监控JVM,往往被开发人员用于JVM调优以及故 ...

随机推荐

关于oracle出现ORA-06143：连接未打开解决方案
原因:程序所在的路径中含有()和中文用plsql连接正常,连接字符串也检查不出毛病,换到另一个程序照样使用,折腾了半天,最后才发现程序所在的路径中含有()和中文,所以可能导致出现这种很难排查的问题出 ...
[转] 3个学习Socket编程的简单例子：TCP Server/Client, Select
以前都是采用ACE的编写网络应用,最近由于工作需要,需要直接只用socket接口编写CS的代码,重新学习这方面的知识,给出自己所用到的3个简单例子,都是拷贝别人的程序.如果你能完全理解这3个例子,估计 ...
USB 描述符
标准的USB设备有5种USB描述符:设备描述符,配置描述符,字符串描述符,接口描述符,端点描述符. // Standard Device Descriptor typedef struct { u8 ...
转 SQL Server中关于的checkpoint使用说明
在SQL Server中有一个非常重要的命令就是CheckPoint,它主要作用是把缓存中的数据写入mdf文件中. 其实在我们进行insert, update, delete时,数据并没有直接写入数据 ...
Win 環境構建調試用TreeWalker
語法 var ppTreeWalker = document.createTreeWalker(pRootNode, ulWhatToShow, pFilter, fEntityReferenceEx ...
Matlab神经网络工具箱学习之一
1.神经网络设计的流程 2.神经网络设计四个层次 3.神经网络模型 4.神经网络结构 5.创建神经网络对象 6.配置神经网络的输入输出 7.理解神经网络工具箱的数据结构 8.神经网络训练 1.神经网络 ...
Qt 串口学习3
1.怎样将选择波特率 1)使用if else 的方法 if(ui->BaudRate->currentText()==tr("9600")) //根据组合框 ...
linux 网络协议分析---3
本章节主要介绍linxu网络模型.以及常用的网络协议分析以太网协议.IP协议.TCP协议.UDP协议一.网络模型 TCP/IP分层模型的四个协议层分别完成以下的功能: 第一层网络接口层网络接口层 ...
leetcode 139. Word Break ----- java
Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separa ...
所学新知——int、char型转string 类型等
1. 利用stringstream类定义头文件#include<sstream> 通过 int a; char b; sstream ss,ss1; ss<<a; ss1&l ...

hadoop(四):配置参数

hadoop(四):配置参数的更多相关文章

随机推荐

热门专题