【大数据系列】hadoop集群的配置

一、hadoop的配置文件分类

1、只读类型的默认文件

core-default.xml hdfs-default.xml mapred-default.xml mapred-queues.xml

2、定位设置

core-site.xml hdfs-site.xml mapred-site.xml mapred-queues.xml

3、守护进程设置

hadoop-env.sh

二、守护进程配置表

守护进程（Daemoon）配置选项（Configure Options）

NameNode　　　　 HADOOP_NAMENODE_OPTS

DataNode HADOOP_DATANODE_OPTS

SecondaryNameNode HADOOP_SECONDARYNAMENODE_OPTS

JobTracker HADOOP_JOBTRACKER_OPTS

TackTracker HADOOP_TASKTRACKER_OPTS

三、core-site hdfs-site mapred-site的配置

1、core-site.xml

参数（Parameter）值（Value）

fs.default.name NameNode的IP地址及端口

2、hdfs-site.xml

参数（Parameter）值（Value）

dfs.name.dir NameNode存储名字空间及汇报日志的位置

dfs.data.dir DataNode存储数据块的位置

3、mapred-site.xml

参数（Parameter）值（Value）

mapreduce.jobtracker.address JobTracker的IP地址及端口

mapreduce.jobtracker.system.dir MapReduce在HDFS上存储文件的位置

mapreduce.cluster.local.dir MapReduce的缓存数据存储在文件系统中的位置

mapred.tasktracker.{map|reduce}.tasks.maximum 每台TaskTracker所能运行的Map或Reduce的task最大数量

dfs.hosts/dfs.hosts.exclude 允许或禁止的DataNode列表

mapreduce.jobtracker.hosts.filename/

mapreduce.jobtracker.hosts.exclude.filename
允许或禁止的TaskTrackers列表

mapreduce.cluster.job-authorization-enabled 布尔类型，表示Job，存储控制列表是否支持对Job的观察和修改

【大数据系列】hadoop集群的配置的更多相关文章

大数据测试之hadoop集群配置和测试
大数据测试之hadoop集群配置和测试一.准备(所有节点都需要做):系统:Ubuntu12.04java版本:JDK1.7SSH(ubuntu自带)三台在同一ip段的机器,设置为静态IP机器分配 ...
大数据中Hadoop集群搭建与配置
前提环境是之前搭建的4台Linux虚拟机,详情参见 Linux集群搭建该环境对应4台服务器,192.168.1.60.61.62.63,其中60为主机,其余为从机软件版本选择: Java:JDK1 ...
大数据学习——HADOOP集群搭建
4.1 HADOOP集群搭建 4.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主 ...
大数据平台Hadoop集群搭建
一.概念 Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce.HDFS是一个分布式文件系统,类似mogilef ...
Java+大数据开发——Hadoop集群环境搭建(一)
1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有 NameNode / DataN ...
Java+大数据开发——Hadoop集群环境搭建(二)
1. MAPREDUCE使用 mapreduce是hadoop中的分布式运算编程框架,只要按照其编程规范,只需要编写少量的业务逻辑代码即可实现一个强大的海量数据并发处理程序 2. Demo开发--wo ...
大数据之hadoop集群安全模式
集群安全模式1.概述(1)NameNode启动 NameNode启动时,首先将镜像文件(Fsimage)载入内存,并执行编辑日志(Edits)中的各项操作.-旦在内存中成功建立文件系统元数据的影像,则 ...
大数据学习——hadoop集群搭建2.X
1.准备Linux环境 1.0先将虚拟机的网络模式选为NAT 1.1修改主机名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=itcast ### ...
【Big Data】HADOOP集群的配置（二）
Hadoop集群的配置(二) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...
【Big Data】HADOOP集群的配置（一）
Hadoop集群的配置(一) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...

随机推荐

Linux下的rename命令
Dos/Windows下,对文件改名用rename.而书上说,Linux下对文件或目录改名该用mv.我一直也是这样做的,却忽略了Linux下也有个叫rename的命令.都是rename,但功能上就有点 ...
C# 校验Email（电子邮件）地址是否合法
用于校验给定的Email地址是否合法,只针对用于提供的Email地址的格式,不对其是否真实存在进行校验. /// <summary> /// 验证EMail是否合法 /// </su ...
Redis系列-php怎么通过redis扩展使用redis
From: http://blog.csdn.net/love__coder/article/details/8691679 通过前面几篇blog,我们应该对redis有个大致的认识,这里再讲解下,p ...
GBT算法在拖动滑块辨别人还是机器中的应用
1.数据源格式:(x,y,t),第一个值x是x坐标范围是1-250的整数,y是1-10的整数,t是滑块从上一个坐标到下一个坐标的时间差,ok是判断是人操作的,Fail是判断是机器操作的,数据看的出,同 ...
mysql 解压版方法
来自http://zhidao.baidu.com/link?url=RtXb2QKYTQ8Yd5TdTS7XHHiupzDaM19vlVBIrHTVmT7ZHi8kG3O9L6D6nnsfTGE-- ...
php无限分类二
1.读取数据数据 /** * 所有分类数据 * */ public function categoryData(){ $order = 'id,sort asc'; $res = $this-> ...
使用vi时提示 write error in swap file
今天使用vi 命令时,提示write error in swap file 查了下原因,磁盘空间不够 df -h 使用 rm -rf 文件名 ,删除不用的使用 echo "" & ...
详解ABBYY FineReader 12扫描亮度设置
很多刚接触ABBYY FineReader 12的小伙伴可能出现过这样一个问题:在扫描过程中会显示一条消息以提示更改亮度设置.这是因为你 FineReader扫描设置中亮度未正确设置.下面小编就给小伙 ...
Linux 查看磁盘分区、文件系统、磁盘的使用情况相关的命令和工具介绍
https://www.cnblogs.com/alexyuyu/articles/3454907.html
php中实现记住密码下次自动登录的例子
这篇文章主要介绍了php中实现记住密码下次自动登录的例子,本文使用cookie实现记住密码和自动登录功能,需要的朋友可以参考下做网站的时候经常会碰到要实现记住密码,下次自动登录,一周内免登陆,一个月 ...

守护进程（Daemoon）	配置选项（Configure Options）
NameNode	HADOOP_NAMENODE_OPTS
DataNode	HADOOP_DATANODE_OPTS
SecondaryNameNode	HADOOP_SECONDARYNAMENODE_OPTS
JobTracker	HADOOP_JOBTRACKER_OPTS
TackTracker	HADOOP_TASKTRACKER_OPTS

参数（Parameter）	值（Value）
fs.default.name	NameNode的IP地址及端口

参数（Parameter）	值（Value）
dfs.name.dir	NameNode存储名字空间及汇报日志的位置
dfs.data.dir	DataNode存储数据块的位置

参数（Parameter）	值（Value）
mapreduce.jobtracker.address	JobTracker的IP地址及端口
mapreduce.jobtracker.system.dir	MapReduce在HDFS上存储文件的位置
mapreduce.cluster.local.dir	MapReduce的缓存数据存储在文件系统中的位置
mapred.tasktracker.{map\|reduce}.tasks.maximum	每台TaskTracker所能运行的Map或Reduce的task最大数量
dfs.hosts/dfs.hosts.exclude	允许或禁止的DataNode列表
mapreduce.jobtracker.hosts.filename/ mapreduce.jobtracker.hosts.exclude.filename	允许或禁止的TaskTrackers列表
mapreduce.cluster.job-authorization-enabled	布尔类型，表示Job，存储控制列表是否支持对Job的观察和修改

【大数据系列】hadoop集群的配置

一、hadoop的配置文件分类

1、只读类型的默认文件

2、定位设置

3、守护进程设置

二、守护进程配置表

三、core-site hdfs-site mapred-site的配置

1、core-site.xml

2、hdfs-site.xml

3、mapred-site.xml

【大数据系列】hadoop集群的配置的更多相关文章

随机推荐

热门专题