Hadoop集群管理之配置文件

一、配置文件列表如下：

[hadoop@node1 conf]$ pwd

/app/hadoop/conf

[hadoop@node1 conf]$ echo $HADOOP_HOME

/app/hadoop

[hadoop@node1 conf]$ ll

总计 60

-rw-rw-r-- 1 hadoop hadoop 3936 2010-02-19 15:55 capacity-scheduler.xml

-rw-rw-r-- 1 hadoop hadoop  535 2010-02-19 15:55 configuration.xsl

-rw-rw-r-- 1 hadoop hadoop  435 2014-02-28 22:15 core-site.xml

-rw-rw-r-- 1 hadoop hadoop 2226 2014-02-28 10:16 hadoop-env.sh

-rw-rw-r-- 1 hadoop hadoop 1245 2010-02-19 15:55 hadoop-metrics.properties

-rw-rw-r-- 1 hadoop hadoop 4190 2010-02-19 15:55 hadoop-policy.xml

-rw-r--r-- 1 hadoop hadoop 1652 2014-02-28 21:55 hbase-site.xml

-rw-rw-r-- 1 hadoop hadoop  664 2014-02-28 15:12 hdfs-site.xml

-rw-rw-r-- 1 hadoop hadoop 2815 2010-02-19 15:55 log4j.properties

-rw-rw-r-- 1 hadoop hadoop  266 2014-02-28 10:15 mapred-site.xml

-rw-rw-r-- 1 hadoop hadoop   14 2014-02-28 15:16 masters

-rw-rw-r-- 1 hadoop hadoop   28 2014-02-28 10:15 slaves

-rw-rw-r-- 1 hadoop hadoop 1243 2010-02-19 15:55 ssl-client.xml.example

-rw-rw-r-- 1 hadoop hadoop 1195 2010-02-19 15:55 ssl-server.xml.example

二、常用配置文件
    2.1、hadoop-env.sh：记录脚本要用的环境变量；
    2.2、core-site.xml：Hadoop核心配置项；
    2.3、hdfs-site.xml：Hadoop守护进程配置项，例如：namenode，secondarynamenode和datanode等；
    2.4、mapred-site.xml：MapReduce守护进程配置项，包括jobtracker和tasktracker；
    2.5、master：运行secondarynamenode(而不是namenode)的机器列表(每行一个)。只在namenode或jobtracker节点上使用，无需同步到各节点；
    2.6、slave：运行datanode和tasktracker的机器列表(每行一个)。只在namenode或jobtracker节点上使用，无需同步到各节点。
    2.7、hadoop-metrics.properties：ganglia监控的配置文件

三、控制脚本

3.1、start-dfs.sh：在本地节点启动namenode，在slave文件指定的每个节点启动datanode，在master文件指定的每个节点启动secondarynamenode
    3.2、start-mapred.sh：在本地节点启动jobtracker，在slave文件指定的每个节点启动tasktracker。
    3.3、start-all.sh：依次调用start-dfs.sh和start-mapred.sh
    3.4、stop-dfs.sh/stop-mapred.sh/stop-all.sh：前面的start脚本对应的关闭脚本。
    3.5、hadoop-daemon.sh：上述脚本调用它来执行启动和终止hadoop守护进程。如果用户需要从其他系统或自己编写脚本控制hadoop守护进程，可以调用它。
    3.6、hadoop-daemons.sh：用于在多个主机上启动同一hadoop守护进程。

四、守护进程管理

对于小型集群（几十个节点），可以将namenode、secondarynamenode、jobtracker放到单独一台机器上，但对于大型集群，最好分别放到不同的机器上。

4.1、namenode：在内存中保存整个命名空间的所有文件和块元数据，它的内存需求很大。
4.2、secondnamenode：保存一份最新的检查点，记录文件系统的元数据，有助于在数据丢失或系统崩溃时恢复namenode的元数据；它在大多时候空闲，但它创建检查时的内存需求和namenode差不多。一旦文件系统包含大量文件，单台主机可能无法同时运行namenode和secondarynamenode。
4.3、jobtracker：在一个运行大量mapreduce作业的高负载集群上，jobtracker会使用大量内存和CPU资源，因此它最好运行在一个专用节点上。
HDFS控制脚本需要在namenode机器上运行；mapreduce控制脚本需要在jobtracker机器上运行。

Hadoop集群管理之配置文件的更多相关文章

Hadoop集群管理
1.简介 Hadoop是大数据通用处理平台,提供了分布式文件存储以及分布式离线并行计算,由于Hadoop的高拓展性,在使用Hadoop时通常以集群的方式运行,集群中的节点可达上千个,能够处理PB级的数 ...
Hadoop集群管理--保证集群平稳地执行
本篇介绍为了保证Hadoop集群平稳地执行.须要深入掌握的知识.以及一些管理监控的手段,日常维护的工作. HDFS 永久性数据结构对于管理员来说.深入了解namenode,辅助namecode和da ...
Hadoop集群管理之内存管理
1.内存 Hadoop为各个守护进程(namenode,secondarynamenode,jobtracker,datanode,tasktracker)统一分配的内存在hadoop-env.sh中 ...
zookeeper安装和应用场合（名字，配置，锁，队列，集群管理）
安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础,最新的版本可以通过官网http://hadoop.apache.org/zookeeper/ 来获取,Zookee ...
大数据开发学习之构建Hadoop集群-(0)
有多种方式来获取hadoop集群,包括从其他人获取或是自行搭建专属集群,抑或是从Cloudera Manager 或apach ambari等管理工具来构建hadoop集群等,但是由自己搭建则可以了解 ...
Eclipse提交任务至Hadoop集群遇到的问题
环境:Windows8.1,Eclipse 用Hadoop自带的wordcount示例 hadoop2.7.0 hadoop-eclipse-plugin-2.7.0.jar //Eclipse的插件 ...
容器、容器集群管理平台与 Kubernetes 技术漫谈
原文:https://www.kubernetes.org.cn/4786.html 我们为什么使用容器? 我们为什么使用虚拟机(云主机)? 为什么使用物理机? 这一系列的问题并没有一个统一的标准答案 ...
大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
Apache Hadoop 2.9.2 的集群管理之服役和退役
Apache Hadoop 2.9.2 的集群管理之服役和退役作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 随着公司业务的发展,客户量越来越多,产生的日志自然也就越来越大来,可能 ...

随机推荐

[BS] 小知识点总结-05
[BS] 小知识点总结-05 1. 不论UIWindow的rootViewController是navC.tabBarC还是VC,也不管modalVC和rootVC中间隔着多少个VC,但是modal出 ...
Power-BI费用分析
费用分析主要从财务三大费用入手,剖析费用的结构.用途.占用等情况,从三大费用到明细费用.部门.职员的层层钻取,从而有效地进行费用管理和控制.Power-BI前端展示:图1<ignore_js_o ...
python 模块zlib 压缩与解压
例子1:压缩与解压字符串 import zlib message = 'abcd1234' compressed = zlib.compress(message) decompressed = zli ...
Java IO读取文件之二
package com.lf.iopreoject; import java.io.BufferedReader; import java.io.File; import java.io.FileIn ...
终于发现为什么SQL没有释放句柄，原来是保存句柄的变量被覆盖了，丢失了原来的句柄
stmt = xxx , stmt = yyy , stmt.close() 之前的xxx 没有close掉
electron Uncaught ReferenceError: jQuery is not defined
用electron写桌面程序时 ui部分的html页面引入的js会用到jquery 用常规的方式引入是不行的,会抛出如题的异常 <script type="text/javascrip ...
Java Socket常见异常处理和网络编程需要注意的问题
在java网络编程Socket通信中,通常会遇到以下异常情况: 第1个异常是 java.net.BindException:Address already in use: JVM_Bind. 该异常发 ...
试用windows Azure
试用windows Azure, 需要国外手机注册,信用卡注册. windows操作系统,只有2008R2,2012,2012R2可以选择,我选择XS最低档,然后选2012R2,欧洲数据中心,那个慢啊 ...
单链表的回文判断(O(n)时间复杂度和O(1)的空间复杂度)
对于单链表来说,判断回文最简单的方法就是遍历链表,将链表中的元素复制到数组中,然后对数组进行判断是否是回文数组,但是这不符合O(1)的空间复杂度. 由于空间复杂度的要求,需要就地操作链表,不能开辟多余 ...
c语言的一些库
1利用DEv编程的时候遇见sleep函数 ..注意S大写,并添加#include<windows.h>.

Hadoop集群管理之配置文件

Hadoop集群管理之配置文件的更多相关文章

随机推荐

热门专题