琐碎-关于hadoop2.2.0

HDFS模块功能

namenode：主节点，存储文件的元数据如文件名、文件目录结构、文件属性（生成时间、副本数、文件权限）、以及每个文件的块列表和块所在的datanode等；
datanode：在本地文件系统存储文件块数据，以及块的校验和；
secondary namenode：用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照；

YARN模块功能

ResourceManager：

处理客户端请求；
启动/监控ApplicationMaster；
监控NodeManager；
资源分配和调度；

NodeManager：

单个节点的资源管理；
处理来自ResourceManager的命令；
处理来自ApplicationManager的命令；

ApplicationMaster：

数据切分；
为应用程序申请资源，并分配给内部任务；
任务监控和容错；

Container：

对任务运行环境的抽象，封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关信息；

MR模块功能

... ...

日志

启动日志文件目录 $HADOOP_HOME/logs;
日志格式 .out和.log

　　　　.log:通过log4j记录的，大部分的应用日志信息；

　　　　.out:记录标准输出和标准错误日志，少。

　日志命名规则

　　　　框架名称-用户名-进程名-主机名-日志格式后缀

目录sbin里面的启动脚本中有hadoop-daemon.sh、yarn-daemon.sh和hadoop-daemons.sh、yarn-daemon.sh

它们有什么区别呢？

hadoop-daemon.sh分别启动每个进程，在slave上也要手动去敲命令

而hadoop-daemon.sh只需要在namenode中就可以，它从配置文件中获取所有的slave，然后远程上去调用hadoop-daemon.sh启动单个进程。

yarn-daemon.sh也一样。

历史服务器

1.x中有jobtracker，2.x中没有，那怎么从web ui中查看历史作业运行情况呢？

那就是historyserver。

默认情况下历史服务器不启动

启动命令和关闭命令

sbin/mr-jobhistory-daemon.sh start historyserver
sbin/mr-jobhistory-daemon.sh stop historyserver

web UI地址： http://master:19888/

在2.X中多了一种针对MR小作业的优化机制：Uber模式

在运行一个作业的时候会有一条输出语句为Job job_xxxxxx_xxxx running in uber mode:false/true

如果作业足够小，则所有的task在一个JVM（mr app master）中完成作业，比每个task启动一个container更划算

手动设置参数：mapreduce.job.ubertask.enable 默认为 false

notepad+FZ+SecureCRT这个组合还不错

琐碎-关于hadoop2.2.0的更多相关文章

琐碎-hadoop2.2.0伪分布式和完全分布式安装（centos6.4）
环境是centos6.4-32,hadoop2.2.0 伪分布式文档:http://pan.baidu.com/s/1kTrAcWB 完全分布式文档:http://pan.baidu.com/s/1s ...
Hadoop2.2.0安装过程记录
1 安装环境1.1 客户端1.2 服务端1.3 安装准备 2 操作系统安装2.1.1 BIOS打开虚拟化支持2.1.2 关闭防火墙2.1.3 安装 ...
CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
ubuntu14.04 安装 hadoop2.4.0
转载:ubuntu搭建hadoop-Ver2.6.0完全分布式环境笔记自己在搭建hadoop平台时,碰到一些困难,按照该博文解决了问题,转载一下,作为记录. 2 先决条件确保在你集群中的每个节点上 ...
Hadoop-1.2.1 升级到Hadoop-2.6.0 HA
Hadoop-1.2.1到Hadoop-2.6.0升级指南作者陈雪冰修改日期 2015-04-24 版本 1.0 本文以hadoop-1.2.1升级到hadoop-2.6.0 Z ...
Hadoop2.6.0安装 — 集群
文 / vincentzh 原文连接:http://www.cnblogs.com/vincentzh/p/6034187.html 这里写点 Hadoop2.6.0集群的安装和简单配置,一方面是为自 ...
Hadoop2.6.0安装—单机/伪分布
目录环境准备创建hadoop用户更新apt 配置SSH免密登陆安装配置Java环境安装Hadoop Hadoop单机/伪分布配置单机Hadoop 伪分布Hadoop 启动Hadoop 停止 ...
最详细的hadoop2.2.0集群的HA高可靠的最简单配置
简介 [from http://www.open-open.com/lib/view/open1390717631132.html] hadoop中的NameNode好比是人的心脏,非常重要,绝对不可 ...
hadoop2.2.0伪分布式搭建3--安装Hadoop
3.1上传hadoop安装包 3.2解压hadoop安装包 mkdir /cloud #解压到/cloud/目录下 tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/ 3 ...

随机推荐

无序数组a，求a[i]-a[j]的最大值，且i<j
一道面试题:对于无序数组a,求a[i]-a[j]的最大值,其中i<j package test; import java.util.Arrays; public class FindMax { ...
bzoj 2594 [Wc2006]水管局长数据加强版（LCT+最小生成树）
[深坑勿入] [给个链接] http://blog.csdn.net/popoqqq/article/details/41348549 #include<cstdio> #include& ...
LyX转Word
写毕业论文是一件非常繁锁的事情,一大堆的图片.公式都要往上贴,有时弄不好就把编号搞错了,有时可能没注意,一不小心字体格式.版面格式又全乱了.怎么办?--其实这只是在word环境下才会有的烦恼. 对于w ...
Hadoop2.2.0(yarn)编译部署手册
Created on 2014-3-30URL : http://www.cnblogs.com/zhxfl/p/3633919.html @author: zhxfl Hadoop-2.2编译 ...
jsp文件上传、下载
一.文件上传上传文件是Web开发中经常要用到的功能:例如在基于B/S的人事信息管理系统中上传照片,在新闻发布系统中上传图片等等.....要实现文件上传功能,就需要综合利用java中的文件输入和输出相 ...
Java邮件服务学习之二：SMTP和POP3
一.SMTP SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则.SMTP协议属于TCP/IP协议簇,它帮助每台计算 ...
ocp 1Z0-042 1-60题解析
1. Because of a power outage,instance failure has occurred. From what point in the redo log does rec ...
[iOS UI进阶 - 6.1] 核心动画CoreAnimation
A.基本知识 1.概念 Core Animation是一组非常强大的动画处理API,使用它能做出非常炫丽的动画效果,而且往往是事半功倍,使用它需要先添加QuartzCore.framework和引入对 ...
Unity3D行为树插件Behave学习笔记
Behave1.4行为树插件下载地址:http://pan.baidu.com/s/1i4uuX0L 安装插件和使用我们先来看看插件的安装和基本使用方法,新建一个Unity3D项目,这里我使用的是 ...
hadoop2.1.0和hadoop2.2.0编译安装教程
由于现在hadoop2.0还处于beta版本,在apache官方网站上发布的beta版本中只有编译好的32bit可用,如果你直接下载安装在64bit的linux系统的机器上,运行会报一个INFO ut ...

琐碎-关于hadoop2.2.0

琐碎-关于hadoop2.2.0的更多相关文章

随机推荐

热门专题