深入剖析HADOOP程序日志

前提

本文来自于博客园逖靖寒的世界 http://gpcuster.cnblogs.com

正文

本文来自于博客园逖靖寒的世界 http://gpcuster.cnblogs.com

*.log日志文件和*.out日志文件

进入我们的Hadoop_LOG目录，我们可以看到如下文件：

在启动Hadoop集群时，由hadoop-daemon.sh脚本指定一些列环境变量，然后log4j.properties文件读取相应的环境变量产生对应的*.log日志文件。这个日志文件输出类型为org.apache.log4j.DailyRollingFileAppender，它会自动按天更新。

*.out文件则是启动某个程序的标准输出重定向。

比如：

hadoop-admin-datanode-horde20.log是在horde20这台机器上启动datanode进程的日志输出，由log4j实现。

hadoop-admin-datanode-horde20.out则是在horde20这台机器上启动datanode时的标准输出。

这些日志仅仅包含在horde20这台机器上启动datanode进程的日志，没有其他的信息。

userlogs目录下的日志文件

进入userlogs目录，我们可以看到：

这里的每一个目录代表每一个task的输出日志。

进入其中一个目录可以看到：

这里的stderr和stdout记录了我们的task（map or reduce）的在这台机器上运行的过程中所产生的标准错误输出和标准输出。这些信息集群中的每一个机器上都会出现，如果数据量足够多的话:)

syslog则记录了在我们的task中，通过log4j接口记录的日志信息。

每一个task都会通过TaskRunner.run()来启动，它会为每一个子java程序指定标准错误输出和标准输出到前面提到的文件中，同时设置相应的参数，其中包括”-Dhadoop.root.logger=INFO,TLA”，这个TLA的定义可以在log4j.properties文件中找到，具体实现是org.apache.hadoop.mapred.TaskLogAppender。这个参数指定了在我们的task中，通过log4j接口记录的日志信息都记录到syslog中。

history目录下的日志文件

进入jobtracker机器的history目录，我们可以看到：

horde20_1250841267760_job_200908211554_0001_conf.xml记录了我们运行这个job时候的配置文件信息。

horde20_1250841267760_job_200908211554_0001_admin_wordcount记录了我们运行这个job的情况。

他们是由JobHistory产生的，并且只在jobtracker机器上产生。

EventCounter

在Hadoop的默认配置log4j.properties中，所有通过log4j接口记录的日志信息还会记录到一个叫EventCounter的Appender中，它的实现是org.apache.hadoop.metrics.jvm.EventCounter，具体的作用是统计Hadoop中使用log4j记录INFO，WARN，ERROR，FATAL信息的次数。

后记

本文介绍了Hadoop中所有的程序日志的来源和作用。希望能给开发和维护人员以帮助。

如果希望完全了解Hadoop的运行状况信息，还需要参考counter和metric。

转自：http://www.cnblogs.com/gpcuster/archive/2009/08/21/1551715.html

深入剖析HADOOP程序日志的更多相关文章

使用LogMaster4Net实现应用程序日志的集中管理
日志在软件系统中的重要性我在此也不赘述了,几乎所有程序员每天都会更日志打交道. 那么你是否曾今为这样的一些事情而困扰过: - 远程登录到不同的服务器,找到应用程序目然后查看应用日志: - 来回切换于不 ...
C# 使用Log4Net记录程序日志
在之前的博客中,写过使用系统内置的Trace类记录程序日志,具体请参考:C# 使用Trace记录程序日志.这篇博客将介绍如何使用Log4Net记录程序日志. 首先需要引用Log4Net.dll,我们可 ...
Hive分析hadoop进程日志
想把hadoop的进程日志导入hive表进行分析,遂做了以下的尝试. 关于hadoop进程日志的解析使用正则表达式获取四个字段,一个是日期时间,一个是日志级别,一个是类,最后一个是详细信息, 然后在 ...
使用Monitor调试Unity3D Android程序日志输出（非DDMS和ADB)
使用Monitor调试Unity3D Android程序日志输出(非DDMS和ADB) http://www.cnblogs.com/mrkelly/p/4015245.html 以往调试Androi ...
IntelliJ IDEA + Maven环境编写第一个hadoop程序
1. 新建IntelliJ下的maven项目点击File->New->Project,在弹出的对话框中选择Maven,JDK选择你自己安装的版本,点击Next 2. 填写Maven的Gr ...
写window应用程序日志System.Diagnostics.EventLog.WriteEntry
System.Diagnostics.EventLog.WriteEntry( MySource , Writing to event log. ); 可以写window应用程序日志查看的地方:右击 ...
eclipse运行hadoop程序报错:Connection refused: no further information
eclipse运行hadoop程序报错:Connection refused: no further information log4j:WARN No appenders could be foun ...
WIN7下运行hadoop程序报：Failed to locate the winutils binary in the hadoop binary path
之前在mac上调试hadoop程序(mac之前配置过hadoop环境)一直都是正常的.因为工作需要,需要在windows上先调试该程序,然后再转到linux下.程序运行的过程中,报Failed to ...
运行第一个Hadoop程序，WordCount
系统: Ubuntu14.04 Hadoop版本: 2.7.2 参照http://www.cnblogs.com/taichu/p/5264185.html中的分享,来学习运行第一个hadoop程序. ...

随机推荐

MM中如何更改物料的评估类
在SAP MM模块中,一物料XXX ,由原来的外购,变成厂内自制:评估类也由原来的7901 改为:7900 : 注:物料的评估类,对应一些帐号,对发生的为业,产生的数据,记录在相对的帐号里: 如要更改 ...
linux笔记：linux常用命令-文件搜索命令
文件搜索命令:find(文件搜索) 一些示例: 注意:在以文件名为条件进行搜索时,支持通配符. 多条件搜索,以及直接对搜索到的文件进行操作: 文件搜索命令:locate(在文件资料库中查找文件) 文件 ...
hdu 2570
贪心的经典题型该死的精度问题,WA了好几次,以后能用乘的绝不用除!! #include<iostream> #include<algorithm> #include<c ...
python 练习 30
Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的.本章节我们将详细介绍Python的面向对象编程. 如果你以前没有接触过面向对象的编程语言,那你 ...
《Java程序设计》学期总结
<Java程序设计> 学期总结课程设计小组 -迦瓦栈队团队博客读书笔记汇总第一周第二周第三周第四周第五周第六周第七周第八周第九周第十周实验报告汇总实验一实验 ...
python 写入csv文件
import csv fieldnames = ['Column1', 'Column2', 'Column3', 'Column4'] rows = [{'Column1': '0', 'Col ...
JavaScript设计模式的简单理解
设计模式可以理解为一系列的代码框架,我觉得主要涉及封装的概念.把实现某一功能的代码段封装在函数中,可以方便调用,同时利于代码的复用,提高了代码的可维护性.下面简单介绍一下几种设计模式的个人感受. 1. ...
jquery mobile 请求数据方法执行时显示加载中提示框
在jquery mobile开发中,经常需要调用ajax方法,异步获取数据,如果异步获取数据方法由于网速等等的原因,会有一个反应时间,如果能在点击按钮后数据处理期间,给一个正在加载的提示,客户体验会更 ...
JVM调优（这里主要是针对优化基于分布式Mahout的推荐引擎）
优化推荐系统的JVM关键参数 -Xmx 设定Java允许使用的最大堆空间.例如-Xmx512m表示堆空间上限为512MB -server 现代JVM有两个重要标志:-client和-server,分别 ...
oracle 里面定时执行任务，比如存储过程内容等
DECLARE job_no_ NUMBER; BEGIN DBMS_JOB.SUBMIT(job_no_, 'proc_qszx_dw_sc(' ...

深入剖析HADOOP程序日志

深入剖析HADOOP程序日志

前提

正文

后记

深入剖析HADOOP程序日志的更多相关文章

随机推荐

热门专题