关于hadoop的运行的一些指标监控（非cdh平台的）

在hadoop-env.sh中添加：

# 在配置namenode和datanode时都会有用到JMX_OPTS的代码，是为了减少重复提取出的公共代码

export JMX_OPTS="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.port"

# 在源hadoop-env.sh中存在$JMX_OPTS之前的代码，JMX_OPTS=8006表示设置jmx的端口

export HADOOP_NAMENODE_OPTS="-Dhadoop.security.logger=${HADOOP_SECURITY_LOGGER:-INFO,RFAS} -Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO,NullAppender} $HADOOP_NAMENODE_OPTS $JMX_OPTS=8006"

export HADOOP_DATANODE_OPTS="-Dhadoop.security.logger=ERROR,RFAS $HADOOP_DATANODE_OPTS $JMX_OPTS=8007"

export HADOOP_SECONDARYNAMENODE_OPTS="-Dhadoop.security.logger=${HADOOP_SECURITY_LOGGER:-INFO,RFAS} -Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO,NullAppender} $HADOOP_SECONDARYNAMENODE_OPTS $JMX_OPTS=8060"

在web页面查看只需要：

df1:50070/jmx

df2:50075/jmx

df3:50075/jmx

Hadoop监控项

指标信息来源：http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/Metrics.html

NameNode

JVM监控项

Hadoop:service=NameNode,name=JvmMetrics

JvmMetrics 主要统计的信息包括：内存的使用状态信息； GC 的统计信息；线程的统计信息；以及事件的统计信息。

类型	指标项	说明
内存	MemNonHeapUsedM	JVM 当前已经使用的 NonHeapMemory 的大小
内存	MemNonHeapMaxM	JVM 配置的 NonHeapMemory 的大小
内存	MemHeapUsedM	JVM 当前已经使用的 HeapMemory 的大小
内存	MemHeapMaxM	JVM 配置的 HeapMemory 的大小
内存	MemMaxM	JVM 运行时的可以使用的最大的内存的大小
GC	GcCount	GC次数
线程	ThreadsNew	当前线程的处于 NEW 状态下的线程数量
线程	ThreadsRunnable	当前线程的处于 RUNNABLE 状态下的线程数量
线程	ThreadsBlocked	当前线程的处于 BLOCKED 状态下的线程数量
线程	ThreadsWaiting	当前线程的处于 WAITING 状态下的线程数量
线程	ThreadsTimedWaiting	当前线程的处于 TIMED_WAITING 状态下的线程数量
线程	ThreadsTerminated	当前线程的处于 TERMINATED 状态下的线程数量
事件	LogFatal	固定时间间隔内的 Fatal 的数量
事件	LogError	固定时间间隔内的 Error 的数量
事件	LogWarn	固定时间间隔内的 Warn 的数量
事件	LogInfo	固定时间间隔内的 Info 的数量

FSNamesystem

Hadoop:service=NameNode,name=FSNamesystem

指标项	说明
MissingBlocks	当前遗失的block数量
ExpiredHeartbeats	失去心跳的总数量
TransactionsSinceLastCheckpoint	自上次检查点以来的事务总数
TransactionsSinceLastLogRoll	自上次编辑日志卷以来的事务总数
LastCheckpointTime	从上一个检查点以来的时间(毫秒)
CapacityTotal	当前数据节点的原始容量(以字节为单位)
CapacityUsed	当前在所有DataNode中使用的容量(以字节为单位)
CapacityRemaining	当前剩余容量(字节)
CapacityUsedNonDFS	DataNodes用于非DFS目的的当前空间(以字节为单位)
TotalLoad	当前连接数
SnapshottableDirectories	可快照目录的当前数量
FilesTotal	当前文件和目录的数量
PendingDataNodeMessageCount	待机NameNode中用于以后处理的挂起的与块相关的消息的当前数量
StaleDataNodes	由于心跳延迟而标记为过期的DataNodes当前数目

Hadoop:service=NameNode,name=FSNamesystemState

指标项	说明
BlocksTotal	系统中当前分配的块数
NumLiveDataNodes	当前运行的数据节点数量
NumDeadDataNodes	当前死亡的数据节点数
VolumeFailuresTotal	所有Datanodes的卷故障总数
EstimatedCapacityLostTotal	容量故障导致的总容量损失估计

RPC

Hadoop:service=NameNode,name=RpcActivityForPort9000(需要进一步确认)

指标项	说明
ReceivedBytes	接收字节总数
SentBytes	发送字节总数
RpcQueueTimeNumOps	RPC调用总数
RpcQueueTimeAvgTime	RPC队列平均时间（以毫秒为单位）

NameNodeActivity

Hadoop:service=NameNode,name=NameNodeActivity

指标项	说明
CreateFileOps	创建文件的操作总数
FilesRenamed	重命名操作的总数(不是重命名的文件或目录数量)
DeleteFileOps	删除文件的操作总数

DataNode

JVM监控项

Hadoop:service=DataNode,name=JvmMetrics

JvmMetrics 主要统计的信息包括：内存的使用状态信息； GC 的统计信息；线程的统计信息；以及事件的统计信息。

类型	指标项	说明
内存	MemNonHeapUsedM	JVM 当前已经使用的 NonHeapMemory 的大小
内存	MemNonHeapMaxM	JVM 配置的 NonHeapMemory 的大小
内存	MemHeapUsedM	JVM 当前已经使用的 HeapMemory 的大小
内存	MemHeapMaxM	JVM 配置的 HeapMemory 的大小
内存	MemMaxM	JVM 运行时的可以使用的最大的内存的大小
GC	GcCount	GC次数
线程	ThreadsNew	当前线程的处于 NEW 状态下的线程数量
线程	ThreadsRunnable	当前线程的处于 RUNNABLE 状态下的线程数量
线程	ThreadsBlocked	当前线程的处于 BLOCKED 状态下的线程数量
线程	ThreadsWaiting	当前线程的处于 WAITING 状态下的线程数量
线程	ThreadsTimedWaiting	当前线程的处于 TIMED_WAITING 状态下的线程数量
线程	ThreadsTerminated	当前线程的处于 TERMINATED 状态下的线程数量
事件	LogFatal	固定时间间隔内的 Fatal 的数量
事件	LogError	固定时间间隔内的 Error 的数量
事件	LogWarn	固定时间间隔内的 Warn 的数量
事件	LogInfo	固定时间间隔内的 Info 的数量

DataNodeActivity

Hadoop:service=DataNode,name=DataNodeActivity-dev02-50010(需要进一步确认)

指标项	说明
BytesWritten	写入DataNode的字节总数
BytesRead	读取DataNode的字节总数
ReadsFromLocalClient	从本地客户端读取操作的总数
ReadsFromRemoteClient	来自远程客户端的读取操作总数
WritesFromLocalClient	本地客户端的写操作总数
WritesFromRemoteClient	远程客户端的写操作总数
RemoteBytesRead	远程客户端读取的字节数
RemoteBytesWritten	远程客户端写入的字节数
RamDiskBytesWrite	写入内存的字节总数
VolumeFailures	发生的卷故障总数
ReadBlockOpNumOps	读操作总数
WriteBlockOpNumOps	写操作总数
ReadBlockOpAvgTime	读操作的平均时间（以毫秒为单位）
WriteBlockOpAvgTime	写操作的平均时间（以毫秒为单位）
TotalWriteTime	写操作花费的总毫秒数
TotalReadTime	读操作花费的总毫秒数

RPC

Hadoop:service=DataNode,name=RpcActivityForPort50020(需要进一步确认)

指标项	说明
ReceivedBytes	接收字节总数
SentBytes	发送字节总数
RpcQueueTimeNumOps	RPC调用总数
RpcQueueTimeAvgTime	RPC队列平均时间（以毫秒为单位）

关于hadoop的运行的一些指标监控（非cdh平台的）的更多相关文章

Amazon EMR（Elastic MapReduce）：亚马逊Hadoop托管服务运行架构&Hadoop云服务之战：微软vs.亚马逊
http://s3tools.org/s3cmd Amazon Elastic MapReduce (Amazon EMR)简介 Amazon Elastic MapReduce (Amazon EM ...
SpringBoot第十二集：度量指标监控与异步调用（2020最新最易懂）
SpringBoot第十二集:度量指标监控与异步调用(2020最新最易懂) Spring Boot Actuator是spring boot项目一个监控模块,提供了很多原生的端点,包含了对应用系统的自 ...
图解JanusGraph系列 - JanusGraph指标监控报警（Monitoring JanusGraph）
大家好,我是洋仔,JanusGraph图解系列文章,实时更新~ 图数据库文章总目录: 整理所有图相关文章,请移步(超链):图数据库系列-文章总目录源码分析相关可查看github(码文不易,求个sta ...
【03】SpringBoot2核心技术-核心功能—数据访问_单元测试_指标监控
3.数据访问(SQL) 3.1 数据库连接池的自动配置-HikariDataSource 1.导入JDBC场景 <dependency> <groupId>org.spring ...
业务监控-指标监控（v1）
最近做了指标监控系统的后台,包括需求调研.代码coding.调试调优测试等,穿插其他杂事等前后花了一个月左右. 指标监控指的是用户通过接口上传某些指标信息,并且通过配置阈值公式和告警规则等信息监测自己 ...
利用Mahout实现在Hadoop上运行K-Means算法
利用Mahout实现在Hadoop上运行K-Means算法一.介绍Mahout Mahout是Apache下的开源机器学习软件包,目前实现的机器学习算法主要包含有协同过滤/推荐引擎,聚类和分类三个部 ...
Hadoop学习总结之五：Hadoop的运行痕迹
Hadoop学习总结之五:Hadoop的运行痕迹 Hadoop 学习总结之一:HDFS简介 Hadoop学习总结之二:HDFS读写过程解析 Hadoop学习总结之三:Map-Reduce入门 Ha ...
Hadoop的运行痕迹
http://www.cnblogs.com/forfuture1978/archive/2010/11/23/1884967.html 一篇讲的很好的 hadoop 基本运行环境配置信息
Hadoop源码分析(3): Hadoop的运行痕迹
在使用hadoop的时候,可能遇到各种各样的问题,然而由于hadoop的运行机制比较复杂,因而出现了问题的时候比较难于发现问题. 本文欲通过某种方式跟踪Hadoop的运行痕迹,方便出现问题的时候可以通 ...

随机推荐

python类方法以及类调用实例方法的理解
classmethod类方法 1) 在python中.类方法 @classmethod 是一个函数修饰符,它表示接下来的是一个类方法,而对于平常我们见到的则叫做实例方法. 类方法的第一个参数cls,而 ...
fork子进程
title: fork子进程 data: 2019/3/21 20:24:39 toc: true --- 这里实在学习socket编程前的小知识点,用来创建多个服务端学习文档函数可以有两个返回值 ...
JAVA集合2--Collection架构
Collectin有两个分支:List和Set List是有序集合,可以有重复元素:而Set不允许有重复元素为了方便,抽象出AbstractCollection这个抽象类,其实现了Collectio ...
windows 下的 Rsync 同步
整理一下 windows 下的 rsync 文件同步. Rsync下载地址: 链接:https://pan.baidu.com/s/1nL0Ee_u76ytWKUFMeiKDIw 提取码:52in 一 ...
Windows Hook技术
0x01 简介有人称它为“钩子”,有人称它为“挂钩”技术.谈到钩子,很容易让人联想到在钓东西,比如鱼钩就用于钓鱼.编程技术的钩子也是在等待捕获系统中的某个消息或者动作.钩子的应用范围非常广泛,比如输 ...
vue项目的常用配置代码
{ // 针对vue的格式化配置----依赖eslint.prettier.vetur等插件 // 强制单引号 "prettier.singleQuote": true, &quo ...
C#创建 WebApi 项目
做web api 可以参考一下网友 C#进阶系列——WebApi 接口参数不再困惑:传参详解 - 懒得安分 - 博客园https://www.cnblogs.com/landeanfen/p/5337 ...
Spring Boot系列(二) Spring Boot 之 REST
Rest (Representational Stat Transer) 是一种软件架构风格. 基础理论架构特性性能可伸缩简化的统一接口按需修改组件通信透明可移植可靠性架构约束 C/ ...
redis批量灌库
需求:将批量数据灌入redis中如果通过代码形式将数据灌入redis中,效率比较低,以下将根据redis的特性进行快速的批量灌库环境:centos7 将数据整理成规定格式的文件,比如: SET k ...
VUE 父组件与子组件交互
1. 概述 1.1 说明在项目过程中,会有很多重复功能在多个页面中处理,此时则需要把这些重复的功能进行单独拎出,编写公用组件(控件)进行引用.在VUE中,组件是可复用的VUE实例,此时组件中的dat ...

关于hadoop的运行的一些指标监控（非cdh平台的）

Hadoop监控项

NameNode

JVM监控项

FSNamesystem

RPC

NameNodeActivity

DataNode

JVM监控项

DataNodeActivity

RPC

关于hadoop的运行的一些指标监控（非cdh平台的）的更多相关文章

随机推荐

热门专题