理解Storm Metrics

在hadoop中，存在对应的counter计数器用于记录hadoop map/reduce job任务执行过程中自定义的一些计数器，其中hadoop任务中已经内置了一些计数器，例如CPU时间，GC时间等。

Storm中也存在类似counter的功能，metrics，详细介绍可以参考下面的文档：

http://storm.apache.org/releases/1.0.1/Metrics.html

Storm exposes a metrics interface to report summary statistics across the full topology. It's used internally to track the numbers you see in the Nimbus UI console: counts of executes and acks; average process latency per bolt; worker heap usage; and so forth.

所有的Metric都需要实现IMetric接口，该接口中只有一个方法用来表示取出现有的counter值，并将其清零。

public interface IMetric {

    public Object getValueAndReset();

}

以提供的实例CountMetric, MultiCountMetric和ReduceMetric为例，类图方式展示如下：

在CountMetric中，只是记录了一个long值，在每次incr和incrBy时进行递增记录；

MultiCountMetric中，其中内置了Map<String, CountMetric>用来记录多个CountMetric，scope方法用来以key的方式圈定范围，在每次getValueAndSet时，都会直接清掉Map中所有的CountMetric；

ReducedMetric是比较特殊的一个，因为它不仅仅记录了一个维度，还可以以reduce的方式来计算一段时间来的平均值，比如Storm中提供的实现MeanReducer，在ReducedMetric中的实现，其中_accumlator作为累积数据（从字面意思上理解），类型为Object，可以用任何类型来表示：

public class ReducedMetric implements IMetric {

    private final IReducer _reducer;

    private Object _accumulator;

    public ReducedMetric(IReducer reducer) {

        _reducer = reducer;

        _accumulator = _reducer.init();

    }

    public void update(Object value) {

        _accumulator = _reducer.reduce(_accumulator, value);

    }

    public Object getValueAndReset() {

        Object ret = _reducer.extractResult(_accumulator);

        _accumulator = _reducer.init();

        return ret;

    }

}

MeanReducer中，就记录两个维度 count和总和，通过这两个维度，我们可以轻易计算出一段时间内的平均值。

class MeanReducerState {

    public int count = 0;

    public double sum = 0.0;

}

public class MeanReducer implements IReducer<MeanReducerState> {

    public MeanReducerState init() {

        return new MeanReducerState();

    }

    public MeanReducerState reduce(MeanReducerState acc, Object input) {

        acc.count++;

        if(input instanceof Double) {

            acc.sum += (Double)input;

        } else if(input instanceof Long) {

            acc.sum += ((Long)input).doubleValue();

        } else if(input instanceof Integer) {

            acc.sum += ((Integer)input).doubleValue();

        } else {

            throw new RuntimeException(

                "MeanReducer::reduce called with unsupported input type `" + input.getClass()

                + "`. Supported types are Double, Long, Integer.");

        }

        return acc;

    }

    public Object extractResult(MeanReducerState acc) {

        if(acc.count > 0) {

            return acc.sum / (double) acc.count;

        } else {

            return null;

        }

    }

}

所有的Metrics都需要在Spout/Bolt初始化之前记录，对应Spout.open()， Bolt.prepare方法，注册时需要指定指标的名称，对应实例，以及间隔时间（以秒为单位）。

context.registerMetric("execute_count", countMetric, 5);

context.registerMetric("word_count", wordCountMetric, 60);

context.registerMetric("word_length", wordLengthMeanMetric, 60);

IMetricsConsumer

注册metrics后，只是在定时进行记录metrics，但metrics该如何显示，这就取决于IMetricsConsumer，在Config中可以手动进行注册自定义的metricsConsumer，也可以直接使用storm中提供的记录日志的LoggingMetricsConsumer，该consumer会以日志的形式记录统计指标，下面是对其介绍：

Listens for all metrics, dumps them to log To use, add this to your topology's configuration: ```java conf.registerMetricsConsumer(org.apache.storm.metrics.LoggingMetricsConsumer.class, 1); ``` Or edit the storm.yaml config file: ```yaml topology.metrics.consumer.register: - class: "org.apache.storm.metrics.LoggingMetricsConsumer" parallelism.hint: 1

这表示，在config中可以通过手动注册的方式将LoggingMetricsConsumer注册上去，第二个参数为并行度：

config.registerMetricsConsumer(LoggingMetricsConsumer.class, 2);

此时Config对象（类似HashMap）会将topology.metrics.consumer.register属性注册，记录其class, parallelism.hint并行度，以及argument参数。

在Config中注册后，通过内置的特殊Bolt：MetricConsumerBolt来执行handleDataPoints方法，其中handleDataPoints赋给的两个参数taskInfo, dataPoints如下所示，给定了source task的一些状态，以及传输过来的汇总数据：

在应用后，就可以在storm的日志目录下查看到metrics日志文件：

/usr/local/apache-storm-1.0.1/logs/workers-artifacts/FirstTopo-46-1468485056/6703

-rw-rw-r-- 1 java java  55K 7月  14 18:47 gc.log.0

-rw-rw-r-- 1 java java  28K 7月  14 18:47 worker.log

-rw-rw-r-- 1 java java    0 7月  14 16:31 worker.log.err

-rw-rw-r-- 1 java java 1.2M 7月  14 18:47 worker.log.metrics

-rw-rw-r-- 1 java java    0 7月  14 16:31 worker.log.out

-rw-rw-r-- 1 java java    5 7月  14 16:31 worker.pid

-rw-rw-r-- 1 java java  120 7月  14 16:31 worker.yaml

在worker.log.metrics中就可以查看到所有metrics的相关信息，注意不仅仅包含我们自定义的bolt类型，一些system类型的信息也会在上面显示出来：

2016-07-14 16:31:40,700 31721    1468485098       192.168.1.127:6702      6:bolt        execute_count           5

2016-07-14 16:31:45,702 36723    1468485103       192.168.1.127:6702      6:bolt        execute_count           5

2016-07-14 16:31:50,702 41723    1468485108       192.168.1.127:6702      6:bolt        execute_count           5

2016-07-14 16:32:10,705 61726    1468485128       192.168.1.127:6702      6:bolt        execute_count           5

2016-07-14 16:32:15,708 66729    1468485133       192.168.1.127:6702      6:bolt        execute_count           5

2016-07-14 16:32:25,699 76720    1468485143       192.168.1.127:6702      6:bolt        __ack-count             {spout:default=60}

2016-07-14 16:32:25,701 76722    1468485143       192.168.1.127:6702      6:bolt        __sendqueue             {sojourn_time_ms=0.0, write_pos=10, read_pos=10, arrival_rate_secs=0.10267994660642776, overflow=0, capacity=1024, population=0}

2016-07-14 16:32:25,701 76722    1468485143       192.168.1.127:6702      6:bolt        word_count              {happy=18, angry=19, excited=14}

2016-07-14 16:32:25,702 76723    1468485143       192.168.1.127:6702      6:bolt        __receive               {sojourn_time_ms=817.6666666666666, write_pos=62, read_pos=61, arrival_rate_secs=1.222992254382389, overflow=0, capacity=1024, population=1}

理解Storm Metrics的更多相关文章

用实例的方式去理解storm的并发度
什么是storm的并发度一个topology(拓扑)在storm集群上最总是以executor和task的形式运行在suppervisor管理的worker节点上.而worker进程都是运行在jvm ...
理解Storm并发
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 注:本文主要内容翻译自understanding-the-parall ...
storm源码之理解Storm中Worker、Executor、Task关系 + 并发度详解
本文导读: 1 Worker.Executor.task详解 2 配置拓扑的并发度 3 拓扑示例 4 动态配置拓扑并发度 Worker.Executor.Task详解: Storm在集群上运行一个To ...
【原】理解Storm拓扑的并行
Storm入门教程 1. Storm基础 Storm Storm主要特点 Storm基本概念 Storm调度器 Storm配置 Guaranteeing Message Processing(消息处理 ...
理解storm的ACKER机制原理
一.简介: storm中有一个很重要的特性: 保证发出的每个tuple都会被完整处理.一个tuple被完全处理的意思是: 这个tuple以及由这个tuple所产生的所有的子tuple都被成 ...
【原】【译文】理解storm拓扑并行度
原文地址: http://storm.apache.org/releases/1.2.1/Understanding-the-parallelism-of-a-Storm-topology.html ...
理解Storm可靠性消息
看过一些别人写的, 感觉有些东西没太说清楚,个人主要以源代码跟踪,参考个人理解讲述,有错误请指正. 1基本名词 1.1 Tuple: 消息传递的基本单位.很多文章中介绍都是这么说的, 个人觉得应该更详 ...
【原】storm源码之理解Storm中Worker、Executor、Task关系
Storm在集群上运行一个Topology时,主要通过以下3个实体来完成Topology的执行工作:1. Worker(进程)2. Executor(线程)3. Task 下图简要描述了这3者之间的关 ...
理解 Storm 拓扑的并行度(parallelism)概念
组成:一个运行中的拓扑是由什么构成的:工作进程(worker processes),执行器(executors)和任务(tasks)! 在一个 Storm 集群中,Storm 主要通过以下三个部件来运 ...

随机推荐

L222 词汇题
Some psychologists argue that the traditional idea “spare the rod and spoil the child” is not ration ...
ModuleNotFoundError: No module named '_tkinter'
https://blog.csdn.net/blueheart20/article/details/78763208 apt search python3-tk apt install python3 ...
robot framework学习笔记之六—自动变量
自动变量被RF框架创建和修改,在测试执行过程中值可能会变化;另外,某些自动变量在执行过程中并非总是可用.修改自动变量,并不能对变量的初始值产生影响.但可以用某些内建关键字来修改某些自动变量的值. 变量 ...
LSTM神经网络
LSTM是什么 LSTM即Long Short Memory Network,长短时记忆网络.它其实是属于RNN的一种变种,可以说它是为了克服RNN无法很好处理远距离依赖而提出的. 我们说RNN不能处 ...
20155229 2016-2017-2 《Java程序设计》第八周学习总结
20155229 2016-2017-2 <Java程序设计>第八周学习总结教材学习内容总结第十四章 NIO使用频道(Channel)来衔接数据节点,在处理数据时,NIO可以设定缓冲区 ...
（2）流程控制（for循环、if...else判断、while循环）
for循环 for item in names: #结构语法 print(item) for循环嵌套for循环 for循环配合range()可以直接指定要打印的数量例:打印一个金字塔 for i ...
day16 python学习递归
初识递归递归的定义——在一个函数里再调用这个函数本身现在我们已经大概知道刚刚讲的story函数做了什么,就是在一个函数里再调用这个函数本身,这种魔性的使用函数的方式就叫做递归. 刚刚我们就已经写了 ...
stenciljs 学习一 web 组件开发
stenciljs 介绍参考官方网站,或者 https://www.cnblogs.com/rongfengliang/p/9706542.html 创建项目使用脚手架工具 npm init ste ...
《Java程序猿面试笔试宝典》之Java变量命名有哪些规则
在Java语言中,变量名.函数名.数组名统称为标识符,Java语言规定标识符仅仅能由字母(a~z.A~Z).数字(0~9).下划线(_)和$组成,而且标识符的第一个字符必须是字母.下划线或$.此外.标 ...
使用systemd严格保证启动顺序
需求: 服务B要在服务A之后启动,且由于存在强内在依赖关系,B必须在A完成初始化之后才能被启动. 解决方法: 首先使用systemd,service脚本需要配置服务B要after服务A. 其次,A服务 ...

理解Storm Metrics

IMetricsConsumer

理解Storm Metrics的更多相关文章

随机推荐

热门专题