Flume-NG内置计数器(监控)源码级分析

　　Flume的内置监控怎么整？这个问题有很多人问。目前了解到的信息是可以使用Cloudera Manager、Ganglia有图形的监控工具，以及从浏览器获取json串，或者自定义向其他监控系统汇报信息。那监控的信息是什么呢？就是各个组件的统计信息，比如成功接收的Event数量、成功发送的Event数量，处理的Transaction的数量等等。而且不同的组件有不同的Countor来做统计，目前直到1.5版本仍然只对三大组件：source、sink、channel进行统计分别是SourceCounter、SinkCounter、ChannelCounter，这三个计数器的统计项是固定的，就是你不能自己设置自己的统计项；另外还有ChannelProcessorCounter和SinkProcessorCounter，这两项目前没有设置统计项，所以是目前还是“摆设”。另外有些同学可能也发现了，有些内置的组件使用CounterGroup这个来统计信息，这个可以自己随意设置统计项，但是遗憾的是目前(1.5版本)这个可以自定义的计数器的信息还无法用在监控上，因为这只是一个单独的类，并没有继承MonitoredCounterGroup这个抽象类。有些内置组件使用的是CounterGroup，所以监控时会没有数据，不同的版本使用此CounterGroup的组件可能不同。下面我们重点介绍：SourceCounter、SinkCounter、ChannelCounter。

　　Flume-NG的所有统计信息、监控及相关的类都在org.apache.flume.instrumentation.http、org.apache.flume.instrumentation、org.apache.flume.instrumentation.util三个包下。

　　上面提到了MonitoredCounterGroup，这个类是用来跟踪内部的统计指标的，注册组件的MBean并跟踪和更新统计值。需要监控的组件都要继承这个类，这个类可以跟踪flume内部的所有组件，但是目前只实现了3个。其中比较重要的方法有以下几个：

　　(1)、构造方法MonitoredCounterGroup(Type type, String name, String... attrs)，这个方法主要是设置组件的类型、名称；然后将所有的attrs(这是设定的各个统计项)加入Map<String, AtomicLong> counterMap，值设定为0；然后初始化计数器的开始时间和结束时间，都设为0.

　　(2)、start()方法，会先注册计数器，然后对所有统计项的统计值设为0；将开始时间设置为当前时间

　　(3)、register()方法，如果这个计数器还未注册，将这个计数器的MBean进行注册，就可以进行跟踪了

　　(4)、stop()方法，会设置结束时间为当前时间；输出各个统计项的信息。我们 Ctrl+C 结束进程时，最后显示的统计信息就是来自这里。

　　其它方法都是获取counterMap的中信息或者更新值等，比较简单。

　　接下来我们看看，三个组件中各种统计项及其含义吧：

　　一、SourceCounter，继承了MonitoredCounterGroup。主要统计项如下：

　　(1)"src.events.received"，表示source接受的event个数；

　　(2)"src.events.accepted"，表示source处理成功的event个数，和上面的区别就是上面虽然接受了可能没处理成功；

　　(3)"src.append.received"，表示调用append次数，在avrosource和thriftsource中调用；

　　(4)"src.append.accepted"，表示append处理成功次数；

　　(5)"src.append-batch.received"，表示appendBatch被调用的次数，在avrosource和thriftsource中调用；

　　(6)"src.append-batch.accepted"，表示appendBatch处理成功次数；

　　(7)"src.open-connection.count"，用在avrosource中表示打开连接的数量；

　　一般source调用都集中在前俩。

　　二、SinkCounter，继承了MonitoredCounterGroup

　　(1)"sink.connection.creation.count"，这个调用的地方颇多，都表示“链接”创建的数量，比如与HBase建立链接，与avrosource建立链接以及文件的打开等；

　　(2)"sink.connection.closed.count"，对应于上面的stop操作、destroyConnection、close文件操作等。

　　(3)"sink.connection.failed.count"，表示上面所表示“链接”时异常、失败的次数；

　　(4)"sink.batch.empty"，表示这个批次处理的event数量为0的情况；

　　(5)"sink.batch.underflow"，表示这个批次处理的event的数量介于0和配置的batchSize之间；

　　(6)"sink.batch.complete"，表示这个批次处理的event数量等于设定的batchSize；

　　(7)"sink.event.drain.attempt"，准备处理的event的个数；

　　(8)"sink.event.drain.sucess"，这个表示处理成功的event数量，与上面不同的是上面的是还未处理的。

　　三、ChannelCounter，继承了MonitoredCounterGroup

　　(1)"channel.current.size"，这个表示这个channel的当前容量；

　　(2)"channel.event.put.attempt"，一般指的是在channel的事务当中，source的put操作中记录尝试发送event的个数；

　　(3)"channel.event.take.attempt"，一般指的是在channel的事务中，sink的take操作记录尝试拿event的个数；

　　(4)"channel.event.put.success"，一般指的是在channel的事务中，put成功的event的数量；

　　(5)"channel.event.take.success"，一般指的是channel事务中，take成功的event的数量；

　　(6)"channel.capacity"，指的是channel的容量，在channel的start方法中设置。

　　上面这些统计项都是固定的，我们可以根据需要增加相应项的值，可以在监控中查看组件的变化情况，从而掌握flume进程的运行情况。比如可以查看channel的容量从而了解到source和sink的相对处理速度，还有可以看source或者sink每个批次处理成功与失败的次数，了解组件的运行状况等等。

　　当然有些同学可能在自定义自己的组件时，想统计一些自己的统计项，这些统计项在上面三大组件中是没有，怎么办？自己定制啊，上面说了必须要继承MonitoredCounterGroup这个抽象类，设定自己的统计项，然后将统计项设置成数组调用MonitoredCounterGroup的构造函数；然后在自定义的计数器中增加更新数值的方法。最后在自定义的组件中构造自定义的计数器，并启用它的start方法，剩下的就是在该更新统计项数值的地方更新就可以了。

　　还有一个重要的内容就是监控的实现！没错，内置的有两种HTTP方式(就是json串)和Ganglia，后者需要安装Ganglia，前者非常简单，只需要在Flume的启动命令中加上：-Dflume.monitoring.type=http -Dflume.monitoring.port=XXXX ，最后的XXXX是你需要设置的端口！然后你就可以在浏览器上通过访问这个Flume所在节点的IP：XXXX/metrics，不断刷新就可以看到最新的组件统计信息。关于Ganglia的请读者自行组建Ganglia集群并参考用户指南来操作。

　　如果我想自己实现一个server向其他系统汇报信息，咋整？目前有至少两个方法：

　　一、就是上面的HTTP啊，你可以不断去获取json串，自己解析出来各个统计指标，然后剩下的就是你想怎么整就怎么整吧。

　　二、就是自己实现一个类似HTTP的server，必须实现org.apache.flume.instrumentation.MonitorService接口，这个接口只有俩方法:start和stop。这个接口继承自Configurable接口所以拥有可以读取配置文件的configure(configure(Context context))方法，来获取一些配置信息。

　　以HTTP为例(对应的类是org.apache.flume.instrumentation.http.HTTPMetricsServer)，它的start方法启动了一个jetty作为web server，提供WEB服务。并实现了AbstractHandler的一个处理数据的类HTTPMetricsHandler，这个类的handle(String target, HttpServletRequest request, HttpServletResponse response,int dispatch)方法来设置一些WEB页面的格式以及通过JMXPollUtil.getAllMBeans()获取所有组件注册的MBean构成的Map<String, Map<String, String>> metricsMap，遍历这个metricsMap将这个metricsMap转换成json输出到web页面。stop方法就是一些清理工作，这里是关闭jetty server。很简单吧，所以我们完全可以实现一个server，在start方法中启动一个线程每隔一秒或者自己定遍历这个metricsMap，写入mysql、HBase或者别的地方，你随便。。。

　　你可以在定义的组件中调用自己的计数器，然后将计数器、监控类、自定义组件(source、sink、channel)打包放到lib下，在启动命令后加-Dflume.monitoring.type=AAAAA -Dflume.monitoring.node=BBBB，就可以了。注意，Dflume.monitoring.type这个好似必须要设置的，就是你自己的监控类(这里是AAAAA)，后面的可有可无都是一些参数，你可以自定义参数名，比如可以设置数据库服务器IP、端口等。

　　　　至此，这里介绍完了。这些都是从源码中看出来的，还未曾实现，供大伙借鉴。

Flume-NG内置计数器(监控)源码级分析的更多相关文章

Matlab.NET混合编程技巧之——直接调用Matlab内置函数(附源码)
原文:[原创]Matlab.NET混合编程技巧之--直接调用Matlab内置函数(附源码) 在我的上一篇文章[原创]Matlab.NET混编技巧之——找出Matlab内置函数中,已经大概的介绍了mat ...
MapReduce的ReduceTask任务的运行源码级分析
MapReduce的MapTask任务的运行源码级分析这篇文章好不容易恢复了...谢天谢地...这篇文章讲了MapTask的执行流程.咱们这一节讲解ReduceTask的执行流程.ReduceTas ...
MapReduce的MapTask任务的运行源码级分析
TaskTracker任务初始化及启动task源码级分析这篇文章中分析了任务的启动,每个task都会使用一个进程占用一个JVM来执行,org.apache.hadoop.mapred.Child方法 ...
TaskTracker任务初始化及启动task源码级分析
在监听器初始化Job.JobTracker相应TaskTracker心跳.调度器分配task源码级分析中我们分析的Tasktracker发送心跳的机制,这一节我们分析TaskTracker接受JobT ...
监听器初始化Job、JobTracker相应TaskTracker心跳、调度器分配task源码级分析
JobTracker和TaskTracker分别启动之后(JobTracker启动流程源码级分析,TaskTracker启动过程源码级分析),taskTracker会通过心跳与JobTracker通信 ...
MapReduce job在JobTracker初始化源码级分析
mapreduce job提交流程源码级分析(三)中已经说明用户最终调用JobTracker.submitJob方法来向JobTracker提交作业.而这个方法的核心提交方法是JobTracker.a ...
TableInputFormat分片及分片数据读取源码级分析
我们在MapReduce中TextInputFormat分片和读取分片数据源码级分析这篇中以TextInputFormat为例讲解了InputFormat的分片过程以及RecordReader读取分 ...
Django（60）Django内置User模型源码分析及自定义User
前言 Django为我们提供了内置的User模型,不需要我们再额外定义用户模型,建立用户体系了.它的完整的路径是在django.contrib.auth.models.User. User模型源码分析 ...
SpringBoot 源码解析（六）----- Spring Boot的核心能力 - 内置Servlet容器源码分析（Tomcat）
Spring Boot默认使用Tomcat作为嵌入式的Servlet容器,只要引入了spring-boot-start-web依赖,则默认是用Tomcat作为Servlet容器: <depend ...

随机推荐

[转]细说MySQL Explain和Optimizer Trace简介
在开发过程中,对每个上线的SQL查询指纹(query figerprint)的质量都应有估算:而估算DB查询质量最直接的方法,就是分析其查询执行计划( Query Execution Plan ,即Q ...
powerdesigner 绘制表关系和导出sql
1.生成图(A图,B图) 2.创建关系(palette工具栏里有个线条,主表子表关系连接即可,拖动是由顺序的,一对多即从A表往B表连接) 3.这里小说一下一开始是CDM模式,可以在软件最顶层看到 ...
成都普华永道税务开发的offer
首先这是一个.net税务开发的offer,我是做开发的. 有没有人在成都普华永道的,最近收到普华永道的offer,如果有的话请联系我.想知道里面的情况.最想知道里面的加班情况,薪资还是有点诱惑的.毕竟 ...
Git.Framework 框架随手记-- 分享一个"比较垃圾"的项目
本文主要分享一个Git.Framework 开发的一个项目的部分源码,此项目代码"比较垃圾",所以请各位码农,码畜,码神,码圣勿喷!发此文只为记录工作问题以及分享问题! 一. 项目 ...
IOS判断app在appstore是否有可用的更新
iTunes可以提供app的版本信息,主要通过appid获取,如 http://itunes.apple.com/lookup?id=946449501,使用时只需要到iTunes查找自己的appid ...
《TCP/IP详解卷1：协议》第17、18章 TCP：传输控制协议（2）-读书笔记
章节回顾: <TCP/IP详解卷1:协议>第1章概述-读书笔记 <TCP/IP详解卷1:协议>第2章链路层-读书笔记 <TCP/IP详解卷1:协议>第3章 IP ...
Bata版本冲刺计划及安排
下一阶段需要改进完善的功能 UI: 1. 界面不够精细,布局不够美观并且尚有BUG没有解决,图形.色彩间不够协调. 2. 理清界面间的跳转逻辑. 搜索: 搜索成功并定位后,不会影响地理标签的显示. 定 ...
zabbix 的学习应用之路
1.zabbix server的安装 http://www.cnblogs.com/smail-bao/p/5643136.html 2.zabbix agent的安装 h ...
Java基础-gs（垃圾回收）
Java垃圾回收概况 Java GC(Garbage Collection,垃圾收集,垃圾回收)机制,是Java与C++/C的主要区别之一,作为Java开发者,一般不需要专门编写内存回收和垃圾清理代 ...
学习笔记--(平衡树)splay
坑爹的splay,毁我青春,耗我钱财,颓我精力是一种用于保存有序集合的简单高效的数据结构.伸展树实质上是一个二叉查找树.允许查找,插入,删除,删除最小,删除最大,分割,合并等许多操作,这些操作的时间 ...

Flume-NG内置计数器(监控)源码级分析

Flume-NG内置计数器(监控)源码级分析的更多相关文章

随机推荐

热门专题