1 Source

Source，作为agent中的消息来源组件，我们来看看它是如何将event传递给channel的和它的特性。

依然先看代码：

@InterfaceAudience.Public

@InterfaceStability.Stable

public interface Source extends LifecycleAware, NamedComponent {

  public void setChannelProcessor(ChannelProcessor channelProcessor);

  public ChannelProcessor getChannelProcessor();

}

我们可以看到它里面定义的两个需要实现方法是getChannelProcessor和setChannelProcessor，我们大概可以猜到，source就是通过ChannelProcessor将event传输给channel的。

这里先来了解一下Source的类型，Flume根据数据来源的特性将Source分成两类类，像Http、netcat和exec等就是属于事件驱动型（EventDrivenSource），而kafka和Jms等就是属于轮询拉取型（PollableSource）。

据我们在启动流程中了解到的，Application是先启动SourceRunner，再由SourceRunner来启动source，那么既然source有两种类型，那么Sourcerunner也分为EventDrivenSourceRunner和PollableSourceRunner，我们来看看它们的start()：

EventDrivenSourceRunner

public class EventDrivenSourceRunner extends SourceRunner {

  …

  @Override

  public void start() {

    Source source = getSource();

    ChannelProcessor cp = source.getChannelProcessor();

    cp.initialize();

    source.start();

    lifecycleState = LifecycleState.START;

  }

  …

}

PollableSourceRunner

public class PollableSourceRunner extends SourceRunner {

  …

  @Override

  public void start() {

    PollableSource source = (PollableSource) getSource();

    ChannelProcessor cp = source.getChannelProcessor();

    cp.initialize();

    source.start();

    runner = new PollingRunner();

    runner.source = source;

    runner.counterGroup = counterGroup;

    runner.shouldStop = shouldStop;

    runnerThread = new Thread(runner);

    runnerThread.setName(getClass().getSimpleName() + "-" +

        source.getClass().getSimpleName() + "-" + source.getName());

    runnerThread.start();

    lifecycleState = LifecycleState.START;

  }

  …

  public static class PollingRunner implements Runnable {

    private PollableSource source;

    private AtomicBoolean shouldStop;

    private CounterGroup counterGroup;

    @Override

    public void run() {

      logger.debug("Polling runner starting. Source:{}", source);

      while (!shouldStop.get()) {

        counterGroup.incrementAndGet("runner.polls");

        try {

          if (source.process().equals(PollableSource.Status.BACKOFF)) {

            counterGroup.incrementAndGet("runner.backoffs");

            Thread.sleep(Math.min(

                counterGroup.incrementAndGet("runner.backoffs.consecutive")

                * source.getBackOffSleepIncrement(), source.getMaxBackOffSleepInterval()));

          } else {

            counterGroup.set("runner.backoffs.consecutive", 0L);

          }

        } catch (InterruptedException e) {

          logger.info("Source runner interrupted. Exiting");

          counterGroup.incrementAndGet("runner.interruptions");

        } catch (EventDeliveryException e) {

          logger.error("Unable to deliver event. Exception follows.", e);

          counterGroup.incrementAndGet("runner.deliveryErrors");

        } catch (Exception e) {

          counterGroup.incrementAndGet("runner.errors");

          logger.error("Unhandled exception, logging and sleeping for " +

              source.getMaxBackOffSleepInterval() + "ms", e);

          try {

            Thread.sleep(source.getMaxBackOffSleepInterval());

          } catch (InterruptedException ex) {

            Thread.currentThread().interrupt();

          }

        }

      }

      logger.debug("Polling runner exiting. Metrics:{}", counterGroup);

    }

  }

}

无论是PollableSourceRunner还是EventDrivenSourceRunner，都是调用它里面的source的start()。这个时候我们看到ChannelProcessor的存在，那么就会有疑惑，这ChannelProcessor哪来的？我们还是得看回AbstarctConfigurationProvider，查看里面的loadSources()，我们就会发现下面这段代码：

ChannelSelectorConfiguration selectorConfig = config.getSelectorConfiguration();

ChannelSelector selector = ChannelSelectorFactory.create(sourceChannels, selectorConfig);

ChannelProcessor channelProcessor = new ChannelProcessor(selector);

Configurables.configure(channelProcessor, config);

source.setChannelProcessor(channelProcessor);

到这里我们基本已经了解了Source的启动流程，下面以AvroSource为例看看，source是在哪里调用ChannelProcessor的插入方法。

2 AvroSource

public class AvroSource extends AbstractSource implements EventDrivenSource,

    Configurable, AvroSourceProtocol {

  …

  @Override

  public Status append(AvroFlumeEvent avroEvent) {

    if (logger.isDebugEnabled()) {

      if (LogPrivacyUtil.allowLogRawData()) {

        logger.debug("Avro source {}: Received avro event: {}", getName(), avroEvent);

      } else {

        logger.debug("Avro source {}: Received avro event", getName());

      }

    }

    sourceCounter.incrementAppendReceivedCount();

    sourceCounter.incrementEventReceivedCount();

    Event event = EventBuilder.withBody(avroEvent.getBody().array(),

        toStringMap(avroEvent.getHeaders()));

    try {

      getChannelProcessor().processEvent(event);

    } catch (ChannelException ex) {

      logger.warn("Avro source " + getName() + ": Unable to process event. " +

          "Exception follows.", ex);

      return Status.FAILED;

    }

    sourceCounter.incrementAppendAcceptedCount();

    sourceCounter.incrementEventAcceptedCount();

    return Status.OK;

  }

  @Override

  public Status appendBatch(List<AvroFlumeEvent> events) {

    logger.debug("Avro source {}: Received avro event batch of {} events.",

        getName(), events.size());

    sourceCounter.incrementAppendBatchReceivedCount();

    sourceCounter.addToEventReceivedCount(events.size());

    List<Event> batch = new ArrayList<Event>();

    for (AvroFlumeEvent avroEvent : events) {

      Event event = EventBuilder.withBody(avroEvent.getBody().array(),

          toStringMap(avroEvent.getHeaders()));

      batch.add(event);

    }

    try {

      getChannelProcessor().processEventBatch(batch);

    } catch (Throwable t) {

      logger.error("Avro source " + getName() + ": Unable to process event " +

          "batch. Exception follows.", t);

      if (t instanceof Error) {

        throw (Error) t;

      }

      return Status.FAILED;

    }

    sourceCounter.incrementAppendBatchAcceptedCount();

    sourceCounter.addToEventAcceptedCount(events.size());

    return Status.OK;

  }

  …

}

在append方法中我们可以看到getChannelProcessor().processEvent(event);，所以不同的Source根据它的不同触发机制和拉取机制，在特定的时候调用ChannelProcessor来执行event的插入。 ·

到此为止，我们就完成了对Flume启动流程和三大组件的研究，鉴于能力，其中有些细节没办法深入研究，希望以后有时间能够继续深入分析下去。

Flume-ng源码解析之Source组件的更多相关文章

Flume-ng源码解析之Sink组件
作为启动流程中第二个启动的组件,我们今天来看看Sink的细节 1 Sink Sink在agent中扮演的角色是消费者,将event输送到特定的位置首先依然是看代码,由代码我们可以看出Sink是一个接 ...
rest-framework源码解析和自定义组件----版本
版本 url中通过GET传参自定义的版本 12345678910111213141516171819202122 from django.http import HttpResponsefrom dj ...
Flume-ng源码解析之Channel组件
如果还没看过Flume-ng源码解析之启动流程,可以点击Flume-ng源码解析之启动流程查看 1 接口介绍组件的分析顺序是按照上一篇中启动顺序来分析的,首先是Channel,然后是Sink,最后 ...
Spring源码解析系列汇总
相信我,你会收藏这篇文章的本篇文章是这段时间撸出来的Spring源码解析系列文章的汇总,总共包含以下专题.喜欢的同学可以收藏起来以备不时之需 SpringIOC源码解析(上) 本篇文章搭建了IOC源 ...
.Net Core缓存组件(Redis)源码解析
上一篇文章已经介绍了MemoryCache,MemoryCache存储的数据类型是Object,也说了Redis支持五中数据类型的存储,但是微软的Redis缓存组件只实现了Hash类型的存储.在分析源 ...
.Net Core缓存组件(MemoryCache)源码解析
一.介绍由于CPU从内存中读取数据的速度比从磁盘读取快几个数量级,并且存在内存中,减小了数据库访问的压力,所以缓存几乎每个项目都会用到.一般常用的有MemoryCache.Redis.MemoryC ...
admin源码解析以及仿照admin设计stark组件
---恢复内容开始--- admin源码解析一启动:每个APP下的apps.py文件中. 首先执行每个APP下的admin.py 文件. def autodiscover(): autodisco ...
admin源码解析及自定义stark组件
admin源码解析单例模式单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在.当你希望在整个系统中,某个类只能出现一个实例时,单 ...
Django 之 admin组件使用&源码解析
admin组件使用 Django 提供了基于 web 的管理工具. Django 自动管理工具是 django.contrib 的一部分.可以在项目的 settings.py 中的 INSTALLED ...

随机推荐

C语言strstr()函数：返回字符串中首次出现子串的地址
今天又学到了一个函数头文件:#include <string.h> strstr()函数用来检索子串在字符串中首次出现的位置,其原型为: char *strstr( char *s ...
Extjs换肤+cookie皮肤记忆功能
http://www.myext.cn/kaifa/a_102.html Ext之家 <title>无标题页</title> <link rel=" ...
C# Unity游戏开发——Excel中的数据是如何到游戏中的（二）
本帖是延续的:C# Unity游戏开发——Excel中的数据是如何到游戏中的 (一) 上个帖子主要是讲了如何读取Excel,本帖主要是讲述读取的Excel数据是如何序列化成二进制的,考虑到现在在手游中 ...
Blend4 的安装和配置
Microsoft Expression Blend作为一款功能齐全的专业设计工具,可用来针对基于 Microsoft Windows 和基于 Microsoft Silverlight 1.0 的应 ...
Java中多线程原理详解
Java是少数的集中支持多线程的语言之一,大多数的语言智能运行单独的一个程序块,无法同时运行不同的多个程序块,Java的多线程机制弥补了这个缺憾,它可以让不同的程序块一起运行,这样可以让程序运行更加顺 ...
Java泛型类定义，与泛型方法的定义使用
package com.srie.testjava; public class TestClassDefine<T, S extends T> { public static void m ...
关于Visual Studio未能加载各种Package包的解决
参考微软社区的一个答复解决了VS2013的问题: 进入VS对应的用户缓存文件夹,删掉那个Microsoft.VisualStudio.Default.cache缓存文件,就可以了. 这个错误估计是我们 ...
为什么我最终替换掉了NATS
之前公司没有使用msmq/rebbitmq等消息队列,一方面是觉得太重,想避免在引入中间件.另外的原因是公司的业务并不需要消息持久化和确保可送达(at-least-once VS at-more-on ...
访问 Neutron 外部网络 - 每天5分钟玩转 OpenStack（143）
前面我们学习了位于不同 Neutron subnet 的 instance 可以通过 router 通信,今天开始讨论 instance 如何访问外部网络. 这里的外部网络是指的租户网络以外的网络.租 ...
ArcGIS API for JavaScript 4.2学习笔记[2] 显示3D地图
3D地图又叫场景. 由上一篇可知, require入口函数的第一个参数是字符串数组 ["esri/Map", "esri/views/MapView", &qu ...

Flume-ng源码解析之Source组件

1 Source

2 AvroSource

Flume-ng源码解析之Source组件的更多相关文章

随机推荐

热门专题