如果还没看过Flume-ng源码解析之启动流程，可以点击Flume-ng源码解析之启动流程查看

1 接口介绍

组件的分析顺序是按照上一篇中启动顺序来分析的，首先是Channel，然后是Sink，最后是Source，在开始看组件源码之前我们先来看一下两个重要的接口，一个是LifecycleAware ，另一个是NamedComponent

1.1 LifecycleAware

@InterfaceAudience.Public

@InterfaceStability.Stable

public interface LifecycleAware {

  public void start();

  public void stop();

  public LifecycleState getLifecycleState();

}

非常简单就是三个方法，start()、stop()和getLifecycleState，这个接口是flume好多类都要实现的接口，包括Flume-ng源码解析之启动流程

所中提到PollingPropertiesFileConfigurationProvider()，只要涉及到生命周期的都会实现该接口，当然组件们也是要实现的！

1.2 NamedComponent

@InterfaceAudience.Public

@InterfaceStability.Stable

public interface NamedComponent {

  public void setName(String name);

  public String getName();

}

这个没什么好讲的，就是用来设置名字的。

2 Channel

作为Flume三大核心组件之一的Channel，我们有必要来看看它的构成：

@InterfaceAudience.Public

@InterfaceStability.Stable

public interface Channel extends LifecycleAware, NamedComponent {

  public void put(Event event) throws ChannelException;

  public Event take() throws ChannelException;

  public Transaction getTransaction();

}

那么从上面的接口中我们可以看到Channel的主要功能就是put()和take()，那么我们就来看一下它的具体实现。这里我们选择MemoryChannel作为例子，但是MemoryChannel太长了，我们就截取一小段来看看

public class MemoryChannel extends BasicChannelSemantics {

    private static Logger LOGGER = LoggerFactory.getLogger(MemoryChannel.class);

    private static final Integer defaultCapacity = Integer.valueOf(100);

    private static final Integer defaultTransCapacity = Integer.valueOf(100);

    public MemoryChannel() {

    }

    ...

}

我们又看到它继承了BasicChannelSemantics ，从名字我们可以看出它是一个基础的Channel，我们继续看看看它的实现

@InterfaceAudience.Public

@InterfaceStability.Stable

public abstract class BasicChannelSemantics extends AbstractChannel {

  private ThreadLocal<BasicTransactionSemantics> currentTransaction

      = new ThreadLocal<BasicTransactionSemantics>();

  private boolean initialized = false;

  protected void initialize() {}

  protected abstract BasicTransactionSemantics createTransaction();

  @Override

  public void put(Event event) throws ChannelException {

    BasicTransactionSemantics transaction = currentTransaction.get();

    Preconditions.checkState(transaction != null,

        "No transaction exists for this thread");

    transaction.put(event);

  }

  @Override

  public Event take() throws ChannelException {

    BasicTransactionSemantics transaction = currentTransaction.get();

    Preconditions.checkState(transaction != null,

        "No transaction exists for this thread");

    return transaction.take();

  }

  @Override

  public Transaction getTransaction() {

    if (!initialized) {

      synchronized (this) {

        if (!initialized) {

          initialize();

          initialized = true;

        }

      }

    }

    BasicTransactionSemantics transaction = currentTransaction.get();

    if (transaction == null || transaction.getState().equals(

            BasicTransactionSemantics.State.CLOSED)) {

      transaction = createTransaction();

      currentTransaction.set(transaction);

    }

    return transaction;

  }

}

找了许久，终于发现了put()和take()，但是仔细一看，它们内部调用的是BasicTransactionSemantics 的put()和take()，有点失望，继续来看看BasicTransactionSemantics

public abstract class BasicTransactionSemantics implements Transaction {

  private State state;

  private long initialThreadId;

  protected void doBegin() throws InterruptedException {}

  protected abstract void doPut(Event event) throws InterruptedException;

  protected abstract Event doTake() throws InterruptedException;

  protected abstract void doCommit() throws InterruptedException;

  protected abstract void doRollback() throws InterruptedException;

  protected void doClose() {}

  protected BasicTransactionSemantics() {

    state = State.NEW;

    initialThreadId = Thread.currentThread().getId();

  }

  protected void put(Event event) {

    Preconditions.checkState(Thread.currentThread().getId() == initialThreadId,

        "put() called from different thread than getTransaction()!");

    Preconditions.checkState(state.equals(State.OPEN),

        "put() called when transaction is %s!", state);

    Preconditions.checkArgument(event != null,

        "put() called with null event!");

    try {

      doPut(event);

    } catch (InterruptedException e) {

      Thread.currentThread().interrupt();

      throw new ChannelException(e.toString(), e);

    }

  }

  protected Event take() {

    Preconditions.checkState(Thread.currentThread().getId() == initialThreadId,

        "take() called from different thread than getTransaction()!");

    Preconditions.checkState(state.equals(State.OPEN),

        "take() called when transaction is %s!", state);

    try {

      return doTake();

    } catch (InterruptedException e) {

      Thread.currentThread().interrupt();

      return null;

    }

  }

  protected State getState() {

    return state;

  }

  ...//我们这里只是讨论put和take，所以一些暂时不涉及的方法就被我干掉，有兴趣恩典朋友可以自行阅读

  protected static enum State {

    NEW, OPEN, COMPLETED, CLOSED

  }

}

又是一个抽象类，put()和take()内部调用的还是抽象方法doPut()和doTake()，看到这里，我相信没有耐心的同学已经崩溃了，但是就差最后一步了，既然是抽象类，那么最终Channel所使用的肯定是它的一个实现类，这时候我们可以回到一开始使用的MemoryChannel，到里面找找有没有线索，一看，MemoryChannel中就藏着个内部类

private class MemoryTransaction extends BasicTransactionSemantics {

    private LinkedBlockingDeque<Event> takeList;

    private LinkedBlockingDeque<Event> putList;

    private final ChannelCounter channelCounter;

    private int putByteCounter = 0;

    private int takeByteCounter = 0;

    public MemoryTransaction(int transCapacity, ChannelCounter counter) {

      putList = new LinkedBlockingDeque<Event>(transCapacity);

      takeList = new LinkedBlockingDeque<Event>(transCapacity);

      channelCounter = counter;

    }

    @Override

    protected void doPut(Event event) throws InterruptedException {

      channelCounter.incrementEventPutAttemptCount();

      int eventByteSize = (int) Math.ceil(estimateEventSize(event) / byteCapacitySlotSize);

      if (!putList.offer(event)) {

        throw new ChannelException(

            "Put queue for MemoryTransaction of capacity " +

            putList.size() + " full, consider committing more frequently, " +

            "increasing capacity or increasing thread count");

      }

      putByteCounter += eventByteSize;

    }

    @Override

    protected Event doTake() throws InterruptedException {

      channelCounter.incrementEventTakeAttemptCount();

      if (takeList.remainingCapacity() == 0) {

        throw new ChannelException("Take list for MemoryTransaction, capacity " +

            takeList.size() + " full, consider committing more frequently, " +

            "increasing capacity, or increasing thread count");

      }

      if (!queueStored.tryAcquire(keepAlive, TimeUnit.SECONDS)) {

        return null;

      }

      Event event;

      synchronized (queueLock) {

        event = queue.poll();

      }

      Preconditions.checkNotNull(event, "Queue.poll returned NULL despite semaphore " +

          "signalling existence of entry");

      takeList.put(event);

      int eventByteSize = (int) Math.ceil(estimateEventSize(event) / byteCapacitySlotSize);

      takeByteCounter += eventByteSize;

      return event;

    }

   //...依然删除暂时不需要的方法

  }

在这个类中我们可以看到doPut()和doTake()的实现方法，也明白MemoryChannel的put()和take()最终调用的是MemoryTransaction 的doPut()和doTake()。

有朋友看到这里以为这次解析就要结束了，其实好戏还在后头，Channel中还有两个重要的类ChannelProcessor和ChannelSelector，耐心地听我慢慢道来。

3 ChannelProcessor

ChannelProcessor 的作用就是执行put操作，将数据放到channel里面。每个ChannelProcessor实例都会配备一个ChannelSelector来决定event要put到那个channl当中

public class ChannelProcessor implements Configurable {

    private static final Logger LOG = LoggerFactory.getLogger(ChannelProcessor.class);

    private final ChannelSelector selector;

    private final InterceptorChain interceptorChain;

    public ChannelProcessor(ChannelSelector selector) {

        this.selector = selector;

        this.interceptorChain = new InterceptorChain();

    }

    public void initialize() {

        this.interceptorChain.initialize();

    }

    public void close() {

        this.interceptorChain.close();

    }

    public void configure(Context context) {

        this.configureInterceptors(context);

    }

    private void configureInterceptors(Context context) {

        //配置拦截器

    }

    public ChannelSelector getSelector() {

        return this.selector;

    }

    public void processEventBatch(List<Event> events) {

        ...

        while(i$.hasNext()) {

            Event optChannel = (Event)i$.next();

            List tx = this.selector.getRequiredChannels(optChannel);

	        ...//将event放到Required队列

            t1 = this.selector.getOptionalChannels(optChannel);

            Object eventQueue;

            ...//将event放到Optional队列

        }

	    ...//event的分配操作

    }

    public void processEvent(Event event) {

        event = this.interceptorChain.intercept(event);

        if(event != null) {

            List requiredChannels = this.selector.getRequiredChannels(event);

            Iterator optionalChannels = requiredChannels.iterator();

            ...//event的分配操作

            List optionalChannels1 = this.selector.getOptionalChannels(event);

            Iterator i$1 = optionalChannels1.iterator();

            ...//event的分配操作

        }

    }

}

为了简化代码，我进行了一些删除，只保留需要讲解的部分，说白了Channel中的两个写入方法，都是需要从作为参数传入的selector中获取对应的channel来执行event的put操作。接下来我们来看看ChannelSelector

4 ChannelSelector

ChannelSelector是一个接口，我们可以通过ChannelSelectorFactory来创建它的子类，Flume提供了两个实现类MultiplexingChannelSelector和ReplicatingChannelSelector。

public interface ChannelSelector extends NamedComponent, Configurable {

    void setChannels(List<Channel> var1);

    List<Channel> getRequiredChannels(Event var1);

    List<Channel> getOptionalChannels(Event var1);

    List<Channel> getAllChannels();

}

通过ChannelSelectorFactory 的create来创建，create中调用getSelectorForType来获得一个selector，通过配置文件中的type来创建相应的子类

public class ChannelSelectorFactory {

  private static final Logger LOGGER = LoggerFactory.getLogger(

      ChannelSelectorFactory.class);

  public static ChannelSelector create(List<Channel> channels,

      Map<String, String> config) {

	  ...

  }

  public static ChannelSelector create(List<Channel> channels,

      ChannelSelectorConfiguration conf) {

    String type = ChannelSelectorType.REPLICATING.toString();

    if (conf != null) {

      type = conf.getType();

    }

    ChannelSelector selector = getSelectorForType(type);

    selector.setChannels(channels);

    Configurables.configure(selector, conf);

    return selector;

  }

  private static ChannelSelector getSelectorForType(String type) {

    if (type == null || type.trim().length() == 0) {

      return new ReplicatingChannelSelector();

    }

    String selectorClassName = type;

    ChannelSelectorType  selectorType = ChannelSelectorType.OTHER;

    try {

      selectorType = ChannelSelectorType.valueOf(type.toUpperCase(Locale.ENGLISH));

    } catch (IllegalArgumentException ex) {

      LOGGER.debug("Selector type {} is a custom type", type);

    }

    if (!selectorType.equals(ChannelSelectorType.OTHER)) {

      selectorClassName = selectorType.getChannelSelectorClassName();

    }

    ChannelSelector selector = null;

    try {

      @SuppressWarnings("unchecked")

      Class<? extends ChannelSelector> selectorClass =

          (Class<? extends ChannelSelector>) Class.forName(selectorClassName);

      selector = selectorClass.newInstance();

    } catch (Exception ex) {

      throw new FlumeException("Unable to load selector type: " + type

          + ", class: " + selectorClassName, ex);

    }

    return selector;

  }

}

对于这两种Selector简单说一下：

1）MultiplexingChannelSelector

下面是一个channel selector 配置文件

agent_foo.sources.avro-AppSrv-source1.selector.type = multiplexing

agent_foo.sources.avro-AppSrv-source1.selector.header = State

agent_foo.sources.avro-AppSrv-source1.selector.mapping.CA = mem-channel-1

agent_foo.sources.avro-AppSrv-source1.selector.mapping.AZ = file-channel-2

agent_foo.sources.avro-AppSrv-source1.selector.mapping.NY = mem-channel-1 file-channel-2

agent_foo.sources.avro-AppSrv-source1.selector.optional.CA = mem-channel-1 file-channel-2

agent_foo.sources.avro-AppSrv-source1.selector.mapping.AZ = file-channel-2

agent_foo.sources.avro-AppSrv-source1.selector.default = mem-channel-1

MultiplexingChannelSelector类中定义了三个属性，用于存储不同类型的channel

    private Map<String, List<Channel>> channelMapping;

  	private Map<String, List<Channel>> optionalChannels;

  	private List<Channel> defaultChannels;

那么具体分配原则如下：

如果设置了maping，那么会event肯定会给指定的channel，如果同时设置了optional，也会发送给optionalchannel
如果没有设置maping，设置default，那么event会发送给defaultchannel，如果还同时设置了optional，那么也会发送给optionalchannel
如果maping和default都没指定，如果有指定option，那么会发送给optionalchannel，但是发送给optionalchannel不会进行失败重试

2）ReplicatingChannelSelector

分配原则比较简单

如果是replicating的话，那么如果没有指定optional，那么全部channel都有，如果某个channel指定为option的话，那么就要从requiredChannel移除，只发送给optionalchannel

5 总结：

作为一个承上启下的组件，Channel的作用就是将source来的数据通过自己流向sink，那么ChannelProcessor就起到将event put到分配好的channel中，而分配的规则是由selector决定的，flume提供的selector有multiplexing和replicating两种。所以ChannelProcessor一般都是在Source中被调用。那么Channel的take()肯定是在Sink中调用的。

Flume-ng源码解析之Channel组件的更多相关文章

Flume-ng源码解析之Sink组件
作为启动流程中第二个启动的组件,我们今天来看看Sink的细节 1 Sink Sink在agent中扮演的角色是消费者,将event输送到特定的位置首先依然是看代码,由代码我们可以看出Sink是一个接 ...
Flume-ng源码解析之Source组件
如果你还没看过Flume-ng源码解析系列中的启动流程.Channel组件和Sink组件,可以点击下面链接: Flume-ng源码解析之启动流程 Flume-ng源码解析之Channel组件 Flum ...
rest-framework源码解析和自定义组件----版本
版本 url中通过GET传参自定义的版本 12345678910111213141516171819202122 from django.http import HttpResponsefrom dj ...
Spring源码解析系列汇总
相信我,你会收藏这篇文章的本篇文章是这段时间撸出来的Spring源码解析系列文章的汇总,总共包含以下专题.喜欢的同学可以收藏起来以备不时之需 SpringIOC源码解析(上) 本篇文章搭建了IOC源 ...
[源码解析] 并行分布式任务队列 Celery 之 EventDispatcher & Event 组件
[源码解析] 并行分布式任务队列 Celery 之 EventDispatcher & Event 组件目录 [源码解析] 并行分布式任务队列 Celery 之 EventDispatche ...
.Net Core缓存组件(Redis)源码解析
上一篇文章已经介绍了MemoryCache,MemoryCache存储的数据类型是Object,也说了Redis支持五中数据类型的存储,但是微软的Redis缓存组件只实现了Hash类型的存储.在分析源 ...
.Net Core缓存组件(MemoryCache)源码解析
一.介绍由于CPU从内存中读取数据的速度比从磁盘读取快几个数量级,并且存在内存中,减小了数据库访问的压力,所以缓存几乎每个项目都会用到.一般常用的有MemoryCache.Redis.MemoryC ...
admin源码解析以及仿照admin设计stark组件
---恢复内容开始--- admin源码解析一启动:每个APP下的apps.py文件中. 首先执行每个APP下的admin.py 文件. def autodiscover(): autodisco ...
admin源码解析及自定义stark组件
admin源码解析单例模式单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在.当你希望在整个系统中,某个类只能出现一个实例时,单 ...

随机推荐

与文件上传到的三个类：FileItem类、ServletFileUpload 类、DiskFileItemFactory类
文件上传: ServletFileUpload负责处理上传的文件数据,并将表单中每个输入项封装成一个FileItem对象中, 在使用ServletFileUpload对象解析请求时需要根据DiskFi ...
jquery 组合键键盘事件
jQuery处理键盘事件,比如小说网站中常见的按左右键来实现上一篇文章和下一篇文章,按ctrl+回车实现表单提交,google reader和有道阅读中的全快捷键操作... 本文讲述jQuery处理按 ...
springMvc获取servletContext
springMvc获取servletContext WebApplicationContext webApplicationContext = ContextLoader.getCurrentWebA ...
Word常用实用知识2
纯手打,可能有错别字,使用的版本是office Word 2013 转载请注明出处 http://www.cnblogs.com/hnnydxgjj/p/6296863.html,谢谢. 批注和 ...
（二）Windows下Redis的主从复制
Redis拥有非常强大的主从复制功能,而且还支持一个master可以拥有多个slave,而一个slave又可以拥有多个slave,从而形成强大的多级服务器集群架构.目前在同一台window下安装三个r ...
SQL Server 2008 sp3启用1433端口的方法
SQL Server 2008 SP3一般的默认端口是1433,但有时候会遇到一些问题导致1433端口无法启用.这是笔者给大家指导如何开启1433端口工具/原料 SQL Server 2008 ...
HQL连接查询
HQL提供了连接查询机制如内连接,外连接,,还允许显示指定迫切内连接,和迫切外联结. 连接类型内连接 inner join 或join 迫切内链接 inner join fetch 左外联结 le ...
VS中生成debug和release的小问题
vs里生成dll,需要在解决方案上右键"属性",然后"配置",点击右上角"配置管理器(0)",选择debug或release,方可生效.不然 ...
2.JAVA垃圾回收机制
前言线程独享的内存区域有程序计数器,虚拟机栈,本地方法栈,这些区域不用考虑内存回收的问题,随着线程的执行结束,自然就回收了,而堆内存和方法区的回收则不一样,他们的内存分配和回收是动态的. 1.对象存 ...
Android7.0 Phone应用源码分析（三） phone拒接流程分析
本文主要分析Android拒接电话的流程,下面先来看一下拒接电话流程时序图步骤1:滑动按钮到拒接图标,会调用到AnswerFragment的onDecline方法 com.android.incal ...

Flume-ng源码解析之Channel组件