Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）

　　　　　　　　　　　　　　　　Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

　　本篇博客只是举例了一个自定义拦截器的方法，测试字节传输速度。

1>.自定义interceptor方法

 /*

 @author :yinzhengjie

 Blog:http://www.cnblogs.com/yinzhengjie/tag/Hadoop%E7%94%9F%E6%80%81%E5%9C%88/

 EMAIL:y1053419035@qq.com

 */

 package cn.org.yinzhengjie.interceptor;

 import org.apache.flume.Context;

 import org.apache.flume.Event;

 import org.apache.flume.interceptor.Interceptor;

 import java.util.List;

 /**

  * 设置限速拦截器

  * <p>

  * 当 字节/时间，即同一时刻，如果进入的字节过多

  * 则休眠一会

  */

 public class MyInterceptor implements Interceptor {

     private int speed;

     //构造

     private MyInterceptor(int speed) {

         this.speed = speed;

     }

     //do nothing

     public void initialize() {

     }

     /**

      * 1、拿出上一个event的时间，和当前时间进行相减，得出上一个event的时间间隔

      * 2、得到上一个event的body字节数

      * 3、相除得到上一个event的速度，并在此event中先进行停留，再返回event

      *

      * @param event

      * @return

      */

     long lastTime = -1;

     long lastBodySize = 0;

     public Event intercept(Event event) {

         byte[] body = event.getBody();

         int len = body.length;

         long current = System.nanoTime();

         //第一个event

         if (lastTime == -1) {

             lastTime = current;

             lastBodySize = len;

         }

         //非第一个event

         else {

             //计算上一个event停留的时间

             long interval = current - lastTime;

             System.out.println("=========================" + current + "/" + lastTime + "/" + interval + "=========================");

             //上一个event的速度

             int now_speed = (int) ((double) lastBodySize / interval * 1000);

             if (now_speed > speed) {

                 System.out.println("=========================" + now_speed + "=========================");

                 //计算需要停留多少秒 线程休眠，时间 = shouldTime - interval

                 try {

                     Thread.sleep((lastBodySize / speed) * 1000 - interval);

                 } catch (InterruptedException e) {

                     e.printStackTrace();

                 }

             }

             lastBodySize = len;

             lastTime = System.currentTimeMillis();

         }

         return event;

     }

     //迭代List<Event>，将所有Event交给intercept(Event)进行处理

     public List<Event> intercept(List<Event> events) {

         for (Event event : events) {

             intercept(event);

         }

         return events;

     }

     //do nothing

     public void close() {

     }

     public static class Builder implements Interceptor.Builder {

         private int speed;

         public void configure(Context context) {

             speed = context.getInteger(Constants.SPEED, Constants.DEFAULT_SPEED);

         }

         public Interceptor build() {

             return new MyInterceptor(speed);

         }

     }

     public static class Constants {

         public static String SPEED = "speed";

         public static int DEFAULT_SPEED = 1;

     }

 }

2>.打包并将其发送到 /soft/flume/lib下

[yinzhengjie@s101 ~]$ cd /soft/flume/lib/

[yinzhengjie@s101 lib]$

[yinzhengjie@s101 lib]$ ll | grep MyFlume

-rw-r--r--  1 yinzhengjie yinzhengjie    5231 Jun 20 18:53 MyFlume-1.0-SNAPSHOT.jar

[yinzhengjie@s101 lib]$

[yinzhengjie@s101 lib]$ rm -rf MyFlume-1.0-SNAPSHOT.jar

[yinzhengjie@s101 lib]$

[yinzhengjie@s101 lib]$ rz

[yinzhengjie@s101 lib]$

[yinzhengjie@s101 lib]$ ll | grep MyFlume

-rw-r--r--  1 yinzhengjie yinzhengjie    8667 Jun 20 21:02 MyFlume-1.0-SNAPSHOT.jar

[yinzhengjie@s101 lib]$

[yinzhengjie@s101 lib]$

3>.编写agent的配置文件

[yinzhengjie@s101 ~]$ more /soft/flume/conf/yinzhengjie_myInterceptor.conf

# Name the components on this agent

a1.sources = r1

a1.sinks = k1

a1.channels = c1

# 定义源: seq

a1.sources.r1.type = seq

# 定义一次RPC产生的批次数量

a1.sources.r1.batchSize = 

# 指定添加拦截器

a1.sources.r1.interceptors = i1

a1.sources.r1.interceptors.i1.type = cn.org.yinzhengjie.interceptor.MyInterceptor$Builder

a1.sources.r1.interceptors.i1.speed = 

# Describe the sink

a1.sinks.k1.type = logger

# Use a channel which buffers events in memory

a1.channels.c1.type = memory

a1.channels.c1.capacity =

a1.channels.c1.transactionCapacity = 

# Bind the source and sink to the channel

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

[yinzhengjie@s101 ~]$

4>.启动flume并测试

[yinzhengjie@s101 ~]$ flume-ng agent -f /soft/flume/conf/yinzhengjie_myInterceptor.conf -n a1

　　下图是运行agent部分的输出内容

Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）的更多相关文章

Hadoop生态圈-Flume的组件之自定义Sink
Hadoop生态圈-Flume的组件之自定义Sink 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客主要介绍sink相关的API使用两个小案例,想要了解更多关于API的小技 ...
Hadoop生态圈-Flume的组件之拦截器与选择器
Hadoop生态圈-Flume的组件之拦截器与选择器作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客只是配置的是Flume主流的Interceptors,想要了解更详细 ...
Hadoop生态圈-Flume的组件之sink处理器
Hadoop生态圈-Flume的组件之sink处理器作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一. 二.
Flume（二） —— 自定义拦截器、Source、Sink
自定义拦截器自定义Source 自定义Sink 引入依赖 <dependency> <groupId>org.apache.flume</groupId> < ...
Struts2自定义拦截器Interceptor以及拦截器登录实例
1.在Struts2自定义拦截器有三种方式: -->实现Interceptor接口 public class QLInterceptorAction implements Interceptor ...
第1节 flume：15、flume案例二，通过自定义拦截器实现数据的脱敏
1.7.flume案例二案例需求: 在数据采集之后,通过flume的拦截器,实现不需要的数据过滤掉,并将指定的第一个字段进行加密,加密之后再往hdfs上面保存原始数据与处理之后的数据对比图一 ...
Struts2自定义拦截器
1. 需求自定义拦截器实现,用户登录的访问控制. 2. 定义拦截器类 public class LoginInterceptor extends AbstractInterceptor { @Ove ...
struts2--实现自定义拦截器
前言: 本篇文章,我想说清实现拦截器的办法,还有为什么要这样做: 目录: 1.需求目的 2.实现步骤及原理(文字怕描述不清,画图描述) 3.代码 4.总结一.需求目的规范或限制越级访问(例如:一个 ...
java：struts框架3（自定义拦截器，token令牌，文件上传和下载（单/多））
1.自定义拦截器: struts.xml: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...

随机推荐

异常 org.apache.ibatis.binding.BindingException: Invalid bound statement (not found) 解决方案
原来是因为 AssetsMapper.xml 不知道为什么不见了,导致这个异常,在启动项目时的启动任务里调用到了它,然后因为没有这个xml,所以抛出异常启动信息: C:\extend\Develop ...
ASYNC_IO_COMPLETION
项目组有一个数据库备份的Job运行异常,该Job将备份数据存储到remote server上,平时5个小时就能完成的备份操作,现在运行19个小时还没有完成,backup命令的Wait type是 AS ...
zooland 新开源的RPC项目，希望大家在开发的微服务的时候多一种选择，让微服务开发简单，并且容易上手。
zooland 我叫它动物园地,一个构思很长时间的一个项目.起初只是觉得各种通信框架都封装的很好了,但是就是差些兼容,防错,高可用.同时在使用上,不希望有多余的代码,像普通接口一样使用就可以了. 基于 ...
JavaScript快速入门-ECMAScript运算符
1.逻辑运算符逻辑与:&&(and) 逻辑或:||(or) 逻辑非:!(not) 逻辑 AND 运算符(&&) 逻辑 AND 运算的运算数可以是任何类型的,不止是 B ...
《Effective Java》学习笔记 —— 通用程序设计
本章主要讨论局部变量.控制结构.类库.反射.本地方法的用法及代码优化和命名惯例. 第45条将局部变量的作用域最小化 * 在第一次使用的它的地方声明局部变量(就近原则). * 几乎每个局部变量的声明都 ...
Microsoft Dynamics CRM 常用JS语法（已转成vs2017语法提示）
背景最近接触到Microsoft Dynamics CRM的开发.前端js是必不可少的部分,奈何没有一个语法提示,点不出来后续的语句. 在vscode上面搜索插件的时候发现,有一个大神写的插件htt ...
linux使用curl上传文件并且同时携带其它传递参数
一般使用linux原生态的命令curl上传文件时命令如下假如要上传文件是myfile.txt curl -F "file_name=@myfile.txt" -X POST &q ...
PAT甲题题解-1028. List Sorting (25)-水排序
#include <iostream> #include <cstdio> #include <algorithm> #include <string.h&g ...
LINUX内核分析第五周学习总结——扒开应用系统的三层皮（下）
LINUX内核分析第五周学习总结——扒开应用系统的三层皮(下) 张忻(原创作品转载请注明出处) <Linux内核分析>MOOC课程http://mooc.study.163.com/cou ...
RYU 灭龙战 third day
RYU 灭龙战 third day 前言传统的交换机有自学习能力.然而你知道在SDN的世界里,脑子空空的OpenFlow交换机是如何学习的吗?今日说法带你领略SDN的mac学习能力. RYUBook ...

Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）

Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）的更多相关文章

随机推荐

热门专题