如何从一个已经存在的Flume source消费数据

1.下载flume

wget http://www.apache.org/dist/flume/stable/apache-flume-1.5.2-bin.tar.gz

2.创建一个自己的ConsoleSink.java

import org.apache.flume.*;

import org.apache.flume.conf.Configurable;

import org.apache.flume.sink.AbstractSink;

public class ConsoleSink extends AbstractSink implements Configurable {

    @Override

    public void configure(Context context) {

    }

    @Override

    public Status process() throws EventDeliveryException {

        Status status = Status.READY;

        Transaction tx = null;

        try {

            Channel channel = getChannel();

            tx = channel.getTransaction();

            tx.begin();

            for (int i = 0; i < 100; i++) {

                Event event = channel.take();

                if (event == null) {

                    status = Status.BACKOFF;

                    break;

                } else {

                    String body = new String(event.getBody());

                    System.out.println(body);

                }

            }

            tx.commit();

        } catch (Exception e) {

            if (tx != null) {

                tx.commit();

            }

            e.printStackTrace();

        } finally {

            if (tx != null) {

                tx.close();

            }

        }

        return status;

    }

}

3.编译

javac -classpath lib/flume-ng-core-1.5.2.jar:lib/flume-ng-sdk-1.5.2.jar:lib/flume-ng-configuration-1.5.2.jar ConsoleSink.java

jar -cvf console-sink.jar ConsoleSink.class

rm -rf ConsoleSink.class

mv console-sink.jar lib/ //这里编译完要放到flume的lib目录里

4.配置文件

conf/example.conf

a1.sources = r1

a1.sinks = k1

a1.channels = c1

# Describe/configure the source

a1.sources.r1.type = avro

a1.sources.r1.bind = 0.0.0.0

a1.sources.r1.port = 44444

# Describe the sink

a1.sinks.k1.type = ConsoleSink //这里是你自己Sink的包名和类名

# Use a channel which buffers events in memory

a1.channels.c1.type = memory

a1.channels.c1.capacity = 10000

a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

5.启动

bin/flume-ng  agent -c conf -f conf/example.conf -n a1

6.在需要被消费的Flume Source上配置

a1.channels = c1

a1.sinks = k1

a1.sinks.k1.type = avro

a1.sinks.k1.channel = c1

a1.sinks.k1.hostname = 10.10.10.10 //这里是刚刚启动agent的机器地址

a1.sinks.k1.port =

flume-ng 自定义sink消费flume source的更多相关文章

Flume NG Getting Started（Flume NG 新手入门指南）
Flume NG Getting Started(Flume NG 新手入门指南)翻译新手入门 Flume NG是什么? 有什么改变? 获得Flume NG 从源码构建配置 flume-ng全局选 ...
Hadoop实战-Flume之自定义Sink(十九)
import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import j ...
Flume NG基本架构与Flume NG核心概念
导读 Flume NG是一个分布式.可靠.可用的系统,它能够将不同数据源的海量日志数据进行高效收集.聚合.移动,最后存储到一个中心化数据存储系统中. 由原来的Flume OG到现在的Flume NG, ...
Flume的Avro Sink和Avro Source研究之二： Avro Sink
啊,AvroSink要复杂好多:< 好吧,先确定主要问题: AvroSink为啥这么多代码?有必要吗?它都有哪些逻辑需要实现? 你看,avro-rpc-quickstart里是这么建client ...
Flume的Avro Sink和Avro Source研究之一： Avro Source
问题 : Avro Source提供了怎么样RPC服务,是怎么提供的? 问题 1.1 Flume Source是如何启动一个Netty Server来提供RPC服务. 由GitHub上avro-rpc ...
高可用Hadoop平台－Flume NG实战图解篇
1.概述今天补充一篇关于Flume的博客,前面在讲解高可用的Hadoop平台的时候遗漏了这篇,本篇博客为大家讲述以下内容: Flume NG简述单点Flume NG搭建.运行高可用Flume N ...
Flume NG部署
本次配置单节点的Flume NG 1.下载flume安装包下载地址:(http://flume.apache.org/download.html) apache-flume-1.6.0-bin.ta ...
Flume（二） —— 自定义拦截器、Source、Sink
自定义拦截器自定义Source 自定义Sink 引入依赖 <dependency> <groupId>org.apache.flume</groupId> < ...
Flume简介与使用（三）——Kafka Sink消费数据之Kafka安装
前面已经介绍了如何利用Thrift Source生产数据,今天介绍如何用Kafka Sink消费数据. 其实之前已经在Flume配置文件里设置了用Kafka Sink消费数据 agent1.sinks ...

随机推荐

【Python】探测网站是否可以访问
首先贴上简陋的python脚本 #coding:utf-8 import urllib,linecache for line in linecache.updatecache('url.txt'): ...
2.5 Go错误处理
defer import "fmt" func testDefer(){ defer fmt.Println() defer fmt.Println() fmt.Println() ...
stream4
import java.util.Comparator; import java.util.function.BinaryOperator; public class BinaryOperatorTe ...
oracle 基础知识(一)
Oracle 用户.权限.角色管理 01.概念用户:对数据库的访问需要以适当的身份通过验证,这就是用户的作用:每个Oracle用户都有自己的用户名和密码,并且拥有他们所创建的任意表.视图和其他资源, ...
第二十一章：deploy and live updates
通常我们开发一个app之后,需要把他们放到对应的应用商店上去以供下载.在此期间,需要经过应用商店的审核,包括初次上传和更新上传.短则需要数天,多则需要几个星期,这对于我们的快速产品迭代和hotfix来 ...
Java学习第二十一天
1:字符流(掌握) (1)字节流操作中文数据不是特别的方便,所以就出现了转换流. 转换流的作用就是把字节流转换字符流来使用. (2)转换流其实是一个字符流字符流 = 字节流 + 编码表 (3)编码表 ...
键盘按键keyCode大全,js页面快捷键
字母和数字键的键码值(keyCode) 按键键码按键键码按键键码按键键码 A 65 J 74 S 83 1 49 B 66 K 75 T 84 2 50 C 67 L 76 U 85 3 ...
MyBatis 中 sqlmapconfig核心标签typeAliases配置说明
标签说明在 MyBatis 的 sql 映射配置文件中,需要使用 paramterType.resultType 来设置 sql 语句的输入输出参数,一般参数都是基本的数据类型或封装类型,但都需要声 ...
2018-12-20 第二章Java 预习作业
一.什么是变量?如何使用变量? 答:变量是在程序运行中其值可以改变的量,它是Java程序的一个基本存储单元. 变量的语法格式如下: [访问修饰符]变量类型变量名[=初始值]: 二.java中基本数据 ...
centOs升级
因为军佬放弃制作Centos7的网络重装包,又Centos7的安装引导和6有较大区别所以,选择曲线救国(技术不行,只能这样乱搞)前文:Centos6.9一键重装包https://ppx.ink/net ...

flume-ng 自定义sink消费flume source

如何从一个已经存在的Flume source消费数据

1.下载flume

2.创建一个自己的ConsoleSink.java

3.编译

4.配置文件

5.启动

6.在需要被消费的Flume Source上配置

flume-ng 自定义sink消费flume source的更多相关文章

随机推荐

热门专题