flume的自定义sink-Kafka

1、创建一个agent，sink类型需指定为自定义sink
       vi /usr/local/flume/conf/agent3.conf
       agent3.sources=as1
       agent3.channels=c1
       agent3.sinks=s1

agent3.sources.as1.type=avro
       agent3.sources.as1.bind=0.0.0.0
       agent3.sources.as1.port=41414
       agent3.sources.as1.channels=c1

agent3.channels.c1.type=memory

agent3.sinks.s1.type=storm.test.kafka.TestKafkaSink
       agent3.sinks.s1.channel=c1
   2、创建自定义kafka sink（自定义kafka sink中包装的是kafka的生产者），代码如下
       //参考flume官方的开发文档：http://flume.apache.org/FlumeDeveloperGuide.html#sink
       //自定义kafkasink需要继承AbstractSink类实现Configurable接口
       //该sink中使用的kafka topic（test111）必须存在

 package storm.test.kafka;

         import java.util.Properties;

         import kafka.javaapi.producer.Producer;

         import kafka.producer.KeyedMessage;

         import kafka.producer.ProducerConfig;

         import kafka.serializer.StringEncoder;

         import org.apache.flume.Channel;

         import org.apache.flume.Context;

         import org.apache.flume.Event;

         import org.apache.flume.EventDeliveryException;

         import org.apache.flume.Transaction;

         import org.apache.flume.conf.Configurable;

         import org.apache.flume.sink.AbstractSink;

         public class TestKafkaSink extends AbstractSink implements Configurable {

             Producer<String, String> producer;

             String topic = "test111";

             @Override

             public Status process() throws EventDeliveryException {

                 Status status = null;

                 Channel channel = getChannel();

                 Transaction transaction = channel.getTransaction();

                 transaction.begin();

                 try {

                     Event event = channel.take();

                     if (event==null) {

                         transaction.rollback();

                         status = Status.BACKOFF;

                         return status;

                     }

                     byte[] body = event.getBody();

                     final String msg = new String(body);

                     final KeyedMessage<String, String> message = new KeyedMessage<String, String>(topic , msg);

                     producer.send(message);

                     transaction.commit();

                     status = Status.READY;

                 } catch (Exception e) {

                     transaction.rollback();

                     status = Status.BACKOFF;

                 } finally {

                     transaction.close();

                 }

                 return status;

             }

             @Override

             public void configure(Context arg0) {

                 Properties prop = new Properties();

                 prop.put("zookeeper.connect", "h5:2181,h6:2181,h7:2181");

                 prop.put("metadata.broker.list", "h5:9092,h6:9092,h7:9092");

                 prop.put("serializer.class", StringEncoder.class.getName());

                 producer = new Producer<String, String>(new ProducerConfig(prop));

             }

         }

将代码打包为kafkasink.jar后复制到flume所在节点上的flume/lib目录下，然后还需要将kafka_2.10-0.8.2.0.jar、kafka-clients-0.8.2.0.jar、metrics-core-2.2.0.jar、scala-library-2.10.4.jar这4个jar包复制到flume所在节点上的flume/lib目录下。
   3、启动flume自定义的kafkasink的agent
       [root@h5 ~]# cd /usr/local/flume/
       [root@h5 flume]# bin/flume-ng agent --conf conf/ --conf-file conf/agent3.conf --name agent3 -Dflume.root.logger=INFO,console
   4、将日志写入到flume的agent，代码如下
       log4j.properties
           log4j.rootLogger=INFO,flume
           log4j.appender.flume = org.apache.flume.clients.log4jappender.Log4jAppender
           log4j.appender.flume.Hostname = 192.168.1.35
           log4j.appender.flume.Port = 41414
           log4j.appender.flume.UnsafeMode = true
       将日志写入到flume，代码如下

 package com.mengyao.flume;

             import java.io.File;

             import java.io.IOException;

             import java.util.Collection;

             import java.util.List;

             import org.apache.commons.io.FileUtils;

             import org.apache.log4j.Logger;

             public class FlumeProducer {

                 private static List<String> getLines() {

                     List<String> lines = null;

                     try {

                         final Collection<File> listFiles = FileUtils.listFiles(new File("D:/"), null, false);

                         for (File file : listFiles) {

                             lines = FileUtils.readLines(file);

                             break;

                         }

                     } catch (IOException e) {

                         e.printStackTrace();

                     }

                     return lines;

                 }

                 public static void main(String[] args) throws Exception {

                     final List<String> lines = getLines();

                     final Logger logger = Logger.getLogger(FlumeProducer.class);

                     for (String line : lines) {

                         logger.info(line+"\t"+System.currentTimeMillis());

                         Thread.sleep(1000);

                     }

                 }

             }

必须加入flume-ng-log4jappender-1.5.0-cdh5.1.3-jar-with-dependencies.jar这个依赖jar
   5、使用kafka消费者消费flume（自定义kafka sink中使用了kafka的生产者）生产的数据
       1、消费者shell代码
           [root@h7 kafka]# bin/kafka-console-consumer.sh --zookeeper h7:2181 --topic test111 --from-beginning       ##kafka集群是h5、h6、h7;zookeeper集群是h5、h6、h7。在任意kafka节点上使用消费者都一样

       2、消费者java代码

 package storm.test.kafka;

             import java.util.HashMap;

             import java.util.List;

             import java.util.Map;

             import java.util.Properties;

             import kafka.consumer.Consumer;

             import kafka.consumer.ConsumerConfig;

             import kafka.consumer.ConsumerIterator;

             import kafka.consumer.KafkaStream;

             import kafka.javaapi.consumer.ConsumerConnector;

             import kafka.serializer.StringEncoder;

             public class TestConsumer {

                 static final String topic = "test111";

                 public static void main(String[] args) {

                     Properties prop = new Properties();

                     prop.put("zookeeper.connect", "h5:2181,h6:2181,h7:2181");

                     prop.put("serializer.class", StringEncoder.class.getName());

                     prop.put("metadata.broker.list", "h5:9092,h6:9092,h7:9092");

                     prop.put("group.id", "group1");

                     ConsumerConnector consumer = Consumer.createJavaConsumerConnector(new ConsumerConfig(prop));

                     Map<String, Integer> topicCountMap = new HashMap<String, Integer>();

                     topicCountMap.put(topic, 1);

                     Map<String, List<KafkaStream<byte[], byte[]>>> messageStreams = consumer.createMessageStreams(topicCountMap);

                     final KafkaStream<byte[], byte[]> kafkaStream = messageStreams.get(topic).get(0);

                     ConsumerIterator<byte[], byte[]> iterator = kafkaStream.iterator();

                     while (iterator.hasNext()) {

                         String msg = new String(iterator.next().message());

                         System.out.println("收到消息："+msg);

                     }

                 }

             }

flume的自定义sink-Kafka的更多相关文章

Hadoop实战-Flume之自定义Sink(十九)
import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import j ...
Hadoop生态圈-Flume的组件之自定义Sink
Hadoop生态圈-Flume的组件之自定义Sink 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客主要介绍sink相关的API使用两个小案例,想要了解更多关于API的小技 ...
数据采集组件：Flume基础用法和Kafka集成
本文源码:GitHub || GitEE 一.Flume简介 1.基础描述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中 ...
Flink自定义Sink
Flink自定义Sink Flink 自定义Sink,把socket数据流数据转换成对象写入到mysql存储. #创建Student类 public class Student { private i ...
flume自定义Source(taildirSource)，自定义Sink(数据库)，开发完整步骤
一.flume简单了解推荐网站(简介包括简单案例部署): http://www.aboutyun.com/thread-8917-1-1.html 二.我的需求是实现从ftp目录下采集数据,目录下文件 ...
自定义flume的hbase sink 的序列化程序
package com.hello.hbase; import java.nio.charset.Charset; import java.text.SimpleDateFormat; import ...
flume 自定义sink
http://flume.apache.org/FlumeDeveloperGuide.html#sink 看了还是比较好上手的,简单翻译一下 sink的作用是从 Channel 提取 Event ...
flume-ng 自定义sink消费flume source
如何从一个已经存在的Flume source消费数据 1.下载flume wget http://www.apache.org/dist/flume/stable/apache-flume-1.5.2 ...
《OD学Flume》20160806Flume和Kafka
一.Flume http://flume.apache.org/FlumeUserGuide.html Flume是一个分布式的,可靠的,可用的,非常有效率的对大数据量的日志数据进行收集.聚集.移动信 ...

随机推荐

Linux设备驱动中的阻塞和非阻塞I/O
[基本概念] 1.阻塞阻塞操作是指在执行设备操作时,托不能获得资源,则挂起进程直到满足操作所需的条件后再进行操作.被挂起的进程进入休眠状态(不占用cpu资源),从调度器的运行队列转移到等待队列,直到 ...
linux-swappiness参数的作用及设置
linux 会使用硬盘的一部分做为SWAP分区,用来进行进程调度--进程是正在运行的程序--把当前不用的进程调成‘等待(standby)‘,甚至‘睡眠(sleep)’,一旦要用,再调成‘活动(acti ...
SpringMVC06以对象的方式获取前台的数据
========创建需要的两个实体类================ public class School { private String sName; private String addres ...
java集合框架03
Collections工具类的使用 public class News implements Comparable { private int id; //新闻编号 private String ti ...
Linux服务的管理
1.Linux服务的介绍系统服务 --某些服务的服务的对象是Linux系统本身,或者Linux系统系统用户,这类服务我们称为系统服务(System Service) 网络服务 --提供给网络中的其他 ...
java SSH整合配置
web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app version="3 ...
纯 CSS 创建各种不同的图形形状
使用代码矩形 .rectangle { width: 250px; height: 150px; background-color: #6DC75F; } <div></div&g ...
运维监控利器smokeping 500报错处理
检查apache日志发现有以下错误: No such file or directory: exec of '/usr/local/smokeping/htdocs/smokeping.cgi' fa ...
用Spring Boot零配置快速创建web项目（1）
一.Spring Boot简介 Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程.该框架使用了特定的方式来进行配置,从而使开发人 ...
Ubuntu 安装之后的配置博文总结
由于频繁地在各种机器上给别人安装ubuntu,每次安装之后都需要进行一些配置,现在以ubuntu12.04为例,就他人的一些配置博文总结如下: 1. Ubuntu安装中文输入法 http://www. ...

flume的自定义sink-Kafka

flume的自定义sink-Kafka的更多相关文章

随机推荐

热门专题