自定义kafka Sink

package my.bigdata;

/**

 * Created by lq on 2017/8/22.

 */

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.util.Map;

import java.util.Properties;

import my.utils.PropertiesUtils;

import org.apache.flume.Channel;

import org.apache.flume.Context;

import org.apache.flume.Event;

import org.apache.flume.EventDeliveryException;

import org.apache.flume.Transaction;

import org.apache.flume.conf.Configurable;

import org.apache.flume.sink.AbstractSink;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

public class KafkaSink2 extends AbstractSink implements Configurable {

    private static String TOPIC = null;

    private Producer<String, String> producer;

    private static Properties properties = null;

    static {

        final String topicCfg ="topic.cfg";

        final String myKafkaSinkCfg ="myKafkaSink.cfg";

        TOPIC = (String) PropertiesUtils.getPropertiesFromClass(KafkaSink2.class,topicCfg).get("topic");

        properties = PropertiesUtils.getPropertiesFromClass(KafkaSink2.class,myKafkaSinkCfg);

    }

    public Status process() throws EventDeliveryException {

        // TODO Auto-generated method stub

        Channel channel = getChannel();

        Transaction transaction = channel.getTransaction();

        try {

            transaction.begin();

            Event event = channel.take();

            if (event == null) {

                transaction.rollback();

                return Status.BACKOFF;

            }

            Map<String, String> headers = event.getHeaders();

            String logtype = headers.get("logtype");

            //随机

            String random = System.currentTimeMillis() + "";//随机数,key,避免写热点问题

            String kafkaKey = random + "_" + logtype;

            // public ProducerRecord(String topic, K key, V value)

            ProducerRecord<String, String> data = new ProducerRecord<String, String>(

                    TOPIC, kafkaKey, new String(event.getBody()));

            producer.send(data);

            transaction.commit();

            return Status.READY;

        } catch (Exception e) {

            transaction.rollback();

            return Status.BACKOFF;

        } finally {

            transaction.close();

        }

    }

    public void configure(Context arg0) {

        producer = new KafkaProducer<>(properties);

    }

}

package my.bigdata;

import org.apache.kafka.clients.producer.Partitioner;

import org.apache.kafka.common.Cluster;

import java.util.Map;

/**

 * Created by lq on 2017/8/22.

 */

public class kafkaSinkPartitioner implements Partitioner {

    @Override

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        int parNums = cluster.partitionsForTopic(topic).size();

        try {

            String randomInKey = ((String) key).split("_")[];

            return (int) Math.abs(Long.parseLong(randomInKey) % parNums);

        } catch (Exception e) {

            return Math.abs(key.hashCode() % parNums);

        }

    }

    @Override

    public void close() {

    }

    @Override

    public void configure(Map<String, ?> map) {

    }

}

自定义kafka Sink的更多相关文章

自定义Flume Sink：ElasticSearch Sink
Flume Sink的目的是从Flume Channel中获取数据然后输出到存储或者其他Flume Source中.Flume Agent启动的时候,它会为每一个Sink都启动一个SinkRunner ...
《从0到1学习Flink》—— 如何自定义 Data Sink ？
前言前篇文章 <从0到1学习Flink>-- Data Sink 介绍介绍了 Flink Data Sink,也介绍了 Flink 自带的 Sink,那么如何自定义自己的 Sink 呢 ...
Flink 从 0 到 1 学习 —— 如何自定义 Data Sink ？
前言前篇文章 <从0到1学习Flink>-- Data Sink 介绍介绍了 Flink Data Sink,也介绍了 Flink 自带的 Sink,那么如何自定义自己的 Sink 呢 ...
Flume简介与使用（三）——Kafka Sink消费数据之Kafka安装
前面已经介绍了如何利用Thrift Source生产数据,今天介绍如何用Kafka Sink消费数据. 其实之前已经在Flume配置文件里设置了用Kafka Sink消费数据 agent1.sinks ...
Spring Boot 自定义kafka 消费者配置 ContainerFactory最佳实践
Spring Boot 自定义kafka 消费者配置 ContainerFactory最佳实践本篇博文主要提供一个在 SpringBoot 中自定义 kafka配置的实践,想象这样一个场景:你的系统 ...
基于RobotFramework——自定义kafka库并导入使用
[Kafka] 首先介绍一下我了解的kafka的皮毛信息—— kafka——一个分布流处理系统:流处理:可以像消息队列一样publish或者subscribe信息:分布式:提供了容错性,并发处理消息的 ...
【翻译】Flink Table Api & SQL — 自定义 Source & Sink
本文翻译自官网: User-defined Sources & Sinks https://ci.apache.org/projects/flink/flink-docs-release-1 ...
flume的自定义sink-Kafka
1.创建一个agent,sink类型需指定为自定义sink vi /usr/local/flume/conf/agent3.conf agent3.sources=as1 ...
#研发解决方案介绍#Recsys-Evaluate（推荐评测）
郑昀基于刘金鑫文档最后更新于2014/12/1 关键词:recsys.推荐评测.Evaluation of Recommender System.piwik.flume.kafka.storm.r ...

随机推荐

关于varchar(max), nvarchar(max)和varbinary(max)
在MS SQL2005及以上的版本中,加入大值数据类型(varchar(max).nvarchar(max).varbinary(max) ).大值数据类型最多可以存储2^30-1个字节的数据.这几个 ...
跟我学SharePoint 2013视频培训课程——怎样创建列表和列表项（7）
课程简介第7天,怎样在SharePoint 2013中创建列表和列表项视频 SharePoint 2013 交流群 41032413
Groovy 学习手册（4）
6. 领域特定语言 Groovy 有许多特性,使它非常适合写DSL(领域特定语言).这些特性包活: 具有委托机制的闭包: 点号(.)和语句末尾的分号(;)是可选的: 运算符的重载(例如,加号,减号等) ...
PyCharm黄色波浪线提示: Simplify chained comparison
译过来就是,可简化连锁比较: case 1 if a >= 0 and a <= 9: 1 可简化为: if 0 <= a <= 9: 1 就像我们的数学表达式一样.显然这种情 ...
第2章 Python基础-字符编码&数据类型字符编码&字符串练习题
1.简述位.字节的关系位(bit)是计算机中最小的表示单元,数据传输是以“位”为单位的,1bit缩写为1b 字节(Byte)是计算机中最小的存储单位,1Byte缩写为1B 8bit = 1Byte ...
[转]FutureTask详解
FutureTask类是Future 的一个实现,并实现了Runnable,所以可通过Excutor(线程池) 来执行,也可传递给Thread对象执行.如果在主线程中需要执行比较耗时的操作时,但又不 ...
mongodb 数据库操作--备份还原导出导入（转）
mongodb 数据库操作--备份还原导出导入 -------------------MongoDB数据导入与导出------------------- 1.导出工具:mongoexport ...
ganglia安装 by frank
作者是frank. 1.安装epelrpm -Uvh http://dl.fedoraproject.org/pub/epel/5/i386/epel-release-5-4.noarch.rpm2. ...
JS实现PC、Android、IOS端的点击按钮复制内容功能
直接上代码: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...
JavaScript面向对象：类、方法、属性
JavaScript是一种基于对象的语言,与传统面向对象语言(C#.C++)相比,JavaScript中没有类的概念,其继承有两种基本形式:基于对象的继承和基于类型的继承(原型链继承).无论哪种形式的 ...

自定义kafka Sink

自定义kafka Sink的更多相关文章

随机推荐

热门专题