kafka producer自定义partitioner和consumer多线程

　　为了更好的实现负载均衡和消息的顺序性，Kafka Producer可以通过分发策略发送给指定的Partition。Kafka Java客户端有默认的Partitioner，平均的向目标topic的各个Partition中生产数据，如果想要控制消息的分发策略，有两种方式，一种是在发送前创建ProducerRecord时指定分区（针对单个消息），另一种就是就是根据Key自己写算法。继承Partitioner接口，实现其partition方法。并且配置启动参数 props.put("partitioner.class","com.example.demo.MyPartitioner")，示例代码如下：

　　自定义的partitoner

package com.example.demo;

import java.util.Map;

import org.apache.kafka.clients.producer.Partitioner;

import org.apache.kafka.common.Cluster;

public class MyPartitioner implements Partitioner {

    @Override

    public void configure(Map<String, ?> configs) {

    }

    @Override

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

         if (Integer.parseInt((String)key)%3==1)

                return 0;

         else if (Integer.parseInt((String)key)%3==2)

                return 1;

         else return 2;

    }

    @Override

    public void close() {

    }

}

　　producer类中指定partitioner.class

package com.example.demo;

import java.util.Properties;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

public class MyProducer {

    public static void main(String[] args) {

        Properties props = new Properties();

        props.put("bootstrap.servers", "192.168.1.124:9092");

                props.put("acks", "all");

                props.put("retries", 0);

                props.put("batch.size", 16384);

                props.put("linger.ms", 1);

                props.put("partitioner.class", "com.example.demo.MyPartitioner");

                props.put("buffer.memory", 33554432);

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        Producer<String, String> producer = new KafkaProducer<>(props);

        for (int i = 0; i < 100; i++)

            producer.send(new ProducerRecord<String, String>("powerTopic", Integer.toString(i), Integer.toString(i)));

        producer.close();

    }

}

　　测试consumer

package com.example.demo;

import java.util.Arrays;

import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

public class MyAutoCommitConsumer {

    public static void main(String[] args) {

         Properties props = new Properties();

         props.put("bootstrap.servers", "192.168.1.124:9092");

         props.put("group.id", "test");

         props.put("enable.auto.commit", "true");

         props.put("auto.commit.interval.ms", "1000");

         props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

         props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

         @SuppressWarnings("resource")

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);

         consumer.subscribe(Arrays.asList("powerTopic"));

         while (true) {

             ConsumerRecords<String, String> records = consumer.poll(100);

             for (ConsumerRecord<String, String> record : records)

                 System.out.printf("partition = %d,offset = %d, key = %s, value = %s%n",record.partition(), record.offset(), record.key(), record.value());

         }

    }

}

　　启动zookeeper和kafka，使用命令行新建一个 3个partition的topic：powerTopic，为了方便查看结果，将producer的循环次数设置为15，运行consumer和producer代码，效果如下：

　　虽然我们有三个分区，但是我们group组中只有一个消费者，所以三个分区的消息被这个消费者顺序消费，下面我们实现一个消费者组，示例代码如下：

　　ConsumerThread类

package com.example.demo;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.util.Arrays;

import java.util.Properties;

public class ConsumerThread implements Runnable {

    private  KafkaConsumer<String,String> kafkaConsumer;

    private final String topic;

    public ConsumerThread(String brokers,String groupId,String topic){

        Properties properties = buildKafkaProperty(brokers,groupId);

        this.topic = topic;

        this.kafkaConsumer = new KafkaConsumer<String, String>(properties);

        this.kafkaConsumer.subscribe(Arrays.asList(this.topic));

    }

    private static Properties buildKafkaProperty(String brokers,String groupId){

        Properties properties = new Properties();

        properties.put("bootstrap.servers", brokers);

        properties.put("group.id", groupId);

        properties.put("enable.auto.commit", "true");

        properties.put("auto.commit.interval.ms", "1000");

        properties.put("session.timeout.ms", "30000");

        properties.put("auto.offset.reset", "earliest");

        properties.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        properties.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        return properties;

    }

    @Override

    public void run() {

        while (true){

            ConsumerRecords<String,String> consumerRecords = kafkaConsumer.poll(100);

            for(ConsumerRecord<String,String> item : consumerRecords){

                System.out.println(Thread.currentThread().getName());

                System.out.printf("partition = %d,offset = %d, key = %s, value = %s%n",item.partition(), item.offset(), item.key(), item.value());

            }

        }

    }

}

　　ConsumerGroup类

package com.example.demo;

import java.util.ArrayList;

import java.util.List;

public class ConsumerGroup {

    private List<ConsumerThread> consumerThreadList = new ArrayList<ConsumerThread>();

    public ConsumerGroup(String brokers,String groupId,String topic,int consumerNumber){

        for(int i = 0; i< consumerNumber;i++){

            ConsumerThread consumerThread = new ConsumerThread(brokers,groupId,topic);

            consumerThreadList.add(consumerThread);

        }

    }

    public void start(){

        for (ConsumerThread item : consumerThreadList){

            Thread thread = new Thread(item);

            thread.start();

        }

    }

}

　　消费者组启动类ConsumerGroupMain

package com.example.demo;

public class ConsumerGroupMain {

    public static void main(String[] args){

        String brokers = "192.168.1.124:9092";

        String groupId = "group01";

        String topic = "powerTopic";

        int consumerNumber = 3;

        ConsumerGroup consumerGroup = new ConsumerGroup(brokers,groupId,topic,consumerNumber);

        consumerGroup.start();

    }

}

　　启动消费者和生产者，可以看到不同的分区是不同的线程去执行的效果如下：

kafka producer自定义partitioner和consumer多线程的更多相关文章

【原创】Kafka Consumer多线程实例
Kafka 0.9版本开始推出了Java版本的consumer,优化了coordinator的设计以及摆脱了对zookeeper的依赖.社区最近也在探讨正式用这套consumer API替换Scala ...
【原创】Kafka Consumer多线程实例续篇
在上一篇<Kafka Consumer多线程实例>中我们讨论了KafkaConsumer多线程的两种写法:多KafkaConsumer多线程以及单KafkaConsumer多线程.在第二种 ...
Kettle安装Kafka Consumer和Kafka Producer插件
1.从github上下载kettle的kafka插件,地址如下 Kafka Consumer地址: https://github.com/RuckusWirelessIL/pentaho-kafka- ...
【原创】kafka producer源代码分析
Kafka 0.8.2引入了一个用Java写的producer.下一个版本还会引入一个对等的Java版本的consumer.新的API旨在取代老的使用Scala编写的客户端API,但为了兼容性 ...
玩转Kafka的生产者——分区器与多线程
上篇文章学习kafka的基本安装和基础概念,本文主要是学习kafka的常用API.其中包括生产者和消费者, 多线程生产者,多线程消费者,自定义分区等,当然还包括一些避坑指南. 首发于个人网站:链接地址 ...
kafka producer实例
1. 定义要发送的消息User POJO package lenmom.kafkaproducer; public class User { public String name; public in ...
Kafka Producer接口
参考, https://cwiki.apache.org/confluence/display/KAFKA/0.8.0+Producer+Example http://kafka.apache.org ...
详解Kafka Producer
上一篇文章我们主要介绍了什么是 Kafka,Kafka 的基本概念是什么,Kafka 单机和集群版的搭建,以及对基本的配置文件进行了大致的介绍,还对 Kafka 的几个主要角色进行了描述,我们知道,不 ...
Kafka Producer相关代码分析【转】
来源:https://www.zybuluo.com/jewes/note/63925 @jewes 2015-01-17 20:36 字数 1967 阅读 1093 Kafka Producer相关 ...

随机推荐

12、Semantic-UI之输入框
12.1 基础输入框在Semantic-UI中可以定义多个样式的输入框,可以将图片与输入框结合,输入提示信息文字,设置输入框的状态. 示例:定义基础输入框用户名: <div class= ...
Verilog MIPS32 CPU（五）-- CP0
Verilog MIPS32 CPU(一)-- PC寄存器 Verilog MIPS32 CPU(二)-- Regfiles Verilog MIPS32 CPU(三)-- ALU Verilog M ...
Wait--查看等待
--清除等待统计 --===================================================== --清除等待统计 DBCC SQLPERF (N'sys.dm_os_ ...
什么是C#？什么是.NET Framework?
1.什么是C#: 解1:C#就是一门开发语言,是由C及C++演变而来的,有朋友戏称之为"C四个+",这里的"#"号,不读"井",而读做&qu ...
pageadmin自助建站网站目录权限的设置方法
在用pageadmin网页设计的时候遇到各种问题可以参考官网教程网站目录权限的设置方法网站目录必须设置读取和写入权限,否则后台解压,删除文件,在线上传等功能都无法正常使用,下面讲解本机和服务器配置目 ...
转载：quartz详解：quartz由浅入深
转载网址:http://blog.itpub.net/11627468/viewspace-1763498/ 一.quartz核心概念先来看一张图: scheduler 任务调度器 ...
《Beginning Java 7》 - 4 - finalize() 手动垃圾回收
当我们想在系统进行垃圾回收时做一些特定的工作,我们就可以重写 finalze() 函数,因为 Object 的此函数是空的. 比如: protected void finalize() throws ...
“全栈2019”Java第七十五章：内部类持有外部类对象
难度初级学习时间 10分钟适合人群零基础开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
LVM 认知与扩容操作
继上次 "Linux系统如何迁移至LVM磁盘"反响不错,近三百的访问量吧.这次想续写点东西,主要讲的是"LVM认知和扩容操作".因为网上大多数不准确,可能作者也 ...
opencv学习笔记(七)---图像金字塔
图像金字塔指的是同一图像不同分辨率的子图的集合,有向下取样金字塔,向上取样金字塔,拉普拉斯金字塔....它是图像多尺度表达的一种,最主要的是用于图像的分割向下取样金字塔指高分辨率图像向低分辨率图像的 ...

kafka producer自定义partitioner和consumer多线程

kafka producer自定义partitioner和consumer多线程的更多相关文章

随机推荐

热门专题