[Kafka] - Kafka Java Consumer实现(二)

Kafka提供了两种Consumer API，分别是：High Level Consumer API 和 Lower Level Consumer API(Simple Consumer API)

High Level Consumer API：高度抽象的Kafka消费者API；将底层具体获取数据、更新offset、设置偏移量等操作屏蔽掉，直接将操作数据流的处理工作提供给编写程序的人员。优点是：操作简单；缺点：可操作性太差，无法按照自己的业务场景选择处理方式。(入口类：ConsumerConnector)

Lower Level Consumer API：通过直接操作底层API获取数据的方式获取Kafka中的数据，需要自行给定分区、偏移量等属性。优点：可操作性强；缺点：代码相对而言比较复杂。(入口类：SimpleConsumer)

这里主要将High Level Consumer API使用Java代码实现并测试：

Lower Level Consumer API详见博客：[Kafka] - Kafka Java Consumer实现(一)

========================================================================

一、JavaKafkaConsumerHighAPI：使用Kafka High Level Consumer API多线程读取数据的相关API实现，具体代码如下：

import kafka.consumer.*;

import kafka.javaapi.consumer.ConsumerConnector;

import kafka.message.MessageAndMetadata;

import kafka.serializer.StringDecoder;

import kafka.utils.VerifiableProperties;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import java.util.Properties;

import java.util.concurrent.ExecutorService;

import java.util.concurrent.Executors;

import java.util.concurrent.TimeUnit;

/**

 * 自定义简单Kafka消费者， 使用高级API

 * Created by gerry on 12/21.

 */

public class JavaKafkaConsumerHighAPI implements Runnable {

    /**

     * Kafka数据消费对象

     */

    private ConsumerConnector consumer;

    /**

     * Kafka Topic名称

     */

    private String topic;

    /**

     * 线程数量，一般就是Topic的分区数量

     */

    private int numThreads;

    /**

     * 线程池

     */

    private ExecutorService executorPool;

    /**

     * 构造函数

     *

     * @param topic      Kafka消息Topic主题

     * @param numThreads 处理数据的线程数/可以理解为Topic的分区数

     * @param zookeeper  Kafka的Zookeeper连接字符串

     * @param groupId    该消费者所属group ID的值

     */

    public JavaKafkaConsumerHighAPI(String topic, int numThreads, String zookeeper, String groupId) {

        // 1. 创建Kafka连接器

        this.consumer = Consumer.createJavaConsumerConnector(createConsumerConfig(zookeeper, groupId));

        // 2. 数据赋值

        this.topic = topic;

        this.numThreads = numThreads;

    }

    @Override

    public void run() {

        // 1. 指定Topic

        Map<String, Integer> topicCountMap = new HashMap<String, Integer>();

        topicCountMap.put(this.topic, this.numThreads);

        // 2. 指定数据的解码器

        StringDecoder keyDecoder = new StringDecoder(new VerifiableProperties());

        StringDecoder valueDecoder = new StringDecoder(new VerifiableProperties());

        // 3. 获取连接数据的迭代器对象集合

        /**

         * Key: Topic主题

         * Value: 对应Topic的数据流读取器，大小是topicCountMap中指定的topic大小

         */

        Map<String, List<KafkaStream<String, String>>> consumerMap = this.consumer.createMessageStreams(topicCountMap, keyDecoder, valueDecoder);

        // 4. 从返回结果中获取对应topic的数据流处理器

        List<KafkaStream<String, String>> streams = consumerMap.get(this.topic);

        // 5. 创建线程池

        this.executorPool = Executors.newFixedThreadPool(this.numThreads);

        // 6. 构建数据输出对象

        int threadNumber = 0;

        for (final KafkaStream<String, String> stream : streams) {

            this.executorPool.submit(new ConsumerKafkaStreamProcesser(stream, threadNumber));

            threadNumber++;

        }

    }

    public void shutdown() {

        // 1. 关闭和Kafka的连接，这样会导致stream.hashNext返回false

        if (this.consumer != null) {

            this.consumer.shutdown();

        }

        // 2. 关闭线程池，会等待线程的执行完成

        if (this.executorPool != null) {

            // 2.1 关闭线程池

            this.executorPool.shutdown();

            // 2.2. 等待关闭完成, 等待五秒

            try {

                if (!this.executorPool.awaitTermination(5, TimeUnit.SECONDS)) {

                    System.out.println("Timed out waiting for consumer threads to shut down, exiting uncleanly!!");

                }

            } catch (InterruptedException e) {

                System.out.println("Interrupted during shutdown, exiting uncleanly!!");

            }

        }

    }

    /**

     * 根据传入的zk的连接信息和groupID的值创建对应的ConsumerConfig对象

     *

     * @param zookeeper zk的连接信息，类似于：<br/>

     *                  hadoop-senior01.ibeifeng.com:2181,hadoop-senior02.ibeifeng.com:2181/kafka

     * @param groupId   该kafka consumer所属的group id的值， group id值一样的kafka consumer会进行负载均衡

     * @return Kafka连接信息

     */

    private ConsumerConfig createConsumerConfig(String zookeeper, String groupId) {

        // 1. 构建属性对象

        Properties prop = new Properties();

        // 2. 添加相关属性

        prop.put("group.id", groupId); // 指定分组id

        prop.put("zookeeper.connect", zookeeper); // 指定zk的连接url

        prop.put("zookeeper.session.timeout.ms", "400"); //

        prop.put("zookeeper.sync.time.ms", "200");

        prop.put("auto.commit.interval.ms", "1000");

        // 3. 构建ConsumerConfig对象

        return new ConsumerConfig(prop);

    }

    /**

     * Kafka消费者数据处理线程

     */

    public static class ConsumerKafkaStreamProcesser implements Runnable {

        // Kafka数据流

        private KafkaStream<String, String> stream;

        // 线程ID编号

        private int threadNumber;

        public ConsumerKafkaStreamProcesser(KafkaStream<String, String> stream, int threadNumber) {

            this.stream = stream;

            this.threadNumber = threadNumber;

        }

        @Override

        public void run() {

            // 1. 获取数据迭代器

            ConsumerIterator<String, String> iter = this.stream.iterator();

            // 2. 迭代输出数据

            while (iter.hasNext()) {

                // 2.1 获取数据值

                MessageAndMetadata value = iter.next();

                // 2.2 输出

                System.out.println(this.threadNumber + ":" + ":" + value.offset() + value.key() + ":" + value.message());

            }

            // 3. 表示当前线程执行完成

            System.out.println("Shutdown Thread:" + this.threadNumber);

        }

    }

}

二、JavaKafkaConsumerHighAPITest：测试类

/**

 * Created by ibf on 12/21.

 */

public class JavaKafkaConsumerHighAPITest {

    public static void main(String[] args) {

        String zookeeper = "192.168.187.146:2181";

        String groupId = "group1";

        String topic = "test2";

        int threads = 1;

        JavaKafkaConsumerHighAPI example = new JavaKafkaConsumerHighAPI(topic, threads, zookeeper, groupId);

        new Thread(example).start();

        // 执行10秒后结束

        int sleepMillis = 600000;

        try {

            Thread.sleep(sleepMillis);

        } catch (InterruptedException e) {

            e.printStackTrace();

        }

        // 关闭

        example.shutdown();

    }

}

三、运行测试截图

Kafka相关命令可以参考博客[Kafka] - Kafka基本操作命令, 测试截图如下：

至此，开发基本完成

========================================================

四、Kafka Pom文件依赖

<properties>

    <kafka.version>0.8.2.1</kafka.version>

</properties>

<dependencies>

    <dependency>

        <groupId>org.apache.kafka</groupId>

        <artifactId>kafka_2.10</artifactId>

        <version>${kafka.version}</version>

    </dependency>

</dependencies>

[Kafka] - Kafka Java Consumer实现(二)的更多相关文章

[Kafka] - Kafka Java Consumer实现(一)
Kafka提供了两种Consumer API,分别是:High Level Consumer API 和 Lower Level Consumer API(Simple Consumer API) H ...
关于Kafka java consumer管理TCP连接的讨论
本篇是<关于Kafka producer管理TCP连接的讨论>的续篇,主要讨论Kafka java consumer是如何管理TCP连接.实际上,这两篇大部分的内容是相同的,即consum ...
Java进阶专题(二十一) 消息中间件架构体系（3）-- Kafka研究
前言 Kafka 是一款分布式消息发布和订阅系统,具有高性能.高吞吐量的特点而被广泛应用与大数据传输场景.它是由 LinkedIn 公司开发,使用 Scala 语言编写,之后成为 Apache 基金会 ...
Kafka Java consumer动态修改topic订阅
前段时间在Kafka QQ群中有人问及此事——关于Java consumer如何动态修改topic订阅的问题.仔细一想才发现这的确是个好问题,因为如果简单地在另一个线程中直接持有consumer实例然 ...
kafka集群和zookeeper集群的部署，kafka的java代码示例
来自:http://doc.okbase.net/QING____/archive/19447.html 也可参考: http://blog.csdn.net/21aspnet/article/det ...
kafka原理和实践（二）spring-kafka简单实践
系列目录 kafka原理和实践(一)原理:10分钟入门 kafka原理和实践(二)spring-kafka简单实践 kafka原理和实践(三)spring-kafka生产者源码 kafka原理和实践( ...
zookeeper+kafka集群安装之二
zookeeper+kafka集群安装之二此为上一篇文章的续篇, kafka安装需要依赖zookeeper, 本文与上一篇文章都是真正分布式安装配置, 可以直接用于生产环境. zookeeper安装 ...
Kafka设计解析（十三）Kafka消费组(consumer group)
转载自 huxihx,原文链接 Kafka消费组(consumer group) 一直以来都想写一点关于kafka consumer的东西,特别是关于新版consumer的中文资料很少.最近Kafka ...
4 kafka集群部署及kafka生产者java客户端编程 + kafka消费者java客户端编程
本博文的主要内容有 kafka的单机模式部署 kafka的分布式模式部署生产者java客户端编程消费者java客户端编程运行kafka ,需要依赖 zookeeper,你可以使用已有的 zo ...

随机推荐

thymeleaf 学习笔记-基础篇(中文教程)
(一)Thymeleaf 是个什么? 简单说, Thymeleaf 是一个跟 Velocity.FreeMarker 类似的模板引擎,它可以完全替代 JSP .相较与其他的模板引擎,它有如下 ...
CentOS 目录结构详解
linux 目录结构 linux目录树 /: 根目录,一般根目录下只存放目录,不要存放文件,/etc./bin./dev./lib./sbin应该和根目录放置在一个分区中/bin:/usr/bin: ...
CVP沙龙
关于职场: 35岁之后,还去招聘网站投简历? 35岁可能是个分水岭 95后比一些80后还强, 有些80后玻璃心 35岁有的可能已经是VP了应该深入积累而不是蜻蜓点水只有第一年成长了,之后是重复劳动 ...
Air Raid---hdu1151（最小路径覆盖）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1151 最小路径覆盖 == 顶点数 - 最大匹配. #include<stdio.h> #i ...
小米范工具系列之四：小米范HTTP批量发包器
最新版本1.3,下载地址:http://pan.baidu.com/s/1c1NDSVe 文件名httpsender . 此工具使用java 1.8以上版本运行. 小米范HTTP批量发包器的主要功能 ...
DNS中A记录和CNAME记录的区别（转）
A记录是域名到ip的映射,即为ip起别名:CNAME是域名别名到域名的映射,即为域名起别名. 还有一个常用的记录是MX记录,它是与邮件相关的,MX记录记录了发送电子邮件时域名对应的服务器地址. 原文: ...
python 面向对象公有属性
公有属性定义公有属性也叫作类变量静态字段 class role(): # 传参数 # 公有属性都在这里定义 # 在类里直接定义的属性即是公有属性 nationality = 'JP' def ...
POJ3070:Fibonacci(矩阵快速幂模板题）
http://poj.org/problem?id=3070 #include <iostream> #include <string.h> #include <stdl ...
scRNA-seq测序的两种技术[转载]
转自:http://www.ebiotrade.com/newsf/2017-9/201795172237350.htm 1.综述哈佛大学的两个团队将微流体技术引入单细胞RNA-Seq方法中,分别开 ...
<option> 标签的 value 属性
<html> <body> <form action="/example/html/form_action.asp" method="get ...

[Kafka] - Kafka Java Consumer实现(二)

[Kafka] - Kafka Java Consumer实现(二)的更多相关文章

随机推荐

热门专题