Kafka笔记整理（二）：Kafka Java API使用

下面的测试代码使用的都是下面的topic：

$ kafka-topics.sh --describe hadoop --zookeeper uplooking01:,uplooking02:,uplooking03:

Topic:hadoop    PartitionCount:        ReplicationFactor:     Configs:

        Topic: hadoop   Partition:     Leader:      Replicas: ,,   Isr: ,,

        Topic: hadoop   Partition:     Leader:      Replicas: ,,   Isr: ,,

        Topic: hadoop   Partition:     Leader:      Replicas: ,,   Isr: ,,

Kafka Java API之producer

关于producer API的使用说明，可以查看org.apache.kafka.clients.producer.KafkaProducer这个类的代码注释，有非常详细的说明，下面就直接给出程序代码及测试。

程序代码

KafkaProducerOps.java

package com.uplooking.bigdata.kafka.producer;

import com.uplooking.bigdata.kafka.constants.Constants;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

import java.io.IOException;

import java.io.InputStream;

import java.util.Properties;

import java.util.Random;

/**

 * 通过这个KafkaProducerOps向Kafka topic中生产相关的数据

 * <p>

 * Producer

 */

public class KafkaProducerOps {

    public static void main(String[] args) throws IOException {

        /**

         * 专门加载配置文件

         * 配置文件的格式：

         * key=value

         *

         * 在代码中要尽量减少硬编码

         *  不要将代码写死，要可配置化

         */

        Properties properties = new Properties();

        InputStream in = KafkaProducerOps.class.getClassLoader().getResourceAsStream("producer.properties");

        properties.load(in);

        /**

         * 两个泛型参数

         * 第一个泛型参数：指的就是kafka中一条记录key的类型

         * 第二个泛型参数：指的就是kafka中一条记录value的类型

         */

        String[] girls = new String[]{"姚慧莹", "刘向前", "周  新", "杨柳"};

        Producer<String, String> producer = new KafkaProducer<String, String>(properties);

        String topic = properties.getProperty(Constants.KAFKA_PRODUCER_TOPIC);

        String key = "";

        String value = "今天的姑娘们很美";

        ProducerRecord<String, String> producerRecord =

                new ProducerRecord<String, String>(topic, key, value);

        producer.send(producerRecord);

        producer.close();

    }

}

Constants.java

package com.uplooking.bigdata.kafka.constants;

public interface Constants {

    /**

     * 生产的key对应的常量

     */

    String KAFKA_PRODUCER_TOPIC = "producer.topic";

}

producer.properties

############################# Producer Basics #############################

# list of brokers used for bootstrapping knowledge about the rest of the cluster

# format: host1:port1,host2:port2 ...

bootstrap.servers=uplooking01:,uplooking02:,uplooking03:

# specify the compression codec for all data generated: none, gzip, snappy, lz4

compression.type=none

# name of the partitioner class for partitioning events; default partition spreads data randomly

# partitioner.class=

# the maximum amount of time the client will wait for the response of a request

#request.timeout.ms=

# how long `KafkaProducer.send` and `KafkaProducer.partitionsFor` will block for

#max.block.ms=

# the producer will wait for up to the given delay to allow other records to be sent so that the sends can be batched together

#linger.ms=

# the maximum size of a request in bytes

#max.request.size=

# the default batch size in bytes when batching multiple records sent to a partition

#batch.size=

# the total bytes of memory the producer can use to buffer records waiting to be sent to the server

#buffer.memory=

#####设置自定义的topic

producer.topic=hadoop

key.serializer=org.apache.kafka.common.serialization.StringSerializer

value.serializer=org.apache.kafka.common.serialization.StringSerializer

其实这个配置文件就是kafka conf目录下的配置文件，只是这里要做相应的修改，关于每个字段的含义，可以查看

org.apache.kafka.clients.producer.KafkaProducer

这个类的代码注释。

测试

在终端中启动消费者监听topic的消息：

[uplooking@uplooking02 ~]$ kafka-console-consumer.sh --topic hadoop --zookeeper uplooking01:

然后执行生产者程序，再查看终端输出：

[uplooking@uplooking02 ~]$ kafka-console-consumer.sh --topic hadoop --zookeeper uplooking01:

今天的姑娘们很美

Kafka Java API之consumer

程序代码

KafkaConsumerOps.java

package com.uplooking.bigdata.kafka.consumer;

import org.apache.kafka.clients.consumer.Consumer;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.io.IOException;

import java.io.InputStream;

import java.util.Arrays;

import java.util.Collection;

import java.util.Properties;

public class KafkaConsumerOps {

    public static void main(String[] args) throws IOException {

        Properties properties = new Properties();

        InputStream in = KafkaConsumerOps.class.getClassLoader().getResourceAsStream("consumer.properties");

        properties.load(in);

        Consumer<String, String> consumer = new KafkaConsumer<String, String>(properties);

        Collection<String> topics = Arrays.asList("hadoop");

        // 消费者订阅topic

        consumer.subscribe(topics);

        ConsumerRecords<String, String> consumerRecords = null;

        while (true) {

            // 接下来就要从topic中拉取数据

            consumerRecords = consumer.poll();

            // 遍历每一条记录

            for (ConsumerRecord consumerRecord : consumerRecords) {

                long offset = consumerRecord.offset();

                int partition = consumerRecord.partition();

                Object key = consumerRecord.key();

                Object value = consumerRecord.value();

                System.out.format("%d\t%d\t%s\t%s\n", offset, partition, key, value);

            }

        }

    }

}

consumer.properties

# Zookeeper connection string

# comma separated host:port pairs, each corresponding to a zk

# server. e.g. "127.0.0.1:3000,127.0.0.1:3001,127.0.0.1:3002"

zookeeper.connect= uplooking01:,uplooking02:,uplooking03:

bootstrap.servers=uplooking01:,uplooking02:,uplooking03:

# timeout in ms for connecting to zookeeper

zookeeper.connection.timeout.ms=

#consumer group id

group.id=test-consumer-group

#consumer timeout

#consumer.timeout.ms=

key.deserializer=org.apache.kafka.common.serialization.StringDeserializer

value.deserializer=org.apache.kafka.common.serialization.StringDeserializer

测试

先执行消费者的代码，然后再执行生产者的代码，在消费者终端可以看到如下输出：

         今天的姑娘们很美

（分别是：offset partition key value）

Kafka Java API之partition

可以通过自定义partitioner来决定我们的消息应该存到哪个partition上，只需要在我们的代码上实现Partitioner接口即可。

程序代码

MyKafkaPartitioner.java

package com.uplooking.bigdata.kafka.partitioner;

import org.apache.kafka.clients.producer.Partitioner;

import org.apache.kafka.common.Cluster;

import java.util.Map;

import java.util.Random;

/**

 * 创建自定义的分区，根据数据的key来进行划分

 * <p>

 * 可以根据key或者value的hashCode

 * 还可以根据自己业务上的定义将数据分散在不同的分区中

 * 需求：

 * 根据用户输入的key的hashCode值和partition个数求模

 */

public class MyKafkaPartitioner implements Partitioner {

    public void configure(Map<String, ?> configs) {

    }

    /**

     * 根据给定的数据设置相关的分区

     *

     * @param topic      主题名称

     * @param key        key

     * @param keyBytes   序列化之后的key

     * @param value      value

     * @param valueBytes 序列化之后的value

     * @param cluster    当前集群的元数据信息

     */

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        Integer partitionNums = cluster.partitionCountForTopic(topic);

        int targetPartition = -;

        if (key == null || keyBytes == null) {

            targetPartition = new Random().nextInt() % partitionNums;

        } else {

            int hashCode = key.hashCode();

            targetPartition = hashCode % partitionNums;

            System.out.println("key: " + key + ", value: " + value + ", hashCode: " + hashCode + ", partition: " + targetPartition);

        }

        return targetPartition;

    }

    public void close() {

    }

}

KafkaProducerOps.java

package com.uplooking.bigdata.kafka.producer;

import com.uplooking.bigdata.kafka.constants.Constants;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

import java.io.IOException;

import java.io.InputStream;

import java.util.Properties;

import java.util.Random;

/**

 * 通过这个KafkaProducerOps向Kafka topic中生产相关的数据

 * <p>

 * Producer

 */

public class KafkaProducerOps {

    public static void main(String[] args) throws IOException {

        /**

         * 专门加载配置文件

         * 配置文件的格式：

         * key=value

         *

         * 在代码中要尽量减少硬编码

         *  不要将代码写死，要可配置化

         */

        Properties properties = new Properties();

        InputStream in = KafkaProducerOps.class.getClassLoader().getResourceAsStream("producer.properties");

        properties.load(in);

        /**

         * 两个泛型参数

         * 第一个泛型参数：指的就是kafka中一条记录key的类型

         * 第二个泛型参数：指的就是kafka中一条记录value的类型

         */

        String[] girls = new String[]{"姚慧莹", "刘向前", "周  新", "杨柳"};

        Producer<String, String> producer = new KafkaProducer<String, String>(properties);

        Random random = new Random();

        int start = ;

        for (int i = start; i <= start + ; i++) {

            String topic = properties.getProperty(Constants.KAFKA_PRODUCER_TOPIC);

            String key = i + "";

            String value = "今天的<--" + girls[random.nextInt(girls.length)] + "-->很美很美哦~";

            ProducerRecord<String, String> producerRecord =

                    new ProducerRecord<String, String>(topic, key, value);

            producer.send(producerRecord);

        }

        producer.close();

    }

}

继续使用前面的消费者的代码，同时需要在producer.properties中指定我们定义的partitioner，如下：

partitioner.class=com.uplooking.bigdata.kafka.partitioner.MyKafkaPartitioner

测试

先执行消费者代码，然后再执行生产者代码，查看终端输出。

生产者终端输出（主要是自定义partitioner中的输出）：

key: , value: 今天的<--刘向前-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--杨柳-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--姚慧莹-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--周  新-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--刘向前-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--周  新-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--周  新-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--刘向前-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--杨柳-->很美很美哦~, hashCode: , partition:

key: , value: 今天的<--姚慧莹-->很美很美哦~, hashCode: , partition:

消费者终端输出：

         今天的<--姚慧莹-->很美很美哦~

         今天的<--周  新-->很美很美哦~

         今天的<--杨柳-->很美很美哦~

         今天的<--杨柳-->很美很美哦~

         今天的<--刘向前-->很美很美哦~

         今天的<--刘向前-->很美很美哦~

         今天的<--刘向前-->很美很美哦~

         今天的<--周  新-->很美很美哦~

         今天的<--周  新-->很美很美哦~

        今天的<--姚慧莹-->很美很美哦~

（分别是：offset partition key value）

Kafka笔记整理（二）：Kafka Java API使用的更多相关文章

Kafka笔记整理（三）：消费形式验证与性能测试
Kafka消费形式验证前面的<Kafka笔记整理(一)>中有提到消费者的消费形式,说明如下: .每个consumer属于一个consumer group,可以指定组id.group.id ...
Kafka笔记整理（一）
Kafka简介消息队列(Message Queue) 消息 Message 网络中的两台计算机或者两个通讯设备之间传递的数据.例如说:文本.音乐.视频等内容. 队列 Queue 一种特殊的线性表(数 ...
Kafka学习之二 Kafka安装和使用
部署环境Linux(Centos 6.5),JDK 1.8.0,zookeeper-3.4.12,kafka_2.11-2.0.0. 1. 单机环境官方建议使用JDK 1.8版本,因此本文使 ...
ZooKeeper（二）Java API使用
ZooKeeper官网提供了Java和C的API. 本文使用Java API来实现ZooKeeper的基本操作. 前言下图中的Replicated Database是包含完整数据树(entire d ...
HBase 相关API操练(二)：Java API
一.HBase Java编程 (1)HBase是用Java语言编写的,它支持Java编程: (2)HBase支持CRUD操作:Create,Read,Update和Delete: (3)Java AP ...
《Java并发编程的艺术》读书笔记：二、Java并发机制的底层实现原理
二.Java并发机制底层实现原理这里是我的<Java并发编程的艺术>读书笔记的第二篇,对前文有兴趣的朋友可以去这里看第一篇:一.并发编程的目的与挑战有兴趣讨论的朋友可以给我留言! 1. ...
HBase总结（十二）Java API 与HBase交互实例
HBase提供了Java Api的訪问接口,掌握这个就跟Java应用使用RDBMS时须要JDBC一样重要 import java.io.IOException; import org.apache.h ...
笔记：MyBatis 使用 Java API配置
我们已经讨论了各种MyBatis配置元素,如envronments.typeAlias和typeHandlers,以及如何使用XML配置它们.即使你想使用基于JavaAPI的MyBatis配置,MyB ...
Zookeeper学习笔记——2 Shell和Java API的使用
ZooKeeper的使用一般都接触不到,因为平时工作甚少直接使用ZK.但是通过手动操作一下ZK,还是能对其中的门道了解各一二. shell 常用命令 help 查看所有支持的命令 [zk: local ...

随机推荐

[JS] 页面回车键提交表单-常用于登录页面
//判断是否按下了回车键 var EnterSubmit = function(evt){ evt= window.event || evt; if (evt.keyCode == 13){ //若按 ...
ubuntu14.04中安装jdk
1. 下载JDK http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 将下载的 .g ...
EJB类库存在于Java的哪个版本中？(选择1项)。
A. J2SE B. J2EE C. J2ME D. J2NE 解答:B
c++开发之对应Linux下的sem_t和lock
http://www.cnblogs.com/P_Chou/archive/2012/07/13/semaphore-and-mutex-in-thread-sync.html http://blog ...
CI -- $this->load->library()详解
我第一次加载失败,原来是文件名和类名不同的原因,先总结关于CI加载你自己的类文件注意事项: 1.第三方加载文件应放在application/libraries文件下 2.文件名和类名应该相同,并且首字 ...
PHP导入导出excel表格图片的代码和方法大全
基本上导出的文件分为两种: 1:类Excel格式,这个其实不是传统意义上的Excel文件,只是因为Excel的兼容能力强,能够正确打开而已.修改这种文件后再保存,通常会提示你是否要转换成Excel文件 ...
使用jquery操作session方法分享
摘要: 今天分享的是使用jquery来处理session.我们将使用sessionStorage对象,它类似与localStorage对象,只是sessionStorage是用来储存session数据 ...
Docker 如何把镜像上传到docker hub
1 首先你得准备一个hub 的帐号, 去 https://hub.docker.com 注册吧! 2 在hub那里新建一个仓库, 这个就类似于github那边的..create ---> cre ...
Laravel5.1 表单验证
当我们提交表单时通常会对提交过来的数据进行一些验证.Laravel在Controller类中使用了一个traint:ValidatesRequest.方便我们在控制器中使用验证器. 下面我们就来看一 ...
java对象和json数据转换实现方式3-使用jackson实现
測试代码: package com.yanek.util.json; import java.io.IOException; import java.io.StringWriter; import j ...

Kafka笔记整理（二）：Kafka Java API使用

Kafka Java API之producer

程序代码

KafkaProducerOps.java

Constants.java

producer.properties

测试

Kafka Java API之consumer

程序代码

KafkaConsumerOps.java

consumer.properties

测试

Kafka Java API之partition

程序代码

MyKafkaPartitioner.java

KafkaProducerOps.java

测试

Kafka笔记整理（二）：Kafka Java API使用的更多相关文章

随机推荐

热门专题