Kafaka 总结

Kafka是一个分布式的Streaming处理平台，Kafka可以用于数据库中数据的导入导出，也可以用于实时流的处理，但是Kafka最核心的功能就是作为分布式的消息中间件。

Kafka集群是由多个Broker Server组成的，消息的发送者称为Producer，消息的消费者称为Consumer，topic则是Kafka消息的发送、存储和消费中最核心的抽象，每一个Producer都需要指定将消息发往哪个topic，而Consumer则需要指定消费哪一个topic的数据，所以topic是连接Producer和Consumer的桥梁。

topic可以分成多个分区，这些分区都是分布式的均匀的分布在多个Broker Server上，每一个topic的每一个Partition都可以配置备份冗余存储在多个Broker Server上，这样可以提高数据的高可用性。每一个topic的数据都是按照每一个分区存储在Kafka Broker Server指定的存储文件中的，这个存储的时间默认是7天，过了7天这些数据将会被删除掉，这个7天当然可以配置。

Producer发送消息的时候只需要指定topic即可，那么一个topic可能有多个partition，那么Producer发送的一条数据到底发送到这个topic的哪一个partition中呢，这个就是Producer在发送消息时需要使用Partitioner来为发送的数据进行分区了，按照一定的规则来计算出将要发送的数据需要发往哪个分区，这个Partitioner默认是按照轮询的规则进行分区，当然可以自定义这个规则

Consumer消息消息的时候除了需要指定topic外，还需要指定这个Consumer属于哪一个Consumer Group。每一个Consumer Group消费topic所有的partition的数据，而属于一个Consumer Group的所有的Consumer平均消费同一个topic的所有partition的数据，每一个Consumer消费topic中的partitions数据的时候都是按照offset来消费的，这个offset就是消息在Kafka中topic的位置

Kafka基本术语 - Consumer

一个topic的数据可以被多个Consumer消费：

1、Consumer是根据offset来消费topic中的Record的

2、offset是Consumer控制的，所以Consumer可以按照不同需求消费任何位置的数据，在数据存在的7天内

Consumer Group

每一个Consumer都被归为一个Consumer Group

一个Consumer Group可以包含一个或者多个Consumer

一个topic中的一条Record会被所有订阅了这个topic的Consumer Group消费

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.util.Arrays;

import java.util.Properties;

/**

 * Created by tangweiqun on 2017/12/23.

 */

public class SimpleComsumerGroup1 {

    public static void main(String[] args) {

        Properties props = new Properties();

        props.put("bootstrap.servers", "master:9092");

        props.put("group.id", "group1");

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);

        consumer.subscribe(Arrays.asList("test-group"));

        while (true) {

            ConsumerRecords<String, String> records = consumer.poll(100);

            for (ConsumerRecord<String, String> record : records) {

                System.out.printf("offset = %d, key = %s, value = %s, topic = %s, partition = %d",

                        record.offset(), record.key(), record.value(), record.topic(), record.partition());

                System.out.println();

            }

        }

    }

}

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.util.Arrays;

import java.util.Properties;

/**

 * Created by tangweiqun on 2017/12/23.

 */

public class SimpleComsumerGroup2 {

    public static void main(String[] args) {

        Properties props = new Properties();

        props.put("bootstrap.servers", "master:9092");

        props.put("group.id", "group2");

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);

        consumer.subscribe(Arrays.asList("test-group"));

        while (true) {

            ConsumerRecords<String, String> records = consumer.poll(100);

            for (ConsumerRecord<String, String> record : records) {

                System.out.printf("offset = %d, key = %s, value = %s, topic = %s, partition = %d",

                        record.offset(), record.key(), record.value(), record.topic(), record.partition());

                System.out.println();

            }

        }

    }

}

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

import java.util.Properties;

public class SimpleProducer {

    public static void main(String[] args) {

        Properties props = new Properties();

        props.put("bootstrap.servers", "master:9092");

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        props.put("batch.size", "10");    

        Producer<String, String> producer = new KafkaProducer<>(props);

        for (int i = 0; i < 100; i++) {

            producer.send(new ProducerRecord<String, String>("test-group",

                    Integer.toString(i), Integer.toString(i)));

        }

        producer.close();

    }

}

Kafaka 总结的更多相关文章

centos单机安装zookeeper+kafaka
环境如下: CentOS-7-x86_64zookeeper-3.4.11kafka_2.12-1.1.0 一.zookeeper下载与安装1)下载zookeeper [root@localhost ...
Kafaka高可用集群环境搭建
zk集群环境搭建:https://www.cnblogs.com/toov5/p/9897868.html 三台主机每台的Java版本1.8 下面kafka集群的搭建: 3台虚拟机均进行以下操作: ...
spring cloud 2.x版本 Spring Cloud Stream消息驱动组件基础教程（kafaka篇）
本文采用Spring cloud本文为2.1.8RELEASE,version=Greenwich.SR3 本文基于前两篇文章eureka-server.eureka-client.eureka-ri ...
kafka？kafaka! kafka...
kafka?kafaka! Kafka... kafka是什么? 答:Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.Kafka是一种高吞吐量的分布式发布订阅 ...
windows环境下配置Kafaka
一.安装Zookeeper(Kafaka依赖于zookeeper进行服务注册和管理) 1. 1 下载zookeeper:http://mirror.bit.edu.cn/apache/zookee ...
kafaka quickstart
http://kafka.apache.org/ http://kafka.apache.org/downloads cd /root/kafuka/kafka_2.12-0.11.0.0 nohup ...
kafka 分区和副本以及kafaka 执行流程，以及消息的高可用
1.Kafka概览 Apache下的项目Kafka(卡夫卡)是一个分布式流处理平台,它的流行是因为卡夫卡系统的设计和操作简单,能充分利用磁盘的顺序读写特性.kafka每秒钟能有百万条消息的吞吐量,因此 ...
kafaka可视化工具
许多中间件系统都提供了良好的可视化系统.MySQL有workbench,navcat,php版的mysqladmin等可视化程序.Redis.MongoDB也有开源的可视化程序.只要官方提供了探索数据 ...
kafaka学习
创建一个topic: [root@hdp1 bin]# ./kafka-topics. --replication-factor --partitions --topic justin Created ...
kafaka安装
wget https://mirrors.cnnic.cn/apache/kafka/2.0.0/kafka_2.11-2.0.0.tgz 解压 Tar -xvf kafka_2.11-2.0.0.t ...

随机推荐

linux vi/vim 编辑器学习总结
linux vi/vim 编辑器学习总结很多时候我们开发人员不可避免的会涉及到项目部署,这个时候使用的就不是我们所熟知的 Windows 和 Mac OS 操作系统了,而是类 Unix 系统.项目部 ...
01.在Java中如何创建PDF文件
1.简介在这篇快速文章中,我们将重点介绍基于流行的iText和PdfBox库从头开始创建 PDF 文档. 2. Maven 依赖 <dependency> <groupId> ...
[转帖]NSA武器库知识整理
NSA武器库知识整理 https://www.cnblogs.com/FrostDeng/p/7120812.html 美国国家安全局(NSA)旗下的“方程式黑客组织”(shadow brokers) ...
Python中的高性能容器--collections
集合模块相对于 Python 中内置的称为链表.集合.字典和元组的默认容器类型来说,集合模块( collection module )提供了高性能的备选方案( alternative ). 简单地看 ...
CF891E Lust 生成函数
传送门设在某一次操作之后的\(a\)数组变为了\(a'\)数组,那么\(\prod\limits_{i \neq x} a_i = \prod a_i - \prod a_i'\).那么就不难发现我 ...
VC++如何利用Matlab2014b的图形引擎进行绘图
VC++如何利用Matlab的图形引擎在Visual C++ 2015 工程中使用 Matlab2014b 提供的图形引擎进行绘图的详细过程. 问题来源: 有时候用C++写一些演示程序,有数据可视化 ...
VMware 网络介绍
3.1 网卡介绍如图所示,你的机器有两块网卡,一个是有线,一个是无线. 装完VM之后,会出现两块虚拟网卡,如图 VM有四种连接方式,我们着重介绍前三种 3.2 桥接选择桥接模式,说明V ...
4、线程池（摘自C#高级编程第7版）
1.需求背景创建线程需要时间.如果有不同的小任务完成,就可以事先创建许多线程,在应完成这些任务时发出请求.这个线程数最好在需要更多的线程时增加,在需要释放资源时减少. 2.线程池出场不需要自己 ...
SessionChange
protected override void OnSessionChange(SessionChangeDescription changeDescription) { System.IO.File ...
[Linux学习--用户管理]centos中添加一个新用户，并授权
前言有时候给root用户不太方便,新建一个用于并赋予权限这个做法相对好些创建新用户创建一个用户名为:cmj [root@localhost ~]# adduser cmj 为这个用户初始化密码, ...

Kafaka 总结

Kafka基本术语 - Consumer

Kafaka 总结的更多相关文章

随机推荐

热门专题