kafka 名词解释(四)

　　为什么要了解这些名词的解释呢？因为在学一个新的知识或者领域的时候，我们需要知道它所定义的概念和名词意思，因为只有这样我们才能理解和掌握这个新的知识点，才能更加系统的掌握这个技术。

一.名词解释

　1.broker

Kafka单个节点称为broker，一个Kafka服务就是一个broker，多个broker可以组成一个Kafka集群.

　2.topic (主题)

 topic相当于传统消息系统MQ中的一个队列queue，producer端发送的message必须指定是发送到哪个topic上.在一个大型的应用系统中，
 可以根据功能的不同，区分不同的topic(订单的topic,登录的topic,金额的topic等等)

　3. partition(分区)

一个topic下面可以有多个partition,kafka在接收到message后，会将这个message进行load blance根据(hash(message)%[broker_num])均匀的将这个message分配在不同的partition上。

partition的配置个数一般与kafka的集群数保持一致即可(即broker的数量)

4.partition replica (分区副本)

partition replica 是partition 的副本数据，是为了防止数据丢失的一种优化，partition 不会和 replica 在同一台broker上。
Replica 的数量与partition数量保持一致即可做到高可用

5. Segment（片断）

partition 在物理结构上可以分为多个segment，每个segment 上存放着message信息

6.producer

生产message,发送到topic上

7.consumer

订阅指定的topic，消费topic上面的message信息

8.Consumer group

多个consumer 可以组成一个consumer group

二．名词的作用解释

1.partition

kafka的message是1个key-value对的形式,或者只有topic 和value.当没有key的时候默认是null.大多数情况下都会分配1个key,这个key有2方面信息：

　　1.元数据信息

　　2.帮助partition分区，把这个key当成了路由，同一批数据写进一个partition上

一个message 就是一个producer record(生产记录)对象，必须包含的有topic和value这2个参数，partition和key是可以不存在的

所有的message是同一个key，将会被分配到同一个partition上

当一个key为null的时候，它将会使用默认的partition，这个partition的作用是它会随机的把这个key所对应的producer record 放到其中的1个prtition中 
尽量的使topic上的数据分布均匀，以防止数据倾斜

如果显示的指定了一个key,那么这个partition它会根据这个key的hash值，再根据partition的数量取模，决定message存放到topic上的哪个partition中

下面我们做个测试：当存入的message有key 和无key 时数据发送到partition的位置如何？

当存入的message有key存在时

/**

 *

 * @des        测试kafka partition 分区信息

 * @author  zhao

 * @date    2019年6月27日上午12:17:55

 *

 */

public class PartitionExample {

    private final static  Logger LOG = LoggerFactory.getLogger(PartitionExample.class);

    public static void main(String[] args) throws InterruptedException, ExecutionException {

        Properties properties = initProp();

        KafkaProducer<String, String> producer = new KafkaProducer<String, String>(properties);

        ProducerRecord<String, String> record = new ProducerRecord<String, String>("test_partition","appointKey","hello");   //指定key时

        Future<RecordMetadata> future = producer.send(record);

        RecordMetadata recordMetadata = future.get();

        LOG.info(">>>>>>>>>>>>>>>>>> {}",recordMetadata.partition());

        record = new ProducerRecord<String, String>("test_partition","appointKey","world");

        future = producer.send(record); recordMetadata = future.get();

        LOG.info(">>>>>>>>>>>>>>>>>> {}",recordMetadata.partition());

        producer.flush();

        producer.close();

        System.out.println("====================================");

    }

    private static Properties initProp() {

        Properties prop = new Properties();

        prop.put("bootstrap.servers", "192.168.199.11:9092,192.168.199.12:9092,192.168.199.13:9092");

        prop.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        prop.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        return prop;

    }

}

/从日志中可以看出是随机发送到partition上的

22:21:06.231 [main] INFO com.zpb.kafka.PartitionExample - >>>>>>>>>>>>>>>>>> 1

22:21:06.258 [main] INFO com.zpb.kafka.PartitionExample - >>>>>>>>>>>>>>>>>> 0

当存入的message无key存在时

/**

 *

 * @des        测试kafka partition 分区信息

 * @author  zhao

 * @date    2019年6月27日上午12:17:55

 *

 */

public class PartitionExample {

    private final static  Logger LOG = LoggerFactory.getLogger(PartitionExample.class);

    public static void main(String[] args) throws InterruptedException, ExecutionException {

        Properties properties = initProp();

        KafkaProducer<String, String> producer = new KafkaProducer<String, String>(properties);

        ProducerRecord<String, String> record = new ProducerRecord<String, String>("test_partition", "hello");

        Future<RecordMetadata> future = producer.send(record);

        RecordMetadata recordMetadata = future.get();

        LOG.info(">>>>>>>>>>>>>>>>>> {}",recordMetadata.partition());

        record = new ProducerRecord<String, String>("test_partition","world");

        future = producer.send(record); recordMetadata = future.get();

        LOG.info(">>>>>>>>>>>>>>>>>> {}",recordMetadata.partition());

        producer.flush();

        producer.close();

        System.out.println("====================================");

    }

    private static Properties initProp() {

        Properties prop = new Properties();

        prop.put("bootstrap.servers", "192.168.199.11:9092,192.168.199.12:9092,192.168.199.13:9092");

        prop.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        prop.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        return prop;

    }

}

//从日志中可以看出发送到了同一个partition中

22:29:29.963 [main] INFO com.zpb.kafka.PartitionExample - >>>>>>>>>>>>>>>>>> 2

22:29:29.969 [main] INFO com.zpb.kafka.PartitionExample - >>>>>>>>>>>>>>>>>> 2

通过以上测试得出：

　　当一个key或者一批key映射同一partition时，所有的partition都要计算映射关系，不一定指的是可用的partition,因为在多个partition中，当某个partition挂掉时，

也要参加到计算中，这就意味着，当你写数据时，如果是发送到了这个挂掉的partition上时，会发送失败

在一个conusmer group里面只有一个consumer client 读其中的一个partition，不可能存在多个group里面多个consumer读同一个partition

kafka 名词解释(四)的更多相关文章

kafka 名词解释及原理解析过程(三)
为什么要了解这些名词的解释呢?因为在学一个新的知识或者领域的时候,我们需要知道它所定义的概念和名词意思,因为只有这样我们才能理解和掌握这个新的知识点,才能更加系统的掌握这个技术. 一.名词解释 1.b ...
kafka具体解释四：Kafka的设计思想、理念
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/suifeng3051/article/details/37606001 本节主要从总体角度 ...
Sql常用语法以及名词解释
Sql常用语法以及名词解释 SQL分类: DDL—数据定义语言(CREATE,ALTER,DROP,DECLARE) DML—数据操纵语言(SELECT,DELETE,UPDATE,INSERT) D ...
b2c项目基础架构分析（二）前端框架以及补漏的第一篇名词解释
继续上篇,上篇里忘记了也很重要的前端部分,今天的网站基本上是以一个启示页,然后少量的整页切换,大量的浏览器后台调用web服务局部.动态更新页面显示状态这种方式在运作的,从若干年前简单的ajax流行起来 ...
b2c项目基础架构分析（一）b2c 大型站点方案简述已补充名词解释
我最近一直在找适合将来用于公司大型bs,b2b b2c的基础架构. 实际情况是要建立一个bs架构b2b.b2c的网站,当然还包括wap站点.手机app站点. 一.现有公司技术人员现状: 1.熟悉asp ...
Lucene/ElasticSearch 学习系列 (2) Information Retrival 初步之名词解释
计算机领域一半是理论,一半是在理论基础之上的应用.要想深入地掌握某个方面的应用,就需要先学习那方面的理论. “搜索”是应用,其背后的理论是 "Information Retrieval&qu ...
BI名词解释
BI名词解释浏览数Page Views: 网页(含文件及动态网页)被访客浏览的次数.Page View的计算范围包括了所有格式的网页,例如:.htm..html..asp..cfm. asa ...
【FinacialKnowledge】财务报表及名词解释
1.财务报表以下三张表为:资产负债表.利润表.现金流量表 ...
K8s Deployment YAML 名词解释
Deployment 简述 Deployment 为 Pod 和 ReplicaSet 提供了一个声明式定义 (declarative) 方法,用来替代以前的 ReplicationControlle ...

随机推荐

CF633C Spy Syndrome 2 trie树
这个模型以前绝对见过,模拟赛的时候开始敲了一个AC自动机,纯属脑抽~ code: #include <bits/stdc++.h> #define N 5000006 #define NN ...
学密码学一定得学程序（SDUT 2463）
Problem Description 曾经,ZYJ同学非常喜欢密码学.有一天,他发现了一个很长很长的字符串S1.他很好奇那代表着什么,于是神奇的WL给了他另一个字符串S2.但是很不幸的是,WL忘记跟 ...
MySQL 跨版本主从复制时报错：ERROR 1794 (HY000): Slave is not configured or failed to initialize properly.
背景: zabbix 数据库迁移,搭建主从,主是5.6.25,从是5.7.15,流式备份应用 redo.log 之后,change master 和reset slave 时报出如下错误 mysql& ...
【LeetCode-86】分隔链表
[题目描述] 给定一个链表和一个特定值 x,对链表进行分隔,使得所有小于 x 的节点都在大于或等于 x 的节点之前. 你应当保留两个分区中每个节点的初始相对位置. 示例: 输入: head = 1-& ...
python的openpyxl的使用笔记
openpyxl模块介绍 openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到额外的库,openpyxl是一个比较综合的工具,能够同时读 ...
将String类型的字符串拼接成以逗号分隔的字符输出
package test; import java.util.ArrayList; import java.util.List; public class Tesdssss { private sta ...
iOS开发系列--地图与定位总结
现在很多社交.电商.团购应用都引入了地图和定位功能,似乎地图功能不再是地图应用和导航应用所特有的.的确,有了地图和定位功能确实让我们的生活更加丰富多彩,极大的改变了我们的生活方式.例如你到了一个陌生的 ...
Hadoop环境搭建|第三篇：spark环境搭建
一.环境搭建 1.1.上传spark安装包创建文件夹用于存放spark安装文件命令:mkdir spark 1.2.解压spark安装包命令:tar -zxvf spark-2.1.0-bin-h ...
重读APUE(9)-SIG_ERR、SIG_DFL、SIG_IGN定义无参数
下面这几个函数定义,每次看到都会纠结一阵子,奇怪的是为什么没有参数? #define SIG_ERR (void (*)())-1 #define SIG_DFL (void (*)())0 #def ...
LDA线性分析推广到多分类
感谢皮果提的文章: http://blog.csdn.net/itplus/article/details/12038441 http://blog.csdn.net/itplus/article 皮 ...

kafka 名词解释(四)

一.名词解释

二．名词的作用解释

kafka 名词解释(四)的更多相关文章

随机推荐

热门专题