Kafka Need No Keeper

最近在鹅厂工作中不断接触到Kafka，虽然以前也使用过，但是对其架构和发展过程总是模模糊糊，所以在回学校准备末考的时候找些资料总结一下。

Kafka Need No Keeper 是一个在Kafka Submit分享的标题，我也是看了Kafka needs no Keeper（关于KIP-500的讨论）这篇博客分享后才对Kafka有了初期的认识，如果想要了解细节的话可以直接阅读该博客分享，本篇博客是一次对Kafka的自我总结，多少有些大白话和概括之意。

Kafka架构

Kafka是什么？Apache Kafka 是一款分布式流处理框架（新版本后，定位发生了改变），用于实时构建流处理应用。

Kafka的架构可以简单分为Client和Broker两部分。在Kafka发展过程中，Kafka都是不断减少这两部分对Zookeeper的依赖。

那为什么要减少对Zookeeper的依赖呢？

Kafka在新版本后定位变成了分布式流处理框架，但是本质上还是一个消息中间件，中间件与中间件之间不应该存在依赖关系，需要降低耦合。
Kafka与Zookeeper不断通信，不断写入数据，而Zookeeper一致性要求较高，当某个数据节点信息发生变更时，会通知其他节点同步更新，半数以上完成更新才能返回，写入性能较差，影响了Kafka的性能。

Client架构

Client一般分为三类，Consumer Client、Producer Client和Admin Tool。

旧版架构

Producer Client 只需要向Kafka集群中发送消息，不需要连接Zookeeper
Consumer Client 需要读取某主题某分区内的消息，那么需要知道读取哪条消息（读取offset）和下一次读哪条消息（提交offset）,所以需要和Zookeeper交互（offset保存在ZK中）
Admin Tool 执行主题的操作，因为元数据保存在ZK中，所以需要与ZK交互

可以看出，Zookeeper在Kafka中①存储元数据

新版架构

新版主要针对旧版中的Consumer Client和Admin Tool改进

Offset改进：在Kafka中新建一个内部主题_consumer_offset用来保存消费者组的offset，提交和获取offset都可以直接与Kafka集群交互获取。
Rebalance改进：在旧版架构中，消费者组中的消费者消费的主题分区信息都是保存在ZK中，在新版架构改进中，每一个消费组使用一个Coordinator来控制重分区过程。
Admin改进：社区引入了新的运维工具AdminClient以及相应的CreateTopics、DeleteTopics、AlterConfigs等RPC协议，替换了原先的Admin Tool，这样创建和删除主题这样的运维操作也完全移动Kafka这一端来做。

Question	Answer
重分区是什么？	如上图，重分区就是将消费者组里订阅主题下的分区重新分配给当前组内消费者实例的过程。
重分区发生条件是什么？	①消费者组消费者数量改变； ②订阅的主题数量改变； ③订阅的主题下分区数量改变。
怎么进行重分区？	真正的重分区是有Group Leader来完成的。第一个进入Consumer Group的消费者实例为leader，它向Coordinator申请消费者组成员列表，然后按照分区策略进行分区，接着将分区的结果告诉Coordinator，最后由Coordinator告知所有的消费者分区信息。
Coordinator是怎么找到的	消费者组向任意一个Broker发送groupCoordinatorRequest请求，集群返回一个负载最小的Broker节点使其成为当前消费者组的Coordinator。
分区策略是什么？	①Range分区（默认）：分块分区，对于每一个主题而言，首先将分区按数字顺序排行序，消费者按名称的字典序排序，然后用分区总数除以消费者总数。如果能够除尽，平均分配；若除不尽，则位于排序前面的消费者将多负责一个分区。 ②RoundRobin分区：轮询分区，对所有主题而言，首先将所有主题的分区组成列表，然后按照列表重新轮询分配分区给不同的消费者。

Broker架构

现阶段架构

在现阶段结构中，Broker端是严重依赖Zookeeper的，基本上所有元数据信息和管理都要通过Zookeeper集群，如下图：

可以看出，Zookeeper在Kafka中有②集群管理和③选举Controller的作用

发展中的架构

第一步首先是隔离非Controller端对ZK的依赖；

第二步是移除Controller端对ZK的依赖，这一步可以采用基于Raft的共识算法来做(?)。

Kafka同步副本管理

基本概念

概念	简介
LEO	Log End Offset。日志末端位移值或末端偏移量，表示日志下一条待插入消息的位移值。
LSO	Log Stable Offset。这是 Kafka 事务的概念。如果你没有使用到事务，那么这个值无意义。该值控制了事务型消费者能够看到的消息范围。它经常与 Log Start Offset，即日志起始位移值相混淆，因为有些人将后者缩写成 LSO，这是不对的。在 Kafka 中，LSO就是指代 Log Stable Offset。
HW	高水位值(High watermark)。这是控制消费者可读取消息范围的重要字段。一个普通消费者只能“看到”Leader 副本上介于 Log Start Offset 和 HW(不含)之间的所有消息。水位以上的消息是对消费者不可见的。
AR	Assigned Replicas。AR 是主题被创建后，分区创建时被分配的副本集合，副本个数由副本因子决定。
ISR	In-Sync Replicas。Kafka 中特别重要的概念，指代的是 AR 中那些与 Leader 保持同步的副本集合。在 AR 中的副本可能不在 ISR 中，但 Leader 副本天然就包含在 ISR 中。

Kafka文件大小对应关系：

ISR

Leader 与 Follower

ISR中的Leader是由Controller指定，与Leader保持同步用指标来衡量就是follower中LEO落后leader中LEO的时间不超过指定时间范围（replica.lag.time.max.ms=10s）。

（在旧版本中还有另外一个指标是落后的LEO条数，不过这样子的话每次发送大量数据后，一开始ISR就只有leader，到后面follower跟上的才能加入ISR，这样子会导致ZK的频繁写入修改性能下降）

另外在Leader挂掉后，Controller会让ISR中的一个Follower成为Leader，并且开始同步新的Leader的Offset。这里要注意的是有可能此时ISR中并没有Follower，所以有两种选择，①允许OSR的Follower成为Leader和②该分区没有Leader。这来源于设置unclean.leader.election.enable，设置为true为选择①，保证了系统的高可用性和损失了一致性，设置为false为选择②，保证系统的一致性和损失高可用性。

同时一个Leader和多个Follower看上是读写分离的结构，但是Kafka并不支持读写分离。原因由两点，①场景不合适，读写分离适用于读负载很大，而写操作不频繁的场景，显然Kafka不是；②同步机制，Follower和Leader之间存在不一致的窗口，很可能出现消息滞后（类似于幻读）

ACK机制

这主要决定了Producer发送信息时，Kafka的接受机制，有三种：

ACK	机制
ack = 0	at most once，最多一次语义，Producer不需要等待Broker回发确认消息，直接发送下一批消息。
ack = 1	at least onve，最少一次语义，Producer只要Leader成功消息并且返回确认后，就可以发送下一批消息
ack = -1	Producer需要等到Leader和ISR中的Follower同步完成并且返回确认后，才能发送下一批消息

那么问题就来，怎么实现Exactly Once呢？

Kafka Exactly Once 和事务机制

这里讨论的Exactly Once主要是针对Producer端，至于消费者的Exactly Once可以在客户端上保留偏移量来实现（参见flink事务机制）。

单Session情况

先来讨论单Session的情况，在Kafka中给每个Producer都分配了一个内部的唯一的PID，每次Producer发送信息时，带有的主键是<PID ,Topic,Partition,SequenceNumber>，Leader端收到信息后对相同的<PID,Topic,Partition>的SequenceNumber进行比较，如果来的信息比Leader端的小，证明数据重复，丢弃该条信息；如果来的信息比Leader端的大1，插入该信息；吐过来的信息比Leader端的大超过1，证明发生了乱序丢弃该信息。

跨Session情况

具体内容参考这篇博客

简单理解

在单Session的情况如果存在PID都可以保证Exactly Once，那么要是在不同的Session中我能拿到相同的PID就可以了。所以引入了一个TID（自己定义的）并且绑定了事务一开始的PID，只要事务没有提交，那么每次都拿着这个TID去获取对应的PID就可以保证Exactly Once了。

具体做法

内部引入了一个Transaction Coordinator用于分配PID和管理事务，并且在内置了一个主题Transaction Log用于记录事务信息，事务的操作简图如下：

步骤	具体内容
1.请求/返回Transaction Coordinator	由于Transaction Coordinator是分配PID和管理事务的核心，因此Producer要做的第一件事情就是通过向任意一个Broker发送FindCoordinator请求找到Transaction Coordinator的位置。
2.TID->PID	找到Transaction Coordinator后，具有幂等特性的Producer必须发起InitPidRequest请求以获取PID。
3 Producer生产消息	①Producer拿到PID后向Kafka主题发送消息 ②Transaction Coordinator会将该<Transaction, Topic, Partition>存于Transaction Log内，并将其状态置为BEGIN
4 事务完成	①将PREPARE_COMMIT或PREPARE_ABORT消息写入Transaction Log。 ②以Transaction Marker的形式将COMMIT或ABORT信息写入用户数据日志以及_consumer_log中。 ③最后将COMPLETE_COMMIT或COMPLETE_ABORT信息写入Transaction Log中。

与两阶段提交的区别

Kafka事务机制中，PREPARE时即要指明是PREPARE_COMMIT还是PREPARE_ABORT，并且只须在Transaction Log中标记即可，无须其它组件参与。而两阶段提交的PREPARE需要发送给所有的分布式事务参与方，并且事务参与方需要尽可能准备好，并根据准备情况返回Prepared或Non-Prepared状态给事务管理器。
Kafka事务中，一但发起PREPARE_COMMIT或PREPARE_ABORT，则确定该事务最终的结果应该是被COMMIT或ABORT。而分布式事务中，PREPARE后由各事务参与方返回状态，只有所有参与方均返回Prepared状态才会真正执行COMMIT，否则执行ROLLBACK
Kafka事务机制中，某几个Partition在COMMIT或ABORT过程中变为不可用，只影响该Partition不影响其它Partition。两阶段提交中，若唯一收到COMMIT命令参与者Crash，其它事务参与方无法判断事务状态从而使得整个事务阻塞
Kafka事务机制引入事务超时机制，有效避免了挂起的事务影响其它事务的问题
Kafka事务机制中存在多个Transaction Coordinator实例，而分布式事务中只有一个事务管理器

人生此处，绝对乐观

Kafka 总结学习的更多相关文章

kafka基本原理学习
下载安装地址:http://kafka.apache.org/downloads.html 原文链接:http://www.jasongj.com/2015/01/02/Kafka深度解析 Kafk ...
Kafka入门学习（一）
====常用开源分布式消息系统 *集群:多台机器组成的系统叫集群. *ActiveMQ还是支持JMS的一种消息中间件. *阿里巴巴metaq,rocketmq都有kafka的影子. *kafka的动态 ...
Kafka入门学习随记（二）
====Kafka消费者模型参考博客:http://www.tuicool.com/articles/fI7J3m --分区消费模型分区消费架构图图中kafka集群有两台服务器(Server), ...
Kafka入门学习--基础
Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式.支持分区的(partition).多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就可 ...
kafka初步学习
消息系统什么是消息系统? 消息系统负责将数据从一个应用程序传输到另一个应用程序,因此应用程序可以专注于数据,但不担心如何共享它.分布式消息传递给予可靠消息队列的概念.消息在客户端应用程序和消息传递系 ...
Kafka自我学习-报错篇
1. kafka启动出现:Unsupported major.minor version 52.0 错误, 具体的错误输出: Exception in thread "main" ...
Kafka自我学习3-Scalable
1.After created the zookeeper cluster, we found all broker cluster topic can be find in zoo1, zoo2, ...
Kafka自我学习2-Zookeeper cluster
Test enviroment : zoo1, zoo2, zoo3 cluster 1. Install zookeeper, package in kafka [root@zoo1 ~]# pwd ...
Kafka自我学习1-Multi-broker cluster
====================================Testing environment =========================================== ...
大数据kafka视频教程学习记录【B站尚硅谷】
视频地址: https://www.bilibili.com/video/av35354301/?p=1 2019/03/06 21:59 消息队列的内部实现: Kafka基础: ...

随机推荐

web自动化框架—BasePage 类的简单封装
优秀的框架都有属于自己的思想,在搭建web自动化测试框架时,我们通常都遵循 PO(Page Object)思想. 简单理解就是我们会把每个页面看成一个对象,一切皆对象,面向对象编码,这样会让我们更好的 ...
计算机网络参考模型，IP地址及MAC地址查看方法，数据包封装过程
分层思想首先,计算机网络参考模型,是基于分层思想而出现的.分层思想,就是将复杂流程分解为几个功能单一的子过程. 优点: 可以让整个流程更加清晰, 让复杂问题简单化, 更容易发现问题,并真对性的解决问 ...
Java开发人员最容易出现的几类错误
一.把数组转成ArrayList List<String> list = Arrays.asList(arr); //以下带伪代码来自Arrays类中public static <T ...
traefik：基础入门总结
traefik介绍 traefik-现代反向代理,也可称为现代边缘路由:traefik原声兼容主流集群,Kubernetes,Docker,AWS等.官方的定位traefik是一个让开发人员将时间花费 ...
python-dict和list常用方法
1 # *********-list-********* 2 # 创建一个list 3 list1 = [1, 2, '力气,', 'afd'] 4 print(type(list1)) 5 prin ...
cent7 配 yum源
今天笔记配置CentOS 7本地镜像为yum源,废话不多说,上去就是干! 1:挂镜像: ? 1 2 3 4 #创建目标挂载目录 mkdir /media/CentOS7 #将镜像挂载到目标目录 mou ...
76-Java安装Eclipse并创建第一个HelloWorld.md
76-Java安装Eclipse并创建第一个HelloWorld.md 首先确定已经安装Java系统环境,若未安装,请参考博客Java环境windows搭建访问Eclipse官网下载完成直接发送快 ...
Redis 主从架构搭建
引言准备搭建的是主从架构( Master/Slave )中的一主两从模式:其中 Master 为 Redis 的主服务器,主要负责写操作,两个 Slave 为 Redis 的从服务器,主要负责读操作 ...
Deploying Portainer CE in Docker
Portainer是一个轻量级的管理UI,它允许你轻松地管理你的Docker和Kubernetes集群 https://documentation.portainer.io/v2.0/deploy/c ...
数据流分析软件SQLFlow的工作原理
SQLFlow是一个可视化的在线处理SQL对象依赖关系的工具,只需要上传你的SQL脚本,它可以自动分析SQL里的数据对象,包括database.schema.table.view.column.pro ...

Kafka 总结学习