Jafka源码分析—

在Kafka中，LogManager负责管理broker上全部的Log（每个topic-partition为一个Log）。

通过阅读源码可知其详细完毕的功能例如以下：

1. 依照预设规则对消息队列进行清理。

2. 依照预设规则对消息队列进行持久化（flush操作）。

3. 连接ZooKeeper进行broker、topic、partition相关的ZooKeeper操作。

4. 管理broker上全部的Log。

以下一一对这些功能的实现进行具体的解析。

一、对于Log的管理

LogManager包括成员变量logs。logs的key是topic，value是Pool<Integer,Log>（该value又是一个Map。主键是partition，value是该partition所相应的Log）。因此LogManager通过logs保存该broker上全部的消息队列。

private final Pool<String, Pool<Integer, Log>> logs = new Pool<String, 	Pool<Integer, Log>>();

LogManager在初始化之后。须要依据配置文件配置的消息队列根文件夹进行遍历。

通过遍历，查找并生成Log。该遍历的详细实如今方法load中：

①　获取消息队列根文件夹下的全部文件

②　对于根文件夹下的每个文件进行例如以下操作

1.假设是文件夹。则有可能是一个Log，否则不是并忽略

2.对于通过1的文件夹分析其文件名称，文件夹的文件名称由两部分组成：topic-partition

3.对于通过2的文件夹。用文件夹、解析出的topic、解析出的partition生成Log

4.将3生成的Log放入logs日志池

5.最后，推断文件夹解析的partition与配置文件里配置的partition的大小，假设配置文件较小。则更新配置

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvenVvY2hhbnhpYW9oZXNoYW5n/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

二、消息队列清理

消息队列的清理由Scheduler周期性的调用，详细的调用在load函数中，基本的删除实如今cleanLogs函数中。

消息队列的清理分为两种情况：一种是超过预设的时间则删除。二是超过预设的大小则删除。分别相应两个函数cleanupExpiredSegments和cleanupSegmentsToMaintainSize。第一种情况比較简单，由于每个segment相应一个文件，通过对照文件的lastModifiedTime和系统的如今时间来确定其是否超时，假设超时则删除。对于另外一种情况，首先比較Log的大小与配置的大小。假设小于配置的大小则不删除。假设大于了配置的大小，则计算超过配置大小的长度（定为差值）；然后将小于该差值的segment删除（这地方有点疑惑。这样删除会不会把一些最新的消息队列给删除了）。

 if (this.scheduler != null) {

 	this.scheduler.scheduleWithRate(new Runnable() {

                public void run() {

                    try {

                        cleanupLogs();

                    } catch (IOException e) {

                        logger.error("cleanup log failed.", e);

                    }

                }

            }, 60 * 1000, logCleanupIntervalMs);

}

三、对于消息队列的持久化

对消息队列的flush操作相同由单独的线程来完毕。该线程通过比較Log上一次的flush时间和当前的系统时间来确定是否须要flush。假设须要则持久化到文件。

注意，消息的队列的持久化在新增消息的时候也会推断，假设一个Log保存的新增消息的条数超过了预设值则进行flush操作。

在Kafka中，LogManager负责管理broker上全部的Log（每个topic-partition为一个Log）。通过阅读源码可知其详细完毕的功能例如以下：

1. 依照预设规则对消息队列进行清理。

2. 依照预设规则对消息队列进行持久化（flush操作）。

3. 连接ZooKeeper进行broker、topic、partition相关的ZooKeeper操作。

4. 管理broker上全部的Log。

以下一一对这些功能的实现进行具体的解析。

一、对于Log的管理

LogManager包括成员变量logs。logs的key是topic，value是Pool<Integer,Log>（该value又是一个Map，主键是partition。value是该partition所相应的Log）。

因此LogManager通过logs保存该broker上全部的消息队列。

private final Pool<String, Pool<Integer, Log>> logs = new Pool<String, 	Pool<Integer, Log>>();

LogManager在初始化之后，须要依据配置文件配置的消息队列根文件夹进行遍历。通过遍历，查找并生成Log。该遍历的详细实如今方法load中：

①　获取消息队列根文件夹下的全部文件

②　对于根文件夹下的每个文件进行例如以下操作

1.假设是文件夹。则有可能是一个Log。否则不是并忽略

2.对于通过1的文件夹分析其文件名称，文件夹的文件名称由两部分组成：topic-partition

3.对于通过2的文件夹。用文件夹、解析出的topic、解析出的partition生成Log

4.将3生成的Log放入logs日志池

5.最后。推断文件夹解析的partition与配置文件里配置的partition的大小，假设配置文件较小，则更新配置

二、消息队列清理

消息队列的清理由Scheduler周期性的调用，详细的调用在load函数中。基本的删除实如今cleanLogs函数中。消息队列的清理分为两种情况：一种是超过预设的时间则删除，二是超过预设的大小则删除，分别相应两个函数cleanupExpiredSegments和cleanupSegmentsToMaintainSize。第一种情况比較简单，由于每个segment相应一个文件，通过对照文件的lastModifiedTime和系统的如今时间来确定其是否超时。假设超时则删除。对于另外一种情况。首先比較Log的大小与配置的大小。假设小于配置的大小则不删除；假设大于了配置的大小，则计算超过配置大小的长度（定为差值）。然后将小于该差值的segment删除（这地方有点疑惑。这样删除会不会把一些最新的消息队列给删除了）。

 if (this.scheduler != null) {

 	this.scheduler.scheduleWithRate(new Runnable() {

                public void run() {

                    try {

                        cleanupLogs();

                    } catch (IOException e) {

                        logger.error("cleanup log failed.", e);

                    }

                }

            }, 60 * 1000, logCleanupIntervalMs);

}

三、对于消息队列的持久化

对消息队列的flush操作相同由单独的线程来完毕。该线程通过比較Log上一次的flush时间和当前的系统时间来确定是否须要flush，假设须要则持久化到文件。注意，消息的队列的持久化在新增消息的时候也会推断，假设一个Log保存的新增消息的条数超过了预设值则进行flush操作。

Jafka源码分析——LogManager的更多相关文章

Jafka源码分析——网络架构
在kafka中.每个broker都是一个server.依照一般理解,server就是一个SocketServer,其不断接收用户的请求并进行处理.在Java中进行网络连接有两种方式一种为堵塞模式一种为 ...
YARN DistributedShell源码分析与修改
YARN DistributedShell源码分析与修改 YARN版本:2.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 1 概述 2 YARN Distrib ...
java 日志体系（四）log4j 源码分析
java 日志体系(四)log4j 源码分析 logback.log4j2.jul 都是在 log4j 的基础上扩展的,其实现的逻辑都差不多,下面以 log4j 为例剖析一下日志框架的基本组件. 一. ...
Shiro源码分析
1.入口类:AbstractAuthenticator 用户输入的登录信息经过其authenticate方法: public final AuthenticationInfo authenticate ...
Tomcat源码分析——启动与停止服务
前言熟悉Tomcat的工程师们,肯定都知道Tomcat是如何启动与停止的.对于startup.sh.startup.bat.shutdown.sh.shutdown.bat等脚本或者批处理命令,大家 ...
Apache Kafka源码分析 – Broker Server
1. Kafka.scala 在Kafka的main入口中startup KafkaServerStartable, 而KafkaServerStartable这是对KafkaServer的封装 1: ...
C# DateTime的11种构造函数 [Abp 源码分析]十五、自动审计记录 .Net 登陆的时候添加验证码使用Topshelf开发Windows服务、记录日志日常杂记——C#验证码 c#_生成图片式验证码 C# 利用SharpZipLib生成压缩包 Sql2012如何将远程服务器数据库及表、表结构、表数据导入本地数据库
C# DateTime的11种构造函数别的也不多说没直接贴代码 using System; using System.Collections.Generic; using System.Glob ...
Tomcat源码分析三：Tomcat启动加载过程（一）的源码解析
Tomcat启动加载过程(一)的源码解析今天,我将分享用源码的方式讲解Tomcat启动的加载过程,关于Tomcat的架构请参阅<Tomcat源码分析二:先看看Tomcat的整体架构>一文 ...
3. SOFAJRaft源码分析— 是如何进行选举的？
开篇在上一篇文章当中,我们讲解了NodeImpl在init方法里面会初始化话的动作,选举也是在这个方法里面进行的,这篇文章来从这个方法里详细讲一下选举的过程. 由于我这里介绍的是如何实现的,所以请大 ...

随机推荐

mysql5大引擎之间的区别和优劣之分
数据库引擎介绍 MySQL数据库引擎取决于MySQL在安装的时候是如何被编译的.要添加一个新的引擎,就必须重新编译MYSQL.在缺省情况下,MYSQL支持三个引擎:ISAM.MYISAM和HEAP.另 ...
vim里面搜索字符串
直接在命令模式/+字符串就能搜索到,查找下一个,按“n”
使用nsight调试caffe
首先你需要下载caffe源码,然后先编译好,注意一定要将Makefile.config里的DEBUG := 1注释掉可以看到注释掉debug后编译会生成的.build_debug目录,调试过程中需要 ...
给SVN控制的项目添加忽略文件/文件夹
忽略目录其实有些像建立一个文件夹,但却不放入版本控制.如果不加入版本控制又会在svn status命令中显示出来,很不方便,所以可以设置本文件夹属性,让它既加入版本控制,又忽略其变化未加入控制的文件 ...
vue -vantUI tab切换时 list组件不触发load事件解决办法
最近由于公司项目需要,用vue写了几个简单的页面.用到了vantUI List 列表瀑布流滚动加载,用于控制长列表的展示当列表即将滚动到底部时,会触发事件并加载更多列表项. (页面加载完成后默认会 ...
对 Spring IoC 的理解
理解 “ 控制反转(IoC)” 控制反转(IoC):用白话来讲,就是由 Spring 容器控制程序中类与类之间的关系,而非传统实现中,由程序代码直接操控.这也就是所谓 “控制反转” 的概念所在:控制权 ...
C#基础学习（二）
---恢复内容开始--- 面向对象 (类是不占内存,实例占内存) C#与python不用可以直接从另一个文件直接实例化一个类,不需要导包: ...
CentOS 7.4 源码编译安装 Redis
一.CentOS 7.4 源码编译安装 Redis 1.下载源码并解压 wget http://download.redis.io/releases/redis-4.0.10.tar.gz tar ...
Python之面向对象封装
Python之面向对象封装封装不是单纯意义的隐藏什么是封装: 将数据放在一个设定好的盒子里,并标出数据可以实现的功能,将功能按钮外露,而隐藏其功能的工作原理,就是封装. 要怎么封装: 你余额宝有多 ...
Python之目录结构
Python之目录结构项目名project_name project_name -|--bin (可执行文件) --|--start.py import os,sys #设置环境变量 BASE_DI ...

Jafka源码分析——LogManager

Jafka源码分析——LogManager的更多相关文章

随机推荐

热门专题