Kafka 源代码分析之ByteBufferMessageSet

这里分析一下message的封装类ByteBufferMessageSet类

ByteBufferMessageSet类的源代码在源代码目录message目录下.这个类主要封装了message,messageset,messageandoffset等类的对象.在Log类中读写log的时候基本上都是以这个类的对象为基本操作对象的.

下面看看类的具体代码.首先是初始化部分.

class ByteBufferMessageSet(val buffer: ByteBuffer) extends MessageSet with Logging { //这里作为入口传入ByteBuffer类型的buffer

  private var shallowValidByteCount = -1  //设定了全局的验证字节统计变量.

  //这里是几个不同的构造函数.但是都是以最初的构造函数为基础的.这里调用了BBMS对象的create方法创建新buffer.

  def this(compressionCodec: CompressionCodec, messages: Message*) {    //参数是压缩标志和message

    this(ByteBufferMessageSet.create(new AtomicLong(0), compressionCodec, messages:_*))

  }

  //同上.只是参数不同而已.

  def this(compressionCodec: CompressionCodec, offsetCounter: AtomicLong, messages: Message*) {

    this(ByteBufferMessageSet.create(offsetCounter, compressionCodec, messages:_*))

  }

 //最简单的消息构造函数.

  def this(messages: Message*) {

    this(NoCompressionCodec, new AtomicLong(0), messages: _*)

  }

　　上面是几个不同的构造函数部分.构造函数应用到的ByteBufferMessageSet.create函数代码如下.

object ByteBufferMessageSet {

  //创建函数的参数是offset,压缩,message.返回的是bytebuffer类型.

  private def create(offsetCounter: AtomicLong, compressionCodec: CompressionCodec, messages: Message*): ByteBuffer = {

    if(messages.size == 0) {  //消息为空的话就返回一个空的buffer

      MessageSet.Empty.buffer

    } else if(compressionCodec == NoCompressionCodec) {  //没有压缩的话.就分配一个新的messages大小的buffer.

      val buffer = ByteBuffer.allocate(MessageSet.messageSetSize(messages))

      for(message <- messages)

        writeMessage(buffer, message, offsetCounter.getAndIncrement) //在这里将消息内容写入buffer中.

      buffer.rewind() //将指针设置到开始位置.

      buffer //返回buffer

    } else { //这里则是启用压缩的处理动作了.

      val byteArrayStream = new ByteArrayOutputStream(MessageSet.messageSetSize(messages)) //获取一个messages大小的字节流对象

      val output = new DataOutputStream(CompressionFactory(compressionCodec, byteArrayStream)) //创建写入对象.

      var offset = -1L

      try {

        for(message <- messages) { //将消息压缩写入字节流对象中去.

          offset = offsetCounter.getAndIncrement

          output.writeLong(offset)

          output.writeInt(message.size)

          output.write(message.buffer.array, message.buffer.arrayOffset, message.buffer.limit)

        }

      } finally {

        output.close()

      }

      val bytes = byteArrayStream.toByteArray //转成字节

      val message = new Message(bytes, compressionCodec) //创建一个压缩的消息对象.

      val buffer = ByteBuffer.allocate(message.size + MessageSet.LogOverhead) /分配一个buffer

      writeMessage(buffer, message, offset) //将压缩过的message写入到buffer.

      buffer.rewind()

      buffer

    }

  }

  def decompress(message: Message): ByteBufferMessageSet = {

    val outputStream: ByteArrayOutputStream = new ByteArrayOutputStream

    val inputStream: InputStream = new ByteBufferBackedInputStream(message.payload)

    val intermediateBuffer = new Array[Byte](1024)

    val compressed = CompressionFactory(message.compressionCodec, inputStream)

    try {

      Stream.continually(compressed.read(intermediateBuffer)).takeWhile(_ > 0).foreach { dataRead =>

        outputStream.write(intermediateBuffer, 0, dataRead)

      }

    } finally {

      compressed.close()

    }

    val outputBuffer = ByteBuffer.allocate(outputStream.size)

    outputBuffer.put(outputStream.toByteArray)

    outputBuffer.rewind

    new ByteBufferMessageSet(outputBuffer)

  }

    //将message写入buffer

  private[kafka] def writeMessage(buffer: ByteBuffer, message: Message, offset: Long) {

    buffer.putLong(offset) //先写入offset 之后是size,最后是消息本身.

    buffer.putInt(message.size)

    buffer.put(message.buffer)

    message.buffer.rewind()

  }

}

　　上面就是关于初始化部分做的工作.下面看看具体的函数.这个函数是作为核心函数.messages映射成对应的messageandoffset就在这里实现.被外部调用的好几个函数也都是依赖这个函数实现.

override def iterator: Iterator[MessageAndOffset] = internalIterator()

  /** iterator over compressed messages without decompressing */

  def shallowIterator: Iterator[MessageAndOffset] = internalIterator(true)

  /** When flag isShallow is set to be true, we do a shallow iteration: just traverse the first level of messages. **/

  private def internalIterator(isShallow: Boolean = false): Iterator[MessageAndOffset] = { //可以看见返回的是一个迭代对象,对象类想是messageandoffset

    new IteratorTemplate[MessageAndOffset] {  //这是一个抽象类.在这个地方返回了一个匿名类的实例.

      var topIter = buffer.slice()  //复制一份buffer

      var innerIter: Iterator[MessageAndOffset] = null

      def innerDone():Boolean = (innerIter == null || !innerIter.hasNext)

      def makeNextOuter: MessageAndOffset = { //这里主要把没个message映射成messageandoffset

        // if there isn't at least an offset and size, we are done

        if (topIter.remaining < 12)

          return allDone()

        val offset = topIter.getLong()

        val size = topIter.getInt()

        if(size < Message.MinHeaderSize)

          throw new InvalidMessageException("Message found with corrupt size (" + size + ")")

        // we have an incomplete message

        if(topIter.remaining < size)

          return allDone()

          //上面这些主要是检查啥的.不细说了.主要映射在下面完成.

        // read the current message and check correctness

        val message = topIter.slice()

        message.limit(size) //通过size截取第一个message

        topIter.position(topIter.position + size) //将指针往前移.

        val newMessage = new Message(message) //构建新message

        if(isShallow) {

          new MessageAndOffset(newMessage, offset) //做映射返回.

        } else { //剩下是判断是否有压缩的情况.

          newMessage.compressionCodec match {

            case NoCompressionCodec =>

              innerIter = null

              new MessageAndOffset(newMessage, offset)

            case _ =>

              innerIter = ByteBufferMessageSet.decompress(newMessage).internalIterator() //有压缩用对象里的方法处理.

              if(!innerIter.hasNext)

                innerIter = null

              makeNext()

          }

        }

      }

     //在这个函数里调用映射函数.最后这个函数有next函数调用.

      override def makeNext(): MessageAndOffset = {

        if(isShallow){

          makeNextOuter

        } else {

          if(innerDone())

            makeNextOuter

          else

            innerIter.next

        }

      }

    }

  }

　　以上就是一个核心函数的处理过程.看看对应的抽象类IteratorTemplate的定义.

abstract class IteratorTemplate[T] extends Iterator[T] with java.util.Iterator[T] {

  private var state: State = NOT_READY

  private var nextItem = null.asInstanceOf[T]

  def next(): T = {

    if(!hasNext())

      throw new NoSuchElementException()

    state = NOT_READY

    if(nextItem == null)

      throw new IllegalStateException("Expected item but none found.")

    nextItem

  }

  def peek(): T = {

    if(!hasNext())

      throw new NoSuchElementException()

    nextItem

  }

  def hasNext(): Boolean = {

    if(state == FAILED)

      throw new IllegalStateException("Iterator is in failed state")

    state match {

      case DONE => false

      case READY => true

      case _ => maybeComputeNext()

    }

  }

  protected def makeNext(): T

  def maybeComputeNext(): Boolean = {

    state = FAILED

    nextItem = makeNext()

    if(state == DONE) {

      false

    } else {

      state = READY

      true

    }

  }

  protected def allDone(): T = {

    state = DONE

    null.asInstanceOf[T]

  }

  def remove =

    throw new UnsupportedOperationException("Removal not supported")

  protected def resetState() {

    state = NOT_READY

  }

}

　　定义很简单直白.

这个类主要封装了message和messageandoffset的操作对象.在Log,LogSegment中被用来操作消息实例.

Kafka 源代码分析之ByteBufferMessageSet的更多相关文章

Kafka 源代码分析之LogManager
这里分析kafka 0.8.2的LogManager logmanager是kafka用来管理log文件的子系统.源代码文件在log目录下. 这里会逐步分析logmanager的源代码.首先看clas ...
Kafka 源代码分析.
这里记录kafka源代码笔记.(代码版本是0.8.2.1) kafka的源代码如何下载.这里简单说一下. git clone https://git-wip-us.apache.org/repos/a ...
Kafka 源代码分析之FileMessageSet
这里主要分析FileMessageSet类这个类主要是管理log消息的内存对象和文件对象的类.源代码文件在log目录下.这个类被LogSegment类代理调用用来管理分片. 下面是完整代码.代码比较 ...
Kafka 源代码分析之LogSegment
这里分析kafka LogSegment源代码通过一步步分析LogManager,Log源代码之后就会发现,最终的log操作都在LogSegment上实现.LogSegment负责分片的读写恢复刷新 ...
Kafka 源代码分析之Log
这里分析Log对象本身的源代码. Log类是一个topic分区的基础类.一个topic分区的所有基本管理动作.都在这个对象里完成.类源代码文件为Log.scala.在源代码log目录下. Log类是L ...
kafka 源代码分析之Message（v0.10）
这里主要更新一下kafka 0.10.0版本的message消息格式的变化. message 的格式在0.10.0的版本里发生了一些变化(相对于0.8.2.1的版本)这里把0.10.0的message ...
Kafka 源代码分析之Message
这里主要分析一下message的格式. 一条message的构成由以下部分组成 val CrcOffset = 0 //crc校验部分和字长 val CrcLength = 4 val MagicOf ...
Kafka 源代码分析之MessageSet
这里分析MessageSet类 MessageSet是一个抽象类,定义了一条log的一些接口和常量,FileMessageSet就是MessageSet类的实现类.一条日志中存储的log完整格式如下 ...
Kafka 源代码分析之log框架介绍
这里主要介绍log管理,读写相关的类的调用关系的介绍. 在围绕log的实际处理上.有很多层的封装和调用.这里主要介绍一下调用结构和顺序. 首先从LogManager开始. 调用关系简单如下:LogMa ...

随机推荐

Linux五种IO模型性能分析
1. 概念理解在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式: 同步: 所谓同步,就是在发出一个功能调用时, ...
java web 导出Excel 的工具类公用实现
平时我们在开发后端管理的系统时,经常会出现导出Excel的功能.这个功能很简单,但是呢,我一般就会使用公用的工具类,在一个Util中,暴露公用导出的接口,只需要传入需要导出的数据(一般使用list集合 ...
基于ssh，shell，python，iptables，fabric，supervisor和模板文件的多服务器配置管理
前言:略新服务器:NS 主服务器:OS 一:OS上新建模板目录例如 mkdir bright 用于导入一些不方便在远程修改的配置文件.redis.conf等,到需要配置的步骤时用远程cp命令覆 ...
数组的重排序方法reverse()和sort()
js数组中存在两个可以直接用来重排序的方法:reverse()和sort(). reverse()方法比较简单,直接反转数组项的顺序: var arr = [1, 3, 2, 4, 5]; arr.r ...
Day3-函数及作用域
一.函数定义:一组代码片段用函数名封装起来,通过函数名的方式调用执行. 特性: 1.减少重复代码 2.使程序易扩展 3.使程序易维护语法定义: def sayhi(): print("he ...
AtomicInteger的使用
JDK API 1.7相关介绍可以用原子方式更新的 int 值.有关原子变量属性的描述,请参阅 java.util.concurrent.atomic 包规范.AtomicInteger 可用在应用 ...
C# Ajax 返回json数据--前后台交互
本人实习生一枚,遇到这个问题,网上找的试了试基本可以,自己搞了一下.可以供新手参考,大神如有指点,请不吝赐教. 版权声明:本文为博主原创文章,未经博主允许不得转载. 前台JavaScript代码: & ...
Python-快速排序
算法思想:快速排序运用了分而治之的思想,即在所选数组中选择一个基准(任选一个都可以),以改基准为基础,将小于该基准的元素都移动基准的左边,大于该基准的数据都移动到右边,然后对左右两边进行递归处理.同样 ...
leetcode算法题（JavaScript实现）
题外话刷了一段时间的codewars的JavaScript题目之后,它给我最大的感受就是,会帮助你迅速的提升你希望练习的语言的API的熟悉程度,Array对象.String对象等原生方法,构造函数. ...
ActionContext、ServletContext、pageContext的区别？
ActionContext是当前的Action的上下文环境,通过ActionContext可以获取到request.session.ServletContext等与Action有关的对象的引用: Se ...

Kafka 源代码分析之ByteBufferMessageSet

这里分析一下message的封装类ByteBufferMessageSet类

Kafka 源代码分析之ByteBufferMessageSet的更多相关文章

随机推荐

热门专题