Kafka的性能分析

都说Kafka的吞吐量很大，但是我一直不直到Kafka为何有如此大的吞吐量。最近在看Kafka权威指南，陆陆续续得到了如下结论：

1、分区：Kafka支持分区，这样就支持多个生产者和多个消费者同时请求，每个分区在不同的物理节点上，提高了整个broker集群的吞吐；

2、不支持针对每一条记录做持久化（rabbitMq支持）：Kafka的持久化策略是针对segment的，通过log.segment.bytes这个配置项来控制消息的持久化，比如该参数设置为100M，那么当这个segment达到100M时做一次持久化，这样减少了磁盘的I/O。那么不禁要问，要是当segment达到90M时该broker挂掉了咋办，数据不会丢失么？Kafka是通过对分区设置多副本来保证可靠性的。

3、第三点和第二点类似，都是对大文件进行分段带来的好处：查找和删除大文件是很费时的，所以Kafka把分区分成了若干个片段。这样便于索引和删除。

4、零复制技术：其他DB在发送给消费者数据时会把数据从磁盘拷贝到内核空间的缓存页中，应用程序将缓存页中的数据读入用户空间，做解压和再压缩处理后，又回写到socket发送缓冲区，然后发送给消费者。而Kafka则将producer发送来的数据按照原有的格式存到磁盘上，然后只是将磁盘数据原封不动的拷贝到内核缓存页，然后将数据从页面缓存直接发送到网络中，避免了重复复制。

5、支持生产者使用压缩功能，可以包装消息，支持batch操作。这就意味着网络传输和磁盘存储方面会获得更好的压缩性能。

书还没有看完，暂时总结了这三点，后面有新的发现会再更新本文。

Kafka的性能分析的更多相关文章

硬核测试：Pulsar 与 Kafka 在金融场景下的性能分析
背景 Apache Pulsar 是下一代分布式消息流平台,采用计算存储分层架构,具备多租户.高一致.高性能.百万 topic.数据平滑迁移等诸多优势.越来越多的企业正在使用 Pulsar 或者尝试将 ...
使用 Spark 进行微服务的实时性能分析
[编者按]当开发者从微服务架构获得敏捷时,观测整个系统的运行情况成为最大的痛点.在本文,IBM Research 展示了如何用 Spark 对微服务性能进行分析和统计,由 OneAPM 工程师编译整理 ...
Kafka工作流程分析
Kafka工作流程分析生产过程分析写入方式 producer采用推(push)模式将消息发布到broker,每条消息都被追加(append)到分区(patition)中,属于顺序写磁盘(顺序写磁盘 ...
Kafka源码分析(三) - Server端 - 消息存储
系列文章目录 https://zhuanlan.zhihu.com/p/367683572 目录系列文章目录一. 业务模型 1.1 概念梳理 1.2 文件分析 1.2.1 数据目录 1.2.2 . ...
如何进行python性能分析？
在分析python代码性能瓶颈,但又不想修改源代码的时候,ipython shell以及第三方库提供了很多扩展工具,可以不用在代码里面加上统计性能的装饰器,也能很方便直观的分析代码性能.下面以我自己实 ...
SQL Server-聚焦IN VS EXISTS VS JOIN性能分析（十九）
前言本节我们开始讲讲这一系列性能比较的终极篇IN VS EXISTS VS JOIN的性能分析,前面系列有人一直在说场景不够,这里我们结合查询索引列.非索引列.查询小表.查询大表来综合分析,简短的内 ...
SQL Server-聚焦NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL性能分析（十八）
前言本节我们来综合比较NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL的性能,简短的内容,深入的理解,Always to review the basics. ...
SQL Server-聚焦LEFT JOIN...IS NULL AND NOT EXISTS性能分析（十七）
前言本节我们来分析LEFT JOIN和NOT EXISTS,简短的内容,深入的理解,Always to review the basics. LEFT JOIN...IS NULL和NOT EXIS ...
SQL Server-聚焦EXISTS AND IN性能分析（十六）
前言前面我们学习了NOT EXISTS和NOT IN的比较,当然少不了EXISTS和IN的比较,所以本节我们来学习EXISTS和IN的比较,简短的内容,深入的理解,Always to review ...

随机推荐

Node.js使用ftp连接远程ftp服务器枚举和下载文件示例
示例代码: var Ftp = require('ftp'); var fs = require('fs'); var path = require('path'); // 首先判断参数中是否包含{d ...
ubuntu18.04安装chromium浏览器
sudo add-apt-repository ppa:a-v-shkop/chromium sudo apt-get upate sudo apt-get install chromium-brow ...
【c# 学习笔记】密封类
密封类不可以被另外一个类继承,如果强行在代码中继承一个密封类,编译时就会产生错误. c#使用sealed关键字来定义密封类,如下: //定义密封类 public sealed class Sealed ...
根据start和limit从已有的数据列表中获取从start开始的limit个数据
代码记录(需求:根据start和limit从已有的数据列表中获取从start开始的limit个数据) 已有的数据列表:这个数据列表是经过处理的,可能是在SQL查询时无法处理的如多条件排序,而排序条件需 ...
Jenkins简单入门：下载-安装-配置-构建
Jenkins简单配置流程官网下载地址:https://jenkins.io/index.html 1.下载安装Jenkins (1)点击Download Jenkins进入下载页 (2)根据自己运 ...
Tengine编译安装+lua+sticky模块
一.两个依赖包有yum的直接 yum yum –y install openssl openssl-devel prce prce-devel zlib zlib-devel 没有yum环境的, ...
重新渲染layui的radio
修改后添加这一段 layui.use('form', function() { var form = layui.form; form.render(); }); 也可以用官方的方法:https:// ...
Redis 集群_主从复制_哨兵模型
1 redis集群简介 1.1 集群的概念所谓的集群,就是通过添加服务器的数量,提供相同的服务,从而让服务器达到一个稳定.高效的状态. 1.1.1 使用redis集群的必要性问题:我们已经部署好了 ...
JSON文件转为Excel
前言今天在帮老师做年终党统的时候,发现管理平台上没有将正在发展的同志的信息导出功能,只能一个一个点击进去查看,操作起来步骤很多很麻烦,所以我就想到了"扒"一下这个网页,扒下来发现 ...
python-django-天天生鲜项目
1 需求分析 github源码:https://www.github.com/wangyingchuang/dailyfresh 1.1 用户模块 1) 注册页 l 注册时校验用户名是否已被注册. ...

Kafka的性能分析

Kafka的性能分析的更多相关文章

随机推荐

热门专题