一.操作系统-Linux

Kafka是JVM系的大数据框架
kafka由Scala语言和Java语言编写而成，编译之后的源代码就是普通的".class"文件

使用Linux

kafka客户端底层使用Java的selector，selector在Linux上的实现机制是epoll，由于在windows上实现是select，因此部署在Linux上有优势，可以获得更高效的I/O性能。
在Linux部署kafka能够享受到零拷贝技术所带来的快速数据传输特性。

二.磁盘-普通机械磁盘

kafka大量使用磁盘，但是使用磁盘是顺序读写操作，一定程序规避机械磁盘的随机读写操作慢。
机械磁盘物美价廉，易损坏等可靠性缺陷，由kafka在软件层面提供机制保证。

三.磁盘容量

需求：

kafka需要将消息保存在底层磁盘上，这些消息默认保存一段时间然后自动被删除。

问题：

假设公司业务每天需要发送一亿条消息，每条消息保存两份以上防止数据丢失，
另外消息默认保存两周时间。假设消息的平均大小是1kB，那么你能计算出kafka集群要预留多少磁盘空间吗？

计算：

每天一亿条1kB大小的消息，且保存两份留存两周
计算一天的空间大小：1亿*1KB*2=200GB
一般情况下Kafka集群除了消息数据还有其他类型的数据，比如索引数据，我们需要预留出百分之10的磁盘空间，因此总的存储容量就是220GB
保存两周，那就是220GB*14，大约为3TB左右
kafka支持的压缩比是0.75，那么最后规划需要的空间是0.75*3-2.25TB

规划磁盘容量考虑以下几个元素：

新增消息数
消息留存时间
消息平均大小
备份数
是否启用压缩

四.带宽

与其说是带宽资源规划，其实是规划所需kafka服务器的数量。

需求：

公司的机场环境是千兆网络即1Gbps，现在有业务，业务目标是1小时处理1TB业务数据，那么需要多少台服务器完成业务：

计算：

带宽是1Gbps，即每秒处理1Gb的数据，假设每台kafka服务器都是安装在专属的机器上，通常环境还是有其他服务，通常kafka只能用到百分70的带宽资源。
实际使用经验，超过70%的阈值就有网络丢包可能性，故70%的设定是一个比较合理的值，也就是单台kafka服务器可能使用700mMb带宽资源。
这只是它能使用的最大带宽资源，你不能让kafka服务器常规性使用这么多资源。通常额外预留2/3的资源，即单台服务器使用带宽700Mb/3=240Mbps。
计算1小时处理1TB数据所需服务器数量。2336/240=10台，额外复制两份，需要30台。

因素	考量点	建议
操作系统	操作系统I/O模型	Linux
磁盘	磁盘I/O性能	机械磁盘
磁盘容量	消息数，留存时间预估	建议预留百分之20-30的磁盘资源
带宽	实际带宽资源预估	对于千兆网络按700Mps计算

文章知识点与官方知识档案匹配，可进一步学习相关知识

云原生入门技能树首页概览13441 人正在系统学习中

[转帖]Kafka 核心技术与实战学习笔记（六）kafka线上集群部署方案的更多相关文章

基于Centos7xELK+Kafka集群部署方案
本次集群部署使用ELK版本统一为6.8.10,kafka为2.12-2.51 均可在官网下载 elasticsearch下载地址:https://www.elastic.co/cn/downloads ...
Elasticsearch核心技术与实战-学习笔记
学习资源: Elasticsearch中文社区日报https://elasticsearch.cn/article/ Elasticsearch 官网 https://www.elastic.co/ ...
官网英文版学习——RabbitMQ学习笔记（十）RabbitMQ集群
在第二节我们进行了RabbitMQ的安装,现在我们就RabbitMQ进行集群的搭建进行学习,参考官网地址是:http://www.rabbitmq.com/clustering.html 首先我们来看 ...
Nginx学习笔记（反向代理&搭建集群）
一.前言 1.1 大型互联网架构演变历程 1.1.1 淘宝技术淘宝的核心技术(国内乃至国际的 Top,这还是2011年的数据) 拥有全国最大的分布式 Hadoop 集群(云梯,2000左右节点,24 ...
Linux实战教学笔记33：lvs+keepalived集群架构服务
一,LVS功能详解 1.1 LVS(Linux Virtual Server)介绍 LVS是Linux Virtual Server 的简写(也叫做IPVS),意即Linux虚拟服务器,是一个虚拟的服 ...
Redis学习笔记（十八）集群（下）
复制和故障转移 Redis集群中的节点分为主节点(master)和从节点(slave),其中主节点用于处理槽,而从节点则用于复制某个主节点,并在被复制的主节点下线时,代替下线主节点继续处理命令请求. ...
python学习笔记六初识面向对象上（基础篇）
python面向对象面向对象编程(Object-Oriented Programming )介绍对于编程语言的初学者来讲,OOP不是一个很容易理解的编程方式,虽然大家都知道OOP的三大特性 ...
Hadoop学习笔记（4）hadoop集群模式安装
具体的过程参见伪分布模式的安装,集群模式的安装和伪分布模式的安装基本一样,只有细微的差别,写在下面: 修改masers和slavers文件: 在hadoop/conf文件夹中的配置文件中有两个文件ma ...
学习笔记（5）——实验室集群LVS监控Web界面配置
症状:通过虚拟IP能访问到监控页面:http://192.168.253.110/ipvsadm.php,但是却无法读出LVS任务分发及集群负载信息. 打开ipvsadm.php页面,源码如下: &l ...
学习笔记（4）——实验室集群管理结点IP配置
经过验证,集群管理结点mgt的IP配置应为如下所示: [root@mgt zmq]# ifconfig//外部网卡 eth0 Link encap:Ethernet HWaddr 5C:F3:FC:E ...

随机推荐

云图说｜图解云消息服务KooMessage
摘要:云消息服务(KooMessage)是提供数字化营销新入口,覆盖全行业.全场景.全终端的一站式富媒体消息服务. 本文分享自华为云社区<[开天aPaaS]图解云消息服务KooMessage&g ...
盘点Python 中字符串的常用操作
摘要:盘点 Python 中字符串的几个常用操作,对新手极度的友好. 本文分享自华为云社区<盘点 Python 中字符串的常用操作,对新手极度友好>,作者:TT-千叶 . 在 Python ...
华为云MVP周峥：气象预报是个技术活，大数据、超算、AI，缺一不可
摘要:在这样一个关乎民生的行业里,人工智能.大数据.超算这些技术,可发挥的潜力也是无限的,华为云MVP周峥就是其中的技术践行者,他正带领着团队为国内气象行业带来一股温柔而不失力量的春风. 本文分享自华 ...
一文读懂配置管理（CM）
配置管理(Configuration Management),是一个用于建立和维护产品性能.功能和物理属性,并与其需求.设计和操作信息在整个生命周期内保持一致的系统工程. 配置管理是 ITIL(Inf ...
对话 BitSail Contributor | 姚泽宇：新生火焰，未来亦可燎原
2022 年 10 月,字节跳动 BitSail 数据引擎正式开源.同期,社区推出 Contributor 激励计划第一期,目前已有 12 位开发者为 BitSail 社区做出贡献,成为了首批 Bit ...
Python 使用pip或easy_install或手动安装库/模块/软件包
pip是easy_install的改进版,提供更好的提示信息,删除package等功能.老版本的python中只有easy_install,没有pip.本文主要介绍使用pip或easy_install ...
Codeforces 144A Arrival of the General （水）
A Ministry for Defense sent a general to inspect the Super Secret Military Squad under the command o ...
Gosper's Hack (生成 n元集合所有 k 元子集
Gosper's Hack是一种生成 n元集合所有 k元子集的算法,它巧妙地利用了位运算 void GospersHack(int k, int n) { int cur = (1 << ...
第九届蓝桥杯（2018）C/C++大学A组省赛题解
第一题:分数 1/1 + 1/2 + 1/4 + 1/8 + 1/16 + - 每项是前一项的一半,如果一共有20项, 求这个和是多少,结果用分数表示出来. 类似:3/2 当然,这只是加了前2项而已. ...
强烈建议收藏，python库大全
Python常用库大全及简要说明本文为大家罗列了Python开发的常用库和各个库的简要说明以及Python开发工具,包管理,环境管理等其它常用资源和Python学习资料.本文只罗列了一部分,完整内容 ...

[转帖]Kafka 核心技术与实战学习笔记（六）kafka线上集群部署方案

一.操作系统-Linux

二.磁盘-普通机械磁盘

三.磁盘容量

需求：

问题：

计算：

四.带宽

需求：

计算：

[转帖]Kafka 核心技术与实战学习笔记（六）kafka线上集群部署方案的更多相关文章

随机推荐

热门专题