【消息队列面试】15-17:高性能和高吞吐、pull和push、各种MQ的区别
十五、kafka高性能、高吞吐的原因
1、应用
日志收集(高频率、数据量大)
2、如何保证
(1)磁盘的顺序读写-pagecache关联
rabbitmq基于内存读写,而kafka基于磁盘读写,但却拥有高性能
传统磁盘读写都是随机读写,数据没有存到一起,浪费了寻址时间和旋转时间
如果是顺序读写:无需寻址 ,一次往后读,同时还有按page预读到内存的机制
容量大,消息堆积能力比内存更强大
(2)零拷贝技术-Linux支持(kafka高性能的原因)
传统方式:用户访问网卡
需要将用户态切换到内核态,由内核线程操作磁盘
使CPU存在上下文切换
此外,读取数据是将文件读到内核缓冲区,并拷贝到用户缓冲区,最后拷贝到内核态的socket缓冲区,将数据发到网卡,响应到客户端(用户态和内核态的两次切换)
零拷贝方式:
磁盘文件--内核缓冲区--网卡接口--消费者进程(不存在CPU的切换,直接在内核态完成消息的读取)
(原因:消息没有必要读到用户,消息只负责传递,无需读到用户缓冲区)【与java应用程序进行数据传递不同】
(3)分区分段+索引
partition可以保证topic的消息堆积,分区可以分散到多个broker,减轻了消息堆积
partition也是逻辑概念,实际存储:多个segment文件存储,针对segment又包含索引文件,提升读取效率,提高了读取数据的并行度(分段加锁)
(4)批量压缩
把多条消息使用gzip压缩,对压缩后的数据进行传输
(5)批量读写
堆积到一定的数量再进行发送,可以节省带宽,并提高效率
(6)直接操作页存
直接操作pagecache(页存),而不是jvm-不需要创建对象等操作
避免了对象创建及GC的耗时,读写速度会更快,进程重启时,数据也不会丢失【堆中的数据会丢失】
pagecache的刷盘时间由操作系统完成,基于内存,效率高
十二、kafka的pull和push各有什么优缺点
1、pull-主动拉取
由消费者根据处理能力,自己控制
按需所取,但不实时
2、push-推送
实时发送消息
缺点:可能会导致消费者压力大,可能会压垮
十三、Kafka、ActiveMQ、RabbitMQ、RocketMQ对比

1、ActiveMQ-半死不活
生产环境中较少,支持的数据量较小
遵循JMS消息中间件的规范,支持事务的ACID特性
支持XA协议(两段式提交,MySQL也支持)
官方维护少,社区不活跃
万级别吞吐量
2、RabbitMQ
基于AMQP协议
使用erlang开发,性能比较好,支持高并发
客户端支持多种语言
社区活跃、文档全面
但erlang语言对java不友好,不利于二次开发
学习成本高、架构复杂
万级别吞吐量,不适用于高并发
3、kafka-高性能、高并发
高可用
生产环境大量使用
ELK使用kafka收集日志
缺陷:单机容量有限,一台broker能放的partition数量有限,64以内最好
社区更新慢,部分代码使用java开发,二次开发有限制
吞吐量百万级别,Apache大数据标配
4、RocketMQ-基于阿里-火箭
性能和吞吐较高,高可用
基于java,利于二次开发
☆高可靠,消息零丢失(适用于互联网金融)
已经被捐赠给阿帕奇,社区活跃度一般
支持语言比较少-java、c++
吞吐量十万级别
【消息队列面试】15-17:高性能和高吞吐、pull和push、各种MQ的区别的更多相关文章
- RabbitMQ消息队列(十一)-如何实现高可用
在前面讲到了RabbitMQ高可用集群的搭建,但是我们知道只是集群的高可用并不能保证应用在使用消息队列时完全没有问题,例如如果应用连接的RabbitMQ集群突然宕机了,虽然这个集群时可以使用的,但是应 ...
- 【消息队列】kafka是如何保证高可用的
一.kafka一个最基本的架构认识 由多个broker组成,每个broker就是一个节点:创建一个topic,这个topic可以划分为多个partition,每个partition可以存在于不同的br ...
- kafka高吞吐量的分布式发布订阅的消息队列系统
一:kafka介绍kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍BrokerKafka集群 ...
- kafka消息队列、环境搭建与使用(.net framework)
一:kafka介绍 kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍 BrokerKafka ...
- .NET中 kafka消息队列、环境搭建与使用
前面几篇文章中讲了一些关于消息队列的知识,就每中消息队列中间件,我们并没有做详细的讲解,那么,今天我们就来详细的讲解一下消息队列之一kafka的一些基本的使用与操作. 一.kafka介绍 kafka: ...
- 高性能、高可用、高扩展ERP系统架构设计
ERP之痛 曾几何时,我混迹于电商.珠宝行业4年多,为这两个行业开发过两套大型业务系统(ERP).作为一个ERP系统,系统主要功能模块无非是订单管理.商品管理.生产采购.仓库管理.物流管理.财务管理等 ...
- 深入剖析 RabbitMQ —— Spring 框架下实现 AMQP 高级消息队列协议
前言 消息队列在现今数据量超大,并发量超高的系统中是十分常用的.本文将会对现时最常用到的几款消息队列框架 ActiveMQ.RabbitMQ.Kafka 进行分析对比.详细介绍 RabbitMQ 在 ...
- 消息队列高手课,带你从源码角度全面解析MQ的设计与实现
消息队列中间件的使用并不复杂,但如果你对消息队列不熟悉,很难构建出健壮.稳定并且高性能的企业级系统,你会面临很多实际问题: 如何选择最适合系统的消息队列产品? 如何保证消息不重复.不丢失? 如果你掌握 ...
- [Java] 分布式消息队列(MQ)
概述 场景 服务解耦 削峰填谷 异步化缓冲:最终一致性/柔性事务 MQ应用思考点 生产端可靠性投递 消费端幂等:消息只能消费一次 高可用.低延迟.可靠性 消息堆积能力 可扩展性 业界主流MQ Acti ...
- rabbitmq学习(九) —— 关于消息队列的选型
转自http://cmsblogs.com/?p=3846 在IM这种讲究高并发.高消息吞吐的互联网场景下,MQ消息中间件是个很重要的基础设施,它在IM系统的服务端架构中担当消息中转.消息削峰.消息交 ...
随机推荐
- 前端必读3.0:如何在 Angular 中使用SpreadJS实现导入和导出 Excel 文件
在之前的文章中,我们为大家分别详细介绍了在JavaScript.React中使用SpreadJS导入和导出Excel文件的方法,作为带给广大前端开发者的"三部曲",本文我们将为大家 ...
- Solutions:Elastic SIEM - 适用于家庭和企业的安全防护 ( 三)
- 第一章:模型层 - 5:模型的元数据Meta
模型的元数据,指的是"除了字段外的所有内容",例如排序方式.数据库表名.人类可读的单数或者复数名等等.所有的这些都是非必须的,甚至元数据本身对模型也是非必须的.但是,我要说但是,有 ...
- js对象结构赋值const {XXX } =this
样例1: const { xxx } = this.state; 上面的写法是es6的写法,其实就相当于: const xxx = this.state.xxx 样例2: const {comment ...
- mapboxgl加载tiff
缘起 近期在项目中遇到这么一个需求,需要在地图上展示一组格网数据,格网大小为2m*2m,地图api用的mapboxgl.起初拿到这个需要感觉很easy,在地图上添加一个fill图层就好啦.把格网面数据 ...
- 为什么数字化转型离不开 MES 系统?
确切的说应该是制造业企业的数字化转型离不开MES系统,原因很简单,制造业企业的核心工作是生产制造,做数字化转型就是对生产制造各个环节进行数字化改造,提质增效降成本,而MES系统是制造执行系统,是生产制 ...
- C#-9 委托
一 什么是委托 可以认为委托是持有一个或多个方法的对象.可以执行委托,执行时委托会执行它所持有的方法. 从C++的角度理解,委托可以看成一个类型安全.面向对象的C++函数指针. delegate vo ...
- k8s 中的 service 如何找到绑定的 Pod 以及如何实现 Pod 负载均衡
k8s 中的 service 如何找到绑定的 Pod 以及如何实现 Pod 负载均衡 前言 endpoint kube-proxy userspace 模式 iptables ipvs kernels ...
- Go素数筛选分析
Go素数筛选分析 1. 素数筛选介绍 学习Go语言的过程中,遇到素数筛选的问题.这是一个经典的并发编程问题,是某大佬的代码,短短几行代码就实现了素数筛选.但是自己看完原理和代码后一脸懵逼(仅此几行能实 ...
- 39.BasicAuthentication认证
BasicAuthentication认证介绍 BasicAuthentication使用HTTP基本的认证机制 通过用户名/密码的方式验证,通常用于测试工作,尽量不要线上使用 用户名和密码必须在HT ...