【消息队列面试】15-17：高性能和高吞吐、pull和push、各种MQ的区别

十五、kafka高性能、高吞吐的原因

1、应用

日志收集（高频率、数据量大）

2、如何保证

（1）磁盘的顺序读写-pagecache关联

rabbitmq基于内存读写，而kafka基于磁盘读写，但却拥有高性能

传统磁盘读写都是随机读写，数据没有存到一起，浪费了寻址时间和旋转时间

如果是顺序读写：无需寻址，一次往后读，同时还有按page预读到内存的机制

容量大，消息堆积能力比内存更强大

（2）零拷贝技术-Linux支持（kafka高性能的原因）

传统方式：用户访问网卡

需要将用户态切换到内核态，由内核线程操作磁盘

使CPU存在上下文切换

此外，读取数据是将文件读到内核缓冲区，并拷贝到用户缓冲区，最后拷贝到内核态的socket缓冲区，将数据发到网卡，响应到客户端（用户态和内核态的两次切换）

零拷贝方式：

磁盘文件--内核缓冲区--网卡接口--消费者进程（不存在CPU的切换，直接在内核态完成消息的读取）

（原因：消息没有必要读到用户，消息只负责传递，无需读到用户缓冲区）【与java应用程序进行数据传递不同】

（3）分区分段+索引

partition可以保证topic的消息堆积，分区可以分散到多个broker，减轻了消息堆积

partition也是逻辑概念，实际存储：多个segment文件存储，针对segment又包含索引文件，提升读取效率，提高了读取数据的并行度（分段加锁）

（4）批量压缩

把多条消息使用gzip压缩，对压缩后的数据进行传输

（5）批量读写

堆积到一定的数量再进行发送，可以节省带宽，并提高效率

（6）直接操作页存

直接操作pagecache（页存），而不是jvm-不需要创建对象等操作

避免了对象创建及GC的耗时，读写速度会更快，进程重启时，数据也不会丢失【堆中的数据会丢失】

pagecache的刷盘时间由操作系统完成，基于内存，效率高

十二、kafka的pull和push各有什么优缺点

1、pull-主动拉取

由消费者根据处理能力，自己控制

按需所取，但不实时

2、push-推送

实时发送消息

缺点：可能会导致消费者压力大，可能会压垮

十三、Kafka、ActiveMQ、RabbitMQ、RocketMQ对比

1、ActiveMQ-半死不活

生产环境中较少，支持的数据量较小

遵循JMS消息中间件的规范，支持事务的ACID特性

支持XA协议（两段式提交，MySQL也支持）

官方维护少，社区不活跃

万级别吞吐量

2、RabbitMQ

基于AMQP协议

使用erlang开发，性能比较好，支持高并发

客户端支持多种语言

社区活跃、文档全面

但erlang语言对java不友好，不利于二次开发

学习成本高、架构复杂

万级别吞吐量，不适用于高并发

3、kafka-高性能、高并发

高可用

生产环境大量使用

ELK使用kafka收集日志

缺陷：单机容量有限，一台broker能放的partition数量有限，64以内最好

社区更新慢，部分代码使用java开发，二次开发有限制

吞吐量百万级别，Apache大数据标配

4、RocketMQ-基于阿里-火箭

性能和吞吐较高，高可用

基于java，利于二次开发

☆高可靠，消息零丢失（适用于互联网金融）

已经被捐赠给阿帕奇，社区活跃度一般

支持语言比较少-java、c++

吞吐量十万级别

【消息队列面试】15-17：高性能和高吞吐、pull和push、各种MQ的区别的更多相关文章

RabbitMQ消息队列（十一）-如何实现高可用
在前面讲到了RabbitMQ高可用集群的搭建,但是我们知道只是集群的高可用并不能保证应用在使用消息队列时完全没有问题,例如如果应用连接的RabbitMQ集群突然宕机了,虽然这个集群时可以使用的,但是应 ...
【消息队列】kafka是如何保证高可用的
一.kafka一个最基本的架构认识由多个broker组成,每个broker就是一个节点:创建一个topic,这个topic可以划分为多个partition,每个partition可以存在于不同的br ...
kafka高吞吐量的分布式发布订阅的消息队列系统
一:kafka介绍kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍BrokerKafka集群 ...
kafka消息队列、环境搭建与使用（.net framework）
一:kafka介绍 kafka(官网地址:http://kafka.apache.org)是一种高吞吐量的分布式发布订阅的消息队列系统,具有高性能和高吞吐率. 1.1 术语介绍 BrokerKafka ...
.NET中 kafka消息队列、环境搭建与使用
前面几篇文章中讲了一些关于消息队列的知识,就每中消息队列中间件,我们并没有做详细的讲解,那么,今天我们就来详细的讲解一下消息队列之一kafka的一些基本的使用与操作. 一.kafka介绍 kafka: ...
高性能、高可用、高扩展ERP系统架构设计
ERP之痛曾几何时,我混迹于电商.珠宝行业4年多,为这两个行业开发过两套大型业务系统(ERP).作为一个ERP系统,系统主要功能模块无非是订单管理.商品管理.生产采购.仓库管理.物流管理.财务管理等 ...
深入剖析 RabbitMQ —— Spring 框架下实现 AMQP 高级消息队列协议
前言消息队列在现今数据量超大,并发量超高的系统中是十分常用的.本文将会对现时最常用到的几款消息队列框架 ActiveMQ.RabbitMQ.Kafka 进行分析对比.详细介绍 RabbitMQ 在 ...
消息队列高手课,带你从源码角度全面解析MQ的设计与实现
消息队列中间件的使用并不复杂,但如果你对消息队列不熟悉,很难构建出健壮.稳定并且高性能的企业级系统,你会面临很多实际问题: 如何选择最适合系统的消息队列产品? 如何保证消息不重复.不丢失? 如果你掌握 ...
[Java] 分布式消息队列（MQ）
概述场景服务解耦削峰填谷异步化缓冲:最终一致性/柔性事务 MQ应用思考点生产端可靠性投递消费端幂等:消息只能消费一次高可用.低延迟.可靠性消息堆积能力可扩展性业界主流MQ Acti ...
rabbitmq学习（九） —— 关于消息队列的选型
转自http://cmsblogs.com/?p=3846 在IM这种讲究高并发.高消息吞吐的互联网场景下,MQ消息中间件是个很重要的基础设施,它在IM系统的服务端架构中担当消息中转.消息削峰.消息交 ...

随机推荐

KVM下virtio驱动虚拟机XML配置文件分析
[root@opennebula qemu]# pwd /etc/libvirt/qemu [root@opennebula qemu]# ls networks one-12.xml one-12. ...
Spring Boot 项目转容器化 K8S 部署实用经验分享
转载自:https://cloud.tencent.com/developer/article/1477003 我们知道 Kubernetes 是 Google 开源的容器集群管理系统,它构建在目前流 ...
9_SpringBoot
一. SpringBoot介绍 1.1. 引言为了使用SSM框架去开发, 准备SSM框架的模板配置为了使Spring整合第三方框架, 单独的去编写xml文件导致SSM项目后期xml文件特别多, ...
HashMap底层原理及jdk1.8源码解读
一.前言写在前面:小编码字收集资料花了一天的时间整理出来,对你有帮助一键三连走一波哈,谢谢啦!! HashMap在我们日常开发中可谓经常遇到,HashMap 源码和底层原理在现在面试中是必问的.所以 ...
使用css制作轮播图
 <!DOCTYPE html> <html lang="en"><head> <meta char ...
OFD是什么
OFD是什么? 原文链接:OFD是什么 OFD更多了解:OFD (Open Fixed layout Document/开放版式文档) OFD格式文件介绍 OFD(Open Fixed layout ...
sql 中HAVING函数
select * from <表名> group by<过滤的数据> having <晒选的列名>=<条件> 例 select * from villa ...
基于纯前端类Excel表格控件实现在线损益表应用
财务报表也称对外会计报表,是会计主体对外提供的反映企业或预算单位一定时期资金.利润状况的会计报表,由资产负债表.损益表.现金流量表或财务状况变动表.附表和附注构成.财务报表是财务报告的主要部分,不包括 ...
Docker | redis集群部署实战
前面已经简单熟悉过redis的下载安装使用,今天接着部署redis集群(cluster),简单体会一下redis集群的高可用特性. 环境准备 Redis是C语言开发,安装Redis需要先将Redis的 ...
jmeter中获取token和cookie
## 登录获取token 1.添加请求 1.1 输入接口中需要携带的参数的值 2.正则表达式提取器提取出值 3.输入token数据 "token":"(.+?)" ...

【消息队列面试】15-17：高性能和高吞吐、pull和push、各种MQ的区别

【消息队列面试】15-17：高性能和高吞吐、pull和push、各种MQ的区别的更多相关文章

随机推荐

热门专题