kafka问题总结

kafka如何保证数据可靠性和数据一致性

Kafka Rebalance机制分析

Kafka的用途有哪些?使用场景如何?

Kafka中的ISR、AR又代表什么?ISR的伸缩又指什么

Kafka中的HW、LEO、LSO、LW等分别代表什么?

Kafka中是怎么体现消息顺序性的?

Kafka中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?

Kafka生产者客户端的整体结构是什么样子的?

Kafka生产者客户端中使用了几个线程来处理?分别是什么?

Kafka的旧版Scala的消费者客户端的设计有什么缺陷?

“消费组中的消费者个数如果超过topic的分区,那么就会有消费者消费不到数据”这句话是否正确?如果正确,那有没有什么hack的手段?

消费者提交消费位移时提交的是当前消费到的最新消息的offset还是offset+1?

有哪些情形会造成重复消费?

那些情景下会造成消息漏消费?

KafkaConsumer是非线程安全的,那么怎么样实现多线程消费?

简述消费者与消费组之间的关系

当你使用kafka-topics.sh创建(删除)了一个topic之后,Kafka背后会执行什么逻辑?

topic的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?

topic的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?

创建topic时如何选择合适的分区数?

Kafka目前有那些内部topic,它们都有什么特征?各自的作用又是什么?

优先副本是什么?它有什么特殊的作用?

Kafka有哪几处地方有分区分配的概念?简述大致的过程及原理

简述Kafka的日志目录结构

Kafka中有那些索引文件?

如果我指定了一个offset,Kafka怎么查找到对应的消息?

如果我指定了一个timestamp,Kafka怎么查找到对应的消息?

聊一聊你对Kafka的Log Retention的理解

聊一聊你对Kafka的Log Compaction的理解

聊一聊你对Kafka底层存储的理解(页缓存、内核层、块层、设备层)

聊一聊Kafka的延时操作的原理

聊一聊Kafka控制器的作用

消费再均衡的原理是什么?(提示:消费者协调器和消费组协调器)

Kafka中的幂等是怎么实现的

Kafka中的事务是怎么实现的(这题我去面试6加被问4次,照着答案念也要念十几分钟,面试官简直凑不要脸

Kafka中有那些地方需要选举?这些地方的选举策略又有哪些?

失效副本是指什么?有那些应对措施?

多副本下,各个副本中的HW和LEO的演变过程

为什么Kafka不支持读写分离?

Kafka在可靠性方面做了哪些改进?(HW, LeaderEpoch)

Kafka中怎么实现死信队列和重试队列?

Kafka中的延迟队列怎么实现(这题被问的比事务那题还要多!!!听说你会Kafka,那你说说延迟队列怎么实现?)

Kafka中怎么做消息审计?

Kafka中怎么做消息轨迹?

Kafka中有那些配置参数比较有意思?聊一聊你的看法

Kafka中有那些命名比较有意思?聊一聊你的看法

Kafka有哪些指标需要着重关注?

怎么计算Lag?(注意read_uncommitted和read_committed状态下的不同)

Kafka的那些设计让它有如此高的性能?

Kafka有什么优缺点?

还用过什么同质类的其它产品,与Kafka相比有什么优缺点?

为什么选择Kafka?

在使用Kafka的过程中遇到过什么困难?怎么解决的?

怎么样才能确保Kafka极大程度上的可靠性?

聊一聊你对Kafka生态的理解

Kafka问题总结的更多相关文章

  1. Spark踩坑记——Spark Streaming+Kafka

    [TOC] 前言 在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了spark strea ...

  2. 消息队列 Kafka 的基本知识及 .NET Core 客户端

    前言 最新项目中要用到消息队列来做消息的传输,之所以选着 Kafka 是因为要配合其他 java 项目中,所以就对 Kafka 了解了一下,也算是做个笔记吧. 本篇不谈论 Kafka 和其他的一些消息 ...

  3. kafka学习笔记:知识点整理

    一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...

  4. .net windows Kafka 安装与使用入门(入门笔记)

    完整解决方案请参考: Setting Up and Running Apache Kafka on Windows OS   在环境搭建过程中遇到两个问题,在这里先列出来,以方便查询: 1. \Jav ...

  5. kafka配置与使用实例

    kafka作为消息队列,在与netty.多线程配合使用时,可以达到高效的消息队列

  6. kafka源码分析之一server启动分析

    0. 关键概念 关键概念 Concepts Function Topic 用于划分Message的逻辑概念,一个Topic可以分布在多个Broker上. Partition 是Kafka中横向扩展和一 ...

  7. Kafka副本管理—— 为何去掉replica.lag.max.messages参数

    今天查看Kafka 0.10.0的官方文档,发现了这样一句话:Configuration parameter replica.lag.max.messages was removed. Partiti ...

  8. Kafka:主要参数详解(转)

    原文地址:http://kafka.apache.org/documentation.html ############################# System ############### ...

  9. kafka

    2016-11-13  20:48:43 简单说明什么是kafka? Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息 ...

  10. Spark Streaming+Kafka

    Spark Streaming+Kafka 前言 在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端, ...

随机推荐

  1. Thread.currentThread().setContextClassLoader为什么不生效与java.lang.NoClassDefFoundError之Java类加载的Parent first Classloader

    众所周知,Java的类加载机制采用了双亲委派模型,导致在进行类加载的时候会有多个加载器,这种复杂的机制,有时候会导致‘Exception in thread main java.lang.NoClas ...

  2. 如何打造难用,bug多的产品

    本文纯属吐槽,如有雷同,绝非巧合.长期更新,欢迎一起吐槽. 没有产品规划 需求方提出需求后,直接开发,无需经过产品规划,用开发的思维搞出来!于是我们得到了一堆功能的集合.这个集合可以让刚上手的新用户一 ...

  3. 【生活现场】从诗词大会飞花令到elasticsearch原理解析(转)

    add by zhj:  作者是阿里的技术专家,把技术解释的通俗易懂,太牛了.该文转自作者的个人公众号:互联网侦察,里面有很多系列文章, 关于算法,大数据,面试现场三个系列,通过漫画学到知识,太棒了 ...

  4. WMware Workstation Pro安装教程

    [1]右键单击WMware Workstation Pro的可执行文件(.exe),选择以管理员身份运行 [2]点击下一步 [3]勾选我接受许可协议中的条款,点击下一步 [4]点击更改,选择安装位置( ...

  5. C# 用Singleton类构建多线程单例模式

    public sealed class Singleton    {        private static volatile Singleton uniqueInstance;        p ...

  6. C# Socket服务器及多客户端连接示例

    服务端代码[控制台示例] static List<Socket> Sockets = new List<Socket>(); static void Main(string[] ...

  7. JS的数组进行切片slice

    代码 var arr = new Array(6) arr[0] = "George" arr[1] = "John" arr[2] = "Thoma ...

  8. 1.Shell特殊位置变量

    $0    文件名及路径 $1,$2    参数1,参数2 , 也可以用${1}  和 ${2} 来表示 $#    传递给脚本或函数的参数个数 $$    当前Shell进程ID $?    判断上 ...

  9. 浅谈Vue.js2.0核心思想

    Vue.js是一个提供MVVM数据双向绑定的库,专注于UI层面,核心思想是:数据驱动.组件系统. 数据驱动: Vue.js数据观测原理在技术实现上,利用的是ES5Object.defineProper ...

  10. Invalid attempt to spread non-iterable instance

    问题在于对数据的操作,或数据类型,或数据名称