使用librdkafka过程中,遇到的一些问题,解决办法!
后续上线稳定使用后,会做一点总结出来!
................................................................
librdkafka问题总结

librdkafka是kafka官方推荐的c client端开源库。本文基于librdkafka_0.8, 对该库作简要介绍,同时对使用过程中遇到的一些问题做个总结

一、模块介绍

librdkafka主要分为config,topic,produce,consume几个模块

config

依据kafka相应的config文件字段定义 
先通过默认配置文件创建confg对象,再通过confg的set方法设置需要覆盖的字段 
参考: http://blog.csdn.net/beitiandijun/article/details/40582541

topic

支持一个producer创建多个topic(比如bid,wn等类型的日志) 
创建主题方法rd_kafka_topic_new逻辑: 
检查是否有同名可用topic ==> 检查tconf为空则以默认配置创建 ==> 
检查partitioner未配置则配置为随机方法(从0,pcnt-1中选取partition) ==> 创建分区号为默认值RD_KAFKA_PARTITION_UA 的分区,并将topic插入队尾

partitioner类回调方法需自己实现

produce

kafka对象创建方法

rd_kafka_t *rd_kafka_new (rd_kafka_type_t type, rd_kafka_conf_t *conf,
char *errstr, size_t errstr_size)
  • 1
  • 2
  • 1
  • 2

检查config对象,创建事件循环主线程rd_kafka_thread_main,通过rd_kafka_brokers_add创建io事件循环子线程rd_kafka_broker_thread_main,将消息追加到队列, 并在io方法rd_kafka_broker_io_serve中分发处理socket connect,send,recv事件

消息生产方法

int rd_kafka_produce (rd_kafka_topic_t *rkt, int32_t partition,
int msgflags,
void *payload, size_t len,
const void *key, size_t keylen,
void *msg_opaque)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5

参数key用于partitioner hash生成partition 值 
参数partition默认为RD_KAFKA_PARTITION_UA,即未分配状态,在创建消息方法rd_kafka_msg_new检查发现partition为默认值,则调用partitioner回调函数生成partition值

consume

创建config,topic及kafka对象流程相同

二、 问题探讨

1.验证kafka超出数据保存设置时间后数据的有效性

通过以下设置,可开启kafka数据超时删除功能:

kafka server配置文件server.properties中设置

开启超时删除(false值为删除)

log.cleaner.enable

设置删除检测间隔

log.retention.check.interval.ms

设置超时时间

log.retention.hours 或 
log.retention.minutes

producer中设置topic config属性

cleanup.policy=delete和 
retention.ms

验证结果:超时数据被删除后不可再访问

2.kafka数据超时删除后,对新生产的数据访问方式

consumer offset输入参数设置为-2,即Topic::OFFSET_BEGINNING,读取有效数据起始位置

3.kafka删除超时数据并生产新数据后,消费者消费完新数据重启后获取新offset方式

consume recv时返回的offset,即为已消费的最后一个数据,resume重启后获取新的起始offset为: 
offset_new=offset+1

4.一个connection是否可以配置多个topic?

支持,一个kafka实例可以创建多个topic

5.一个topic是否可以配置多个partition?

kafka支持一个topic配置多个partition,但是限于需要保证数据的顺序性,只能配置1个partition

6.发送数据时是否需要指定topic和partition以及如何指定?

首先,必须指定topic;其次,对于partition,有两种方式: 
a. 明确指定,则数据被发送到指定partition 
b. 设置为RD_KAFKA_PARTITION_UA,则kafka会回调partitioner进行均衡选取,partitioner方法需要自己实现。可以轮询或者传入key进行hash。未实现则采用默认的随机方法rd_kafka_msg_partitioner_random随机选择。

7.接收数据时是否需要指定topic和partition以及如何指定?

都必须指定,且partition必须为topic对应的partitions之一。若未指定partition(RD_KAFKA_PARTITION_UA),消费调用将失败。超出partitions范围,则该partition将被设置为desired

8.Kafka是否可以保证消息顺序?

kafka仅支持单个partition上的顺序性,要保证整个topic在被消费时的顺序性,一个topic只能有一个partition,这也意味着每个group只有一个consumer。因为一个partition只能被同一group中 
的一个consumer消费。

Kafka only provides a total order over messages within a partition, not between different partitions in a topic. Per-partition ordering combined with the ability to partition data by key is sufficient for most applications. However, if you require a total order over messages this can be achieved with a topic that has only one partition, though this will mean only one consumer process per consumer group.

https://kafka.apache.org/documentation.html

9.Kafka的多个partition之间负载均衡由谁实现?

由producer负责实现。参照第6条

在librdkafka基础上,我封装了一个c++版本客户端,包含producer及consumer, demo及源码在github上KafkaClient

 
 

转载:librdkafka问题总结的更多相关文章

  1. 转载:kafka c接口librdkafka介绍之二:生产者接口

    转载:from:http://www.verydemo.com/demo_c92_i210679.html 这个程序虽然我调试过,也分析过,但是没有记录笔记,发现下边这篇文章分析直接透彻,拿来借用,聊 ...

  2. Crystal Clear Applied: The Seven Properties of Running an Agile Project (转载)

    作者Alistair Cockburn, Crystal Clear的7个成功要素,写得挺好. 敏捷方法的关注点,大家可以参考,太激动所以转载了. 原文:http://www.informit.com ...

  3. RTP与RTCP协议介绍(转载)

    RTSP发起/终结流媒体.RTP传输流媒体数据 .RTCP对RTP进行控制,同步.RTP中没有连接的概念,本身并不能为按序传输数据包提供可靠的保证,也不提供流量控制和拥塞控制,这些都由RTCP来负责完 ...

  4. 《Walking the callstack(转载)》

    本文转载自:https://www.codeproject.com/articles/11132/walking-the-callstack Download demo project with so ...

  5. [转载]MVVM模式原理分析及实践

    没有找到很好的MVVM模式介绍文章,简单找了一篇,分享一下.MVVM实现了UI\UE设计师(Expression Blend 4设计界面)和软件工程师的合理分工,在SilverLight.WPF.Wi ...

  6. [转载]:STM32为什么必须先配置时钟再配置GPIO

    转载来源 :http://blog.csdn.net/fushiqianxun/article/details/7926442 [原创]:我来添两句,就是很多同学(包括我)之前搞低端单片机,到了stm ...

  7. [转载]从MyEclipse到IntelliJ IDEA-让你摆脱鼠标,全键盘操作

    从MyEclipse转战到IntelliJ IDEA的经历 注转载址:http://blog.csdn.net/luoweifu/article/details/13985835 我一个朋友写了一篇“ ...

  8. TCP同步与异步,长连接与短连接【转载】

    原文地址:TCP同步与异步,长连接与短连接作者:1984346023 [转载说明:http://zjj1211.blog.51cto.com/1812544/373896   这是今天看到的一篇讲到T ...

  9. 在CentOS 7/6.5/6.4 中安装Java JDK 8(转载)

    转载在CentOS 7/6.5/6.4 中安装Java JDK 8 首先,在你的服务器上运行一下更新. yum update 然后,在您的系统上搜索,任何版本的已安装的JDK组件. rpm -qa | ...

随机推荐

  1. 我们为何放弃Eclipse,投奔IntelliJ IDEA

    本文来源于我在InfoQ中文站原创的文章,原文地址是:http://www.infoq.com/cn/news/2013/11/why-drop-eclipse-use-intellij Nikita ...

  2. nod32的内网在线更新设置

    需要一个iis地址,最好能够目录浏览,权限够大. 还必须: 增加一个MIME类型,.ver,类型填写application/x-ver

  3. DOM元素尺寸offsetWidth,scrollWidth,clientWidth等具体解释

    样例: <div id="div" style="height: 200px;width: 200px;border:solid 50px red;overflow ...

  4. C/C++——程序的内存分配

    C/C++程序内存分配 一.预备知识-程序的内存分配 一个由c/C++编译的程序占用的内存分为下面几个部分 1.栈区(stack):由编译器自己主动分配释放 ,存放函数的參数值,局部变量的值等.其操作 ...

  5. Jackcard类似度和余弦类似度(向量空间模型)的java实现

    版权声明:本文为博主原创文章,地址:http://blog.csdn.net/napoay,转载请留言. 总结Jackcard类似度和余弦类似度. 一.集合的Jackcard类似度 1.1Jackca ...

  6. SDE操作的许可问题

    ArcGIS二次开发和ArcGIS桌面应用中,许可是一个老生常谈的问题.以前也小结过一些经验.参考: http://www.cnblogs.com/liweis/p/4185311.html 问题描述 ...

  7. 【转】java 线程的几种状态

    java thread的运行周期中, 有几种状态, 在 java.lang.Thread.State 中有详细定义和说明: NEW 状态是指线程刚创建, 尚未启动 RUNNABLE 状态是线程正在正常 ...

  8. MySQL general log

    1:查看版本 SELECT VERSION(); 2:查看当前的日志保存方式 mysql> SHOW VARIABLES LIKE '%log_output%'; +-------------- ...

  9. C++ Standard Library

    C++ Standard Library *注:内容主要是对參考1的学习记录.知识点与图片大都来源于该书, 部分知识点与图片来源于參考2. 详细參考信息,见最下方參考. * C++98中新支持的语言特 ...

  10. JavaWeb分页显示内容之分页查询的三种思路(数据库分页查询)

    转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6134851.html 在开发过程中,经常做的一件事,也是最基本的事,就是从数据库中查询数据,然后在客户端显示出 ...