转载:librdkafka问题总结
librdkafka是kafka官方推荐的c client端开源库。本文基于librdkafka_0.8, 对该库作简要介绍,同时对使用过程中遇到的一些问题做个总结
一、模块介绍
librdkafka主要分为config,topic,produce,consume几个模块
config
依据kafka相应的config文件字段定义
先通过默认配置文件创建confg对象,再通过confg的set方法设置需要覆盖的字段
参考: http://blog.csdn.net/beitiandijun/article/details/40582541
topic
支持一个producer创建多个topic(比如bid,wn等类型的日志)
创建主题方法rd_kafka_topic_new逻辑:
检查是否有同名可用topic ==> 检查tconf为空则以默认配置创建 ==>
检查partitioner未配置则配置为随机方法(从0,pcnt-1中选取partition) ==> 创建分区号为默认值RD_KAFKA_PARTITION_UA
的分区,并将topic插入队尾
partitioner类回调方法需自己实现
produce
kafka对象创建方法
rd_kafka_t *rd_kafka_new (rd_kafka_type_t type, rd_kafka_conf_t *conf,
char *errstr, size_t errstr_size)
- 1
- 2
- 1
- 2
检查config对象,创建事件循环主线程rd_kafka_thread_main
,通过rd_kafka_brokers_add
创建io事件循环子线程rd_kafka_broker_thread_main
,将消息追加到队列, 并在io方法rd_kafka_broker_io_serve
中分发处理socket connect,send,recv事件
消息生产方法
int rd_kafka_produce (rd_kafka_topic_t *rkt, int32_t partition,
int msgflags,
void *payload, size_t len,
const void *key, size_t keylen,
void *msg_opaque)
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
参数key用于partitioner hash生成partition 值
参数partition默认为RD_KAFKA_PARTITION_UA
,即未分配状态,在创建消息方法rd_kafka_msg_new
检查发现partition为默认值,则调用partitioner回调函数生成partition值
consume
创建config,topic及kafka对象流程相同
二、 问题探讨
1.验证kafka超出数据保存设置时间后数据的有效性
通过以下设置,可开启kafka数据超时删除功能:
kafka server配置文件server.properties中设置
开启超时删除(false值为删除)
log.cleaner.enable
设置删除检测间隔
log.retention.check.interval.ms
设置超时时间
log.retention.hours 或
log.retention.minutes
producer中设置topic config属性
cleanup.policy=delete和
retention.ms
验证结果:超时数据被删除后不可再访问
2.kafka数据超时删除后,对新生产的数据访问方式
consumer offset输入参数设置为-2,即Topic::OFFSET_BEGINNING,读取有效数据起始位置
3.kafka删除超时数据并生产新数据后,消费者消费完新数据重启后获取新offset方式
consume recv时返回的offset,即为已消费的最后一个数据,resume重启后获取新的起始offset为:
offset_new=offset+1
4.一个connection是否可以配置多个topic?
支持,一个kafka实例可以创建多个topic
5.一个topic是否可以配置多个partition?
kafka支持一个topic配置多个partition,但是限于需要保证数据的顺序性,只能配置1个partition
6.发送数据时是否需要指定topic和partition以及如何指定?
首先,必须指定topic;其次,对于partition,有两种方式:
a. 明确指定,则数据被发送到指定partition
b. 设置为RD_KAFKA_PARTITION_UA,则kafka会回调partitioner进行均衡选取,partitioner方法需要自己实现。可以轮询或者传入key进行hash。未实现则采用默认的随机方法rd_kafka_msg_partitioner_random
随机选择。
7.接收数据时是否需要指定topic和partition以及如何指定?
都必须指定,且partition必须为topic对应的partitions之一。若未指定partition(RD_KAFKA_PARTITION_UA),消费调用将失败。超出partitions范围,则该partition将被设置为desired
8.Kafka是否可以保证消息顺序?
kafka仅支持单个partition上的顺序性,要保证整个topic在被消费时的顺序性,一个topic只能有一个partition,这也意味着每个group只有一个consumer。因为一个partition只能被同一group中
的一个consumer消费。
Kafka only provides a total order over messages within a partition, not between different partitions in a topic. Per-partition ordering combined with the ability to partition data by key is sufficient for most applications. However, if you require a total order over messages this can be achieved with a topic that has only one partition, though this will mean only one consumer process per consumer group.
https://kafka.apache.org/documentation.html
9.Kafka的多个partition之间负载均衡由谁实现?
由producer负责实现。参照第6条
在librdkafka基础上,我封装了一个c++版本客户端,包含producer及consumer, demo及源码在github上KafkaClient
转载:librdkafka问题总结的更多相关文章
- 转载:kafka c接口librdkafka介绍之二:生产者接口
转载:from:http://www.verydemo.com/demo_c92_i210679.html 这个程序虽然我调试过,也分析过,但是没有记录笔记,发现下边这篇文章分析直接透彻,拿来借用,聊 ...
- Crystal Clear Applied: The Seven Properties of Running an Agile Project (转载)
作者Alistair Cockburn, Crystal Clear的7个成功要素,写得挺好. 敏捷方法的关注点,大家可以参考,太激动所以转载了. 原文:http://www.informit.com ...
- RTP与RTCP协议介绍(转载)
RTSP发起/终结流媒体.RTP传输流媒体数据 .RTCP对RTP进行控制,同步.RTP中没有连接的概念,本身并不能为按序传输数据包提供可靠的保证,也不提供流量控制和拥塞控制,这些都由RTCP来负责完 ...
- 《Walking the callstack(转载)》
本文转载自:https://www.codeproject.com/articles/11132/walking-the-callstack Download demo project with so ...
- [转载]MVVM模式原理分析及实践
没有找到很好的MVVM模式介绍文章,简单找了一篇,分享一下.MVVM实现了UI\UE设计师(Expression Blend 4设计界面)和软件工程师的合理分工,在SilverLight.WPF.Wi ...
- [转载]:STM32为什么必须先配置时钟再配置GPIO
转载来源 :http://blog.csdn.net/fushiqianxun/article/details/7926442 [原创]:我来添两句,就是很多同学(包括我)之前搞低端单片机,到了stm ...
- [转载]从MyEclipse到IntelliJ IDEA-让你摆脱鼠标,全键盘操作
从MyEclipse转战到IntelliJ IDEA的经历 注转载址:http://blog.csdn.net/luoweifu/article/details/13985835 我一个朋友写了一篇“ ...
- TCP同步与异步,长连接与短连接【转载】
原文地址:TCP同步与异步,长连接与短连接作者:1984346023 [转载说明:http://zjj1211.blog.51cto.com/1812544/373896 这是今天看到的一篇讲到T ...
- 在CentOS 7/6.5/6.4 中安装Java JDK 8(转载)
转载在CentOS 7/6.5/6.4 中安装Java JDK 8 首先,在你的服务器上运行一下更新. yum update 然后,在您的系统上搜索,任何版本的已安装的JDK组件. rpm -qa | ...
随机推荐
- GetTextMetrics与GetTextExtent的区别
GetTextMetrics:获取当前字体的信息 GetTextExtent:获取特定的字符串在屏幕上所占的宽度和高度 CDC::GetTextMetrics 作用: 返回当前设备描述表中的当前所用的 ...
- AngulerJS学习(五)按需动态载入文件
在此之前我么年首先要先了解几个东西: $q 简单介绍: $q:主要解决的是异步编程的问题,是指描写叙述通过一个承诺行为与对象代表的异步运行的行动结果的交互.可能会也可能不会再不论什么时候完毕. 我们通 ...
- 多维数组分解----SVD在推荐系统中的应用-
http://www.janscon.com/multiarray/rs_used_svd.html [声明]本文主要参考自论文<A SINGULAR VALUE DECOMPOSITION A ...
- Axure-如何设置圆形组件
--打开Axure软件,在[选择部件库]窗口中找到如图中所示的矩形. --将矩形拖到设计布局中 --将鼠标悬停在矩形上就能看到右上角有一个小圆点 --点击小圆点就能选择不同的形状,如:圆形
- __attribute__中constructor和destructor[总结]
1.前言 最近看到一份代码,看到一个函数前面用__attribute__((destructor))修饰,当时感觉有点怪怪的,搜了整个程序,也没发现哪个地方调用这个函数.于是从字面意思猜想,该函数会在 ...
- 入门GTD时间管理系统必读
让我们从什么时间管理开始.什么是时间管理呢?嗯,时间管理就是管理时间.可是,时间怎么能够管理呢? 其实我们管理地并不是时间,而是我们做的事.我们将事情分配到合适的时间段中,在有限的精力中完成它们,得到 ...
- 在线创建springboot项目
在线创建srpingboot项目的网址:https://start.spring.io/ 我只选了一个web,然后开始生成:
- Java开发 - 异常 - 使用throws
如果一个方法可能会产生异常,我们需要用throws关键字给它标注会抛出什么异常, 这样就可以在方法调用的时候捕获它. 代码如下: package corejava8.exceptions; publi ...
- 【树莓派】在树莓派的Android系统中安装APK应用
树莓派3 Android TV安装APK应用教程 本文摘自:http://www.mz6.net/news/android/6867.html 树莓派3 Android TV怎样安装软件?对于熟悉AD ...
- 安装vmware-tools出错:Execution aborted!!!
环境:VMware10+RedHat5(安装时选择了虚拟化组件). 安装vmware-tools过程中出现如下所示错误: This configuration program is to be exe ...