kafka C客户端librdkafka producer源码分析

from：http://www.cnblogs.com/xhcqwl/p/3905412.html

简介

kafka网站上提供了C语言的客户端librdkafka，地址在这。

librdkafka是使用C语言根据apache kafka 协议实现的客户端。另外这个客户端还有简单的c++接口。客户端作者对这个客户端比较上心，经常会修改bug并提交新功能。

librdkafka的基本原理和我之前博客说的java版producer类似，一个线程向队列中加数据，另一个线程通过非阻塞的方式从队列中取出数据，并写入到broker。

源码分析

源码包含两个文件夹src和src-cpp

src是用c实现的源码，而src-cpp是在c接口上包装的一层c++类，实现了基本的功能。

代码运行流程如下

1、rd_kafka_conf_set设置全局配置

2、rd_kafka_topic_conf_set设置topic配置

3、rd_kafka_brokers_add设置broker地址，启动向broker发送消息的线程

4、rd_kafka_new启动kafka主线程

5、rd_kafka_topic_new建topic

6、rd_kafka_produce使用本函数发送消息

7、rd_kafka_poll调用回调函数

还是看发送一条消息的过程

入队列过程

调用rd_kafka_produce可以将消息写到队列

1 int rd_kafka_produce (...) {

2     //调用rd_kafka_msg_new

3     return rd_kafka_msg_new(...);

4 }

首先先将消息包装成rd_kafka_msg_t类型，然后获取分区并相应的队列

1 int rd_kafka_msg_new (...) {

2     ...

3     //创建消息，将传入的参数转换为rkm

4     rkm = rd_kafka_msg_new0(...);

5     //分区并入队

6     err = rd_kafka_msg_partitioner(rkt, rkm, 1);

7     ...

8     return -1;

9 }

 1 int rd_kafka_msg_partitioner (...) {

 2      ...

 3      //获取分区号

 4      switch (rkt->rkt_state)

 5      {

 6          ...

 7      }

 8     //获取分区

 9     rktp_new = rd_kafka_toppar_get(rkt, partition, 0);

10     ...

11     //加入队列

12     rd_kafka_toppar_enq_msg(rktp_new, rkm);

13     return 0;

14 }

出队列过程

添加broker的过程中就启动了扫描队列的操作

 1 static rd_kafka_broker_t *rd_kafka_broker_add (rd_kafka_t *rk,

 2                            rd_kafka_confsource_t source,

 3                            const char *name, uint16_t port,

 4                            int32_t nodeid) {

 5     ...

 6     pthread_attr_init(&attr);

 7     pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

 8     //启动向broker发送消息的主线程

 9     if ((err = pthread_create(&rkb->rkb_thread, &attr,

10                   rd_kafka_broker_thread_main, rkb))) {

11         ...

12         return NULL;

13     }

14     //将broker加到broker队列中

15     TAILQ_INSERT_TAIL(&rkb->rkb_rk->rk_brokers, rkb, rkb_link);

16     (void)rd_atomic_add(&rkb->rkb_rk->rk_broker_cnt, 1);

17     ...

18     return rkb;

19 }

启动rd_kafka_broker_thread_main主线程

 1 static void *rd_kafka_broker_thread_main (void *arg) {

 2     ...

 3     while (!rkb->rkb_rk->rk_terminate) {

 4         switch (rkb->rkb_state)

 5         {

 6         //如果broker连接未初始化，或中断，则不断重连broker

 7         case RD_KAFKA_BROKER_STATE_INIT:

 8         case RD_KAFKA_BROKER_STATE_DOWN:

 9             if (rd_kafka_broker_connect(rkb) == -1) {

10                 ...

11             }

12             break;

13         //如果broker连接已经建立，则调用serve函数

14         case RD_KAFKA_BROKER_STATE_UP:

15             if (rkb->rkb_nodeid == RD_KAFKA_NODEID_UA)

16                 rd_kafka_broker_ua_idle(rkb);

17             else if (rk->rk_type == RD_KAFKA_PRODUCER)

18                 rd_kafka_broker_producer_serve(rkb);

19             else if (rk->rk_type == RD_KAFKA_CONSUMER)

20                 rd_kafka_broker_consumer_serve(rkb);

21             break;

22         }

23     }

24     ...

25     return NULL;

26 }

只看producer的处理函数，该函数扫描消息并发送

 1 static void rd_kafka_broker_producer_serve (rd_kafka_broker_t *rkb) {

 2     ...

 3     while (!rkb->rkb_rk->rk_terminate &&

 4            rkb->rkb_state == RD_KAFKA_BROKER_STATE_UP) {

 5         ...

 6         do {

 7             cnt = 0;

 8             ...

 9             //扫描所有的topic-partitions，并发送消息

10             TAILQ_FOREACH(rktp, &rkb->rkb_toppars, rktp_rkblink) {

11                 ...

12                 //将入队过程中的队列rktp_msgq加到rktp_xmit_msgq中

13                 if (rktp->rktp_msgq.rkmq_msg_cnt > 0)

14                     rd_kafka_msgq_concat(&rktp->

15                                  rktp_xmit_msgq,

16                                  &rktp->rktp_msgq);

17                 rd_kafka_toppar_unlock(rktp);

18                 //扫描消息队列中数据是否超时

19                 if (unlikely(do_timeout_scan))

20                     rd_kafka_msgq_age_scan(&rktp->

21                                    rktp_xmit_msgq,

22                                    &timedout,

23                                    now);

24                 //队列为空则从头继续

25                 if (rktp->rktp_xmit_msgq.rkmq_msg_cnt == 0)

26                     continue;

27

28                 //如果没有超时，或者没达到处理消息数量的阈值，则从头继续，这样批处理可以提高性能

29                 if (rktp->rktp_ts_last_xmit +

30                     (rkb->rkb_rk->rk_conf.

31                      buffering_max_ms * 1000) > now &&

32                     rktp->rktp_xmit_msgq.rkmq_msg_cnt <

33                     rkb->rkb_rk->rk_conf.

34                     batch_num_messages) {

35                     /* Wait for more messages */

36                     continue;

37                 }

38

39                 rktp->rktp_ts_last_xmit = now;

40

41                 //按协议转换并填充数据到rkb中

42                 while (rktp->rktp_xmit_msgq.rkmq_msg_cnt > 0) {

43                     int r = rd_kafka_broker_produce_toppar(

44                         rkb, rktp);

45                     if (likely(r > 0))

46                         cnt += r;

47                     else

48                         break;

49                 }

50             }

51

52         } while (cnt);

53

54         //触发数据发送情况的回调函数，将发送失败的写到一个操作结果队列中

55         if (unlikely(isrfailed.rkmq_msg_cnt > 0))

56             rd_kafka_dr_msgq(rkb->rkb_rk, &isrfailed,

57                      RD_KAFKA_RESP_ERR__ISR_INSUFF);

58

59         if (unlikely(timedout.rkmq_msg_cnt > 0))

60             rd_kafka_dr_msgq(rkb->rkb_rk, &timedout,

61                      RD_KAFKA_RESP_ERR__MSG_TIMED_OUT);

62

63         rd_kafka_broker_toppars_unlock(rkb);

64

65         /* Check and move retry buffers */

66         if (unlikely(rkb->rkb_retrybufs.rkbq_cnt) > 0)

67             rd_kafka_broker_retry_bufs_move(rkb);

68

69         rd_kafka_broker_unlock(rkb);

70

71         //开始在网络上发送数据

72                 rd_kafka_broker_io_serve(rkb);

73

74         /* Scan wait-response queue

75          * Note: 'now' may be a bit outdated by now. */

76         if (do_timeout_scan)

77             rd_kafka_broker_waitresp_timeout_scan(rkb, now);

78

79         rd_kafka_broker_lock(rkb);

80     }

81

82     rd_kafka_broker_unlock(rkb);

83 }

通过poll处理网络事件，将消息从网络发送到broker

 1 static void rd_kafka_broker_io_serve (rd_kafka_broker_t *rkb) {

 2     rd_kafka_op_t *rko;

 3     rd_ts_t now = rd_clock();

 4     //处理broker操作

 5     if (unlikely(rd_kafka_q_len(&rkb->rkb_ops) > 0))

 6         while ((rko = rd_kafka_q_pop(&rkb->rkb_ops, RD_POLL_NOWAIT)))

 7             rd_kafka_broker_op_serve(rkb, rko);

 8     //请求metadata

 9     if (unlikely(now >= rkb->rkb_ts_metadata_poll))

10         rd_kafka_broker_metadata_req(rkb, 1 /* all topics */, NULL,

11                                              NULL, "periodic refresh");

12     //如果有消息，手动增加写事件

13     if (rkb->rkb_outbufs.rkbq_cnt > 0)

14         rkb->rkb_pfd.events |= POLLOUT;

15     else

16         rkb->rkb_pfd.events &= ~POLLOUT;

17     if (poll(&rkb->rkb_pfd, 1,

18          rkb->rkb_rk->rk_conf.buffering_max_ms) <= 0)

19         return;

20     //poll函数，处理各种事件，发送消息时，只处理写事件，当请求metadata时，处理读事件

21     if (rkb->rkb_pfd.revents & POLLIN)

22         while (rd_kafka_recv(rkb) > 0)

23             ;

24     if (rkb->rkb_pfd.revents & POLLHUP)

25         return rd_kafka_broker_fail(rkb, RD_KAFKA_RESP_ERR__TRANSPORT,

26                         "Connection closed");

27     if (rkb->rkb_pfd.revents & POLLOUT)

28         while (rd_kafka_send(rkb) > 0)

29             ;

30 }

问题

librdkafka不像java客户端那样，可以通过future.get()实现同步发送。所以，如果broker不能连通的话，send方法还是可以正常将消息放入队列。这会导致两个问题

1、我们的客户端是不会知道broker已经挂掉了，因而不能对这种情况作出及时处理，导致消息全部堆积在内存中，如果此时不幸，我们的客户端也挂掉了，那这部分消息就全部丢失了。

2、如果broker一直没有恢复，而我们一直向队列中写数据的话，producer中有一个选项message.timeout.ms，如果超过了设定的消息超时时间，那么会有线程清理队列中的数据，导致消息丢失，而如果将时间设置为0（永不超时）的话，将导致客户端内存撑满。

上面这个问题可以通过如下方法实现的同步发送来解决

 1 void dr_cb (...err, , void *msg_opaque) {

 2      int *produce_statusp = (int *)msg_opaque;

 3

 4      /* set sync_produce()'s produce_status value to the error code (which can be NO_ERROR) */

 5      *produce_statusp = err;

 6 }

 7

 8 int sync_produce (rkt, msg..) {

 9    int produce_status = -100000; /* or some other magic value that is not proper value in rd_kafka_resp_err_t */

10

11    rd_kafka_produce(rkt, ..msg, .., &produce_status /* msg_opaque */);

12

13    do {

14      /* poll dr and error callbacks. */

15      rd_kafka_poll(rk, 1000);

16     /* wait for dr_cb to be called and setting produce_status to the error value. */

17    } while (produce_status == -100000);

18

19   if (produce_status == RD_KAFKA_RESP_ERR_NO_ERROR)

20    return SUCCESS!;

21   else

22    return FAILURE;

23 }

kafka C客户端librdkafka producer源码分析的更多相关文章

高吞吐量的分布式发布订阅消息系统Kafka之Producer源码分析
引言 Kafka是一款很棒的消息系统,今天我们就来深入了解一下它的实现细节,首先关注Producer这一方. 要使用kafka首先要实例化一个KafkaProducer,需要有brokerIP.序列化 ...
MapReduce——客户端提交任务源码分析
计算向数据移动 MR程序并不会在客户端执行任何的计算操作,它是为计算工作做好准备,例如计算出切片信息,直接影响到Map任务的并行度. 在Driver中提交任务时,会写到这样的语句: boolean r ...
[源码分析] 分布式任务队列 Celery 之发送Task & AMQP
[源码分析] 分布式任务队列 Celery 之发送Task & AMQP 目录 [源码分析] 分布式任务队列 Celery 之发送Task & AMQP 0x00 摘要 0x01 ...
[源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat
[源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat 目录 [源码分析] 并行分布式任务队列 Celery 之 Timer & Heartbeat 0 ...
kafka 0.8.1 新producer 源码简单分析
1 背景最近由于项目需要,需要使用kafka的producer.但是对于c++,kafka官方并没有很好的支持. 在kafka官网上可以找到0.8.x的客户端.可以使用的客户端有C版本客户端,此客户 ...
apache kafka源码分析-Producer分析---转载
原文地址:http://www.aboutyun.com/thread-9938-1-1.html 问题导读1.Kafka提供了Producer类作为java producer的api,此类有几种发送 ...
Kafka源码分析及图解原理之Producer端
一.前言任何消息队列都是万变不离其宗都是3部分,消息生产者(Producer).消息消费者(Consumer)和服务载体(在Kafka中用Broker指代).那么本篇主要讲解Producer端,会有 ...
源码分析 Kafka 消息发送流程(文末附流程图)
温馨提示:本文基于 Kafka 2.2.1 版本.本文主要是以源码的手段一步一步探究消息发送流程,如果对源码不感兴趣,可以直接跳到文末查看消息发送流程图与消息发送本地缓存存储结构. 从上文初识 Ka ...
Kafka源码分析(一) - 概述
系列文章目录 https://zhuanlan.zhihu.com/p/367683572 目录系列文章目录一. 实际问题二. 什么是Kafka, 如何解决这些问题的三. 基本原理 1. 基本 ...

随机推荐

Java基础－关于session的详细解释
转自:http://hi.baidu.com/zbzbzb/item/65d73d2a4d07cfd40f37f900 一.术语session 在我的经验里,session这个词被滥用的程度大概仅次于 ...
[bzoj2243][SDOI2011]染色
Description 给定一棵有$n$个节点的无根树和$m$个操作,操作有$2$类: 1.将节点$a$到节点$b$路径上所有点都染成颜色$c$; 2.询问节点$a$到节点$b$路径上的颜色段数量(连 ...
树上倍增求LCA（最近公共祖先）
前几天做faebdc学长出的模拟题,第三题最后要倍增来优化,在学长的讲解下,尝试的学习和编了一下倍增求LCA(我能说我其他方法也大会吗?..) 倍增求LCA: father[i][j]表示节点i往上跳 ...
BZOJ2426 [HAOI2010]工厂选址
Description 某地区有m座煤矿,其中第i号矿每年产量为ai吨,现有火力发电厂一个,每年需用煤b吨,每年运行的固定费用(包括折旧费,不包括煤的运费)为h元,每吨原煤从第i号矿运到原有发电厂的运 ...
UVa 1328 Period
数据范围较大,故用KMP求循环节之后由小到大枚举长度范围,若该长度下有循环节就输出答案还要注意输出格式.之前测试时候连着一串presentation error也是悲伤 #include<b ...
Allegro使用技巧
1.可以把outline及螺丝孔位置做成单独的mechanical symbol.因为板子外形和螺丝孔位置,多是从机构工程师手里拿来的DXF,新建mechanical symbol后,导入DXF到bo ...
C++ Pitfalls 之 reference to an object in a dynamically allocated containter
(留坑待填) Extraction from the C++ Programming Language 4th. ed., Bjarne Stroustrup 31.3.3 Size and Cap ...
刨根问底Objective－C Runtime
http://chun.tips/blog/2014/11/05/bao-gen-wen-di-objective%5Bnil%5Dc-runtime-(2)%5Bnil%5D-object-and- ...
java常用集合详解 contains
java集合是对常用数据集合的封装,差不多就是数组吧,验证某个元素是否在数据集合里,最原始的方法是,用个循环,"某个元素"与数据集合中的每个元素逐个进行比较. java 对常用的一 ...
使用ultraiso制作启动盘
1.以管理员方式运行Ultralso 2.点击菜单栏里的“启动”菜单下的“写入硬盘映像”命令,打开“写入硬盘映像”对话框. “硬盘驱动器”里就是选择你要刻录的U盘,这里演示用的是一张数码相机的内存卡. ...

kafka C客户端librdkafka producer源码分析

kafka C客户端librdkafka producer源码分析的更多相关文章

随机推荐

热门专题