Kafka 如何读取指定topic中的offset -------------用来验证分区是不是均衡！！！(__consumer

我现在使用的是librdkafka 的C/C++ 的客户端来生产消息，用flume来辅助处理异常的数据，，，

但是在前段时间，单独使用flume测试的时候发现，flume不能对分区进行负载均衡！同一个集群中，一个broker的一个分区已经有10亿条数据，另外一台的另一个分区只有8亿条数据；

因此，我对flume参照别人的做法，增加了拦截器；

即在flume配置文件中增加以下字段；

-----

stage_nginx.sources.tailSource.interceptors = i2
stage_nginx.sources.tailSource.interceptors.i2.type=org.apache.flume.sink.solr.morphline.UUIDInterceptor$Builder
stage_nginx.sources.tailSource.interceptors.i2.headerName=key
stage_nginx.sources.tailSource.interceptors.i2.preserveExisting=false

----特别注意，，此处的sources是你自己的sources name.

增加完后，要先进行自己测试，验证flume拦截器的负载均衡功能；

好，下来话不多少，，看测试步骤；

1，创建topic 相关联的分区（因现场暂时只有2个分区，所以我这边暂时取2个分区做测试）

　　（我暂时使用的kafka版本是kafka_2.11-0.9.0.1,以下都是在kafka相关版本的bin路径下操作命令）

　　./kafka-topics.sh --create --zookeeper 192.165.1.91:12181,192.165.1.92:12181,192.165.1.64:12181 --replication-factor 1 --partitions 2 --topic test3

　　　创建topic test3 不要分区 zookeeper 3台分区2个 zookeeper端口号12181（我本地的broker端口号是19091，这个在kafka conf/ server.properties里边配置）

2，查看topic的创建情况

　　在broker的每台机器的目录下，分别查看topic的创建情况！　　

　　下边是我91机器的情况：

　　./kafka-topics.sh --describe --zookeeper 192.165.1.91:12181 --topic test3

　　　　Topic:test3 PartitionCount:2 ReplicationFactor:1 Configs:

　　　　Topic: test3 Partition: 0 Leader: 1 Replicas: 1 Isr: 1

　　　　Topic: test3 Partition: 1 Leader: 2 Replicas: 2 Isr: 2

-------------意思是他有俩个分区，，每个分区他的备份分区都是他们自己，即没有分区，，你们可以根据你们自身的现状做不同的操作；

3，启动flume生产消息，并且查看消息是否生产成功；

　　　a, 启动flume：/home/hadoop/wgjflume/apache-flume-1.5.0-cdh5.4.9-bin/bin/flume-ng agent -n stage_nginx -c /home/hadoop/wgjflume/apache-flume-1.5.0-cdh5.4.9-bin/conf -f /home/hadoop/wgjflume/apache-flume-1.5.0-cdh5.4.9-bin/conf/flume-conf.properties -Dflume.root.logger=INFO,console

　　　　次处生产了30条消息！！！

　　　b, 查看消息是否消费成功！

　　　./kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list 192.165.1.91:19092,192.165.1.92:19092,192.165.1.64:19092 --topic test6 --time -1

4，要查消费情况，必须的建立消费组，，下来创建消费group

　　　./kafka-console-consumer.sh --bootstrap-server 192.165.1.91:19092,192.165.1.92:19092,192.165.1.64:19092 --topic test3 --from-beginning --new-consumer

　　　　此处会消费信息！

5，（此处，关闭消费程序，或者另外开一个窗口来）查看自己创建的 group id号；

　　 ./kafka-consumer-groups.sh --bootstrap-server 192.165.1.91:19092,192.165.1.92:19092,192.165.1.64:19092 --list --new-consumer

　　本地我显示的是：console-consumer-54762

6，查询__consumer_offsets topic所有内容

　　注意：运行下面命令前先要在consumer.properties中设置exclude.internal.topics=false（同时要配置好你的consumer.properties中有关zookeeper和broker相关的IP和端口信息）

　　 ./kafka-console-consumer.sh --topic __consumer_offsets --zookeeper 192.165.1.91:12181,192.165.1.92:12181,192.165.1.64:12181 --formatter "kafka.coordinator.GroupMetadataManager\$OffsetsMessageFormatter" --consumer.config ../config/consumer.properties --from-beginning

　　此处需要注意的是 consumer.properties 的路径！！！　　

7. 计算指定consumer group在__consumer_offsets topic中分区信息

这时候就用到了第4步获取的group.id(本例中是console-consumer-54762)。Kafka会使用下面公式计算该group位移保存在__consumer_offsets的哪个分区上：

Math.abs(groupID.hashCode()) % numPartitions

所以在本例中，对应的分区=Math.abs("console-consumer-54762".hashCode()) % 50 = 22，即__consumer_offsets的分区22保存了这个consumer group的位移信息，下面让我们验证一下。

　　注意：Math.abs("console-consumer-54762".hashCode()) % 50 这个使用java输出的一个值，Math.abs是java的一个函数，可以直接将前边这个做参数，打印出他的值.

8. 获取指定consumer group的位移信息

bin/kafka-simple-consumer-shell.sh --topic __consumer_offsets --partition 22 --broker-list 192.165.1.91:19092,192.165.1.92:19092,192.165.1.64:19092 --formatter "kafka.coordinator.GroupMetadataManager\$OffsetsMessageFormatter"

9,生产消息，查看负载均衡情况，，，，我项目中用的flume是exec方式的，，所有使用 cat 一个文件中的内容追加到flume exec 的文件末尾，然后运行命令8,,,查看消费位移！！！

　　结果显示，，，拦截器，，分发消息成功，，俩个分区数目基本是持衡的。

　　本文链接地址：https://i.cnblogs.com/EditPosts.aspx?postid=6339111

　　特别鸣谢，胡夕，参考了他的博文，他的博客链接地址：http://www.cnblogs.com/huxi2b/p/6061110.html

Kafka 如何读取指定topic中的offset -------------用来验证分区是不是均衡！！！(__consumer_offsets)（已验证！）的更多相关文章

【kafka】设置指定topic和group_id消耗的offset
该博文方法有问题,正确方案在http://www.cnblogs.com/dplearning/p/7992994.html 背景: 搭建了一个kafka集群,建立了topic test,用group ...
JDBC批处理读取指定Excel中数据到Mysql关系型数据库
这个demo是有一个Excel中的数据,我需要读取其中的数据然后导入到关系型数据库中,但是为了向数据库中插入更多的数据,循环N次Excel中的结果. 关于JDBC的批处理还可以参考我总结的如下博文: ...
【C++】ubuntu中读取指定目录中的所有文件
摘要:ubuntu系统下,C++程序读取指定文件夹中多个文件,保存文件名列表.文件名没有规律且不考虑读取子文件夹中的文件. 系统配置:ubuntu16.04, cmake编译首先安利一个函数,输入s ...
读取指定页面中的超链接-Python 3.7
#!/usr/bin/env python#coding: utf-8from bs4 import BeautifulSoupimport urllibimport urllib.requestim ...
matlab读取excel文件中的数据
1.读取sheet1中的所有数据 1.1首先我们建立一个sheet表,表名为‘111’ 1.2 默认这些文本以及数字都放在sheet1中,我们将此excel选入当前工作目录(必要步骤), 选入当前工作 ...
Kafka设计解析（十二）Kafka 如何读取offset topic内容 (__consumer_offsets)
转载自 huxihx,原文链接 Kafka 如何读取offset topic内容 (__consumer_offsets) 众所周知,由于Zookeeper并不适合大批量的频繁写入操作,新版Kafka ...
Kafka 如何读取offset topic内容 (__consumer_offsets)
众所周知,由于Zookeeper并不适合大批量的频繁写入操作,新版Kafka已推荐将consumer的位移信息保存在Kafka内部的topic中,即__consumer_offsets topic,并 ...
Kafka 如何读取offset topic内容 (__consumer_offsets)(转发)
原文 https://www.cnblogs.com/huxi2b/p/6061110.html 众所周知,由于Zookeeper并不适合大批量的频繁写入操作,新版Kafka已推荐将consumer ...
kafka中的offset概念
在 Kafka 中无论是 producer 往 topic 中写数据, 还是 consumer 从 topic 中读数据, 都避免不了和 offset 打交道, 关于 offset 主要有以下几个概念 ...

随机推荐

HMM与分词、词性标注、命名实体识别
http://www.hankcs.com/nlp/hmm-and-segmentation-tagging-named-entity-recognition.html HMM(隐马尔可夫模型)是用来 ...
Cognos11只需简单几步创建你的Dashboard
一.环境操作系统:win10 数据库 :SQLserver 2008 R2 软件版本:IBM Cognos Analytics 11.0.6 浏览器 :IE 11 二.开始创建仪表板 2.1 ...
OpenGL® ES 3.0 Programming Guide - Book Website
OpenGL® ES 3.0 Programming Guide - Book Website http://opengles-book.com sample codes in GitHub: htt ...
OpenGL ES 3.0之Fragment buffer objects（FBO）详解（一）
片段操作图这篇文章将介绍从写入帧缓冲和读取帧缓冲的方式. Buffers(缓冲) OpenGL ES支持三种缓冲: OpenGL ES •• Color buffer颜色缓冲 •• Depth bu ...
Android ListView 和 ***Adapter 从本地/网络获取歌曲列表
本文内容环境项目结构测试数据演示 1:SimpleAdapter 演示 2:BaseAdapter 演示 3:CustomLazyList 演示 4:CustomLazyCompleteLis ...
第七周 Word文档修订
come from:http://www.sxszjzx.com/~c20/12-2/office-gj/ 第七周 Word文档修订教学时间 2013-4-8 教学课时 2 教案序号 12 教学目标 ...
app_offline.htm
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DT ...
vs2015使用Apache Cordova用JavaScript来访问本地设备的功能，比如摄像头、加速计
看到下面这张图就代表着我VS2015 跨平台Moblie开发工具安装成功了. 上周安装成功后本想一睹跨平台开发的乐趣,可是一直找不到合适的入口.这周又来捯饬一下结果发现了一个入口.于是来写一个Hell ...
JAVA设计模式（全部）
一篇一篇的重写意义不大,不如把整个PDF文档上传上来看着方便,下载链接
reStructuredText - 一个比MarkDown更好用的标记语言
文档和教程 http://docutils.sourceforge.net/rst.html http://zh-sphinx-doc.readthedocs.io/en/latest/rest.ht ...

Kafka 如何读取指定topic中的offset -------------用来验证分区是不是均衡！！！(__consumer_offsets)（已验证！）

Kafka 如何读取指定topic中的offset -------------用来验证分区是不是均衡！！！(__consumer_offsets)（已验证！）的更多相关文章

随机推荐

热门专题