1.概述

　　在 Kafka 中，官方对外提供了两种消费 API，一种是高等级消费 API，另一种是低等级的消费 API。在《高级消费 API》一文中，介绍了其高级消费的 API 实现。今天给大家介绍另一种消费 API。

2.内容

　　在使用过 Kafka 的高级消费 API 后，我们知道它是一种高度抽象的消费 API，使用起来简单，方便，但是对于某些特殊的需求我们可能要用到第二种更加底层的 API。那么，我们首先需要知道低级消费 API 的作用。它能帮助我们去做那些事情：

一个消息进行多次读取
在处理过程中只消费 Partition 其中的某一部分消息
添加事物管理机制以保证消息仅被处理一次

　　当然，在使用的过程当中也是有些弊端的，其内容如下：

必须在程序中跟踪 Offset 的值
必须找出指定的 Topic Partition 中的 Lead Broker
必须处理 Broker 的变动

　　使用其 API 的思路步骤如下所示：

从所有处于 Active 状态的 Broker 中找出哪个是指定 Topic Partition 中的 Lead Broker
找出指定 Topic Partition 中的所有备份 Broker
构造请求
发送请求并查询数据
处理 Leader Broker 的变动

3.代码实现

3.1 Java Project

　　若是使用 Java Project 工程去实现该部分代码，需要添加相关以来 JAR 文件，其内容包含如下：

scala-xml_${version}-${version}.jar
scala-library-${version}.jar
metrics-core-${version}.jar
kafka-client-${version}.jar
kafka_${version}-${version}.jar

　　针对 Java Project 工程，需要自己筛选 JAR 去添加。保证代码的顺利执行。

3.2 Maven Project

　　对 Maven 工程，在 pom.xml 文件中添加相应的依赖信息即可，简单方便。让 Maven 去管理相应的依赖 JAR 文件。内容如下所示：

<dependency>

    <groupId>org.apache.kafka</groupId>

    <artifactId>kafka_2.11</artifactId>

    <version>0.8.2.1</version>

    <exclusions>

        <exclusion>

            <groupId>org.apache.zookeeper</groupId>

            <artifactId>zookeeper</artifactId>

    </exclusion>

    <exclusion>

            <groupId>log4j</groupId>

            <artifactId>log4j</artifactId>

    </exclusion>

    </exclusions>

</dependency>

　　这样在 Maven 工程中相应的依赖 JAR 文件就添加完成了。

3.3 代码实现

　　在低级消费 API 中，实现代码如下所示：

/**

 * @Date Mar 2, 2016

 *

 * @Author dengjie

 *

 * @Note Simple consumer api

 */

public class SimpleKafkaConsumer {

	private static Logger log = LoggerFactory.getLogger(SimpleKafkaConsumer.class);

	private List<String> m_replicaBrokers = new ArrayList<String>();

	public SimpleKafkaConsumer() {

		m_replicaBrokers = new ArrayList<String>();

	}

	public static void main(String[] args) {

		SimpleKafkaConsumer example = new SimpleKafkaConsumer();

		// Max read number

		long maxReads = SystemConfig.getIntProperty("kafka.read.max");

		// To subscribe to the topic

		String topic = SystemConfig.getProperty("kafka.topic");

		// Find partition

		int partition = SystemConfig.getIntProperty("kafka.partition");

		// Broker node's ip

		List<String> seeds = new ArrayList<String>();

		String[] hosts = SystemConfig.getPropertyArray("kafka.server.host", ",");

		for (String host : hosts) {

			seeds.add(host);

		}

		int port = SystemConfig.getIntProperty("kafka.server.port");

		try {

			example.run(maxReads, topic, partition, seeds, port);

		} catch (Exception e) {

			log.error("Oops:" + e);

			e.printStackTrace();

		}

	}

	public void run(long a_maxReads, String a_topic, int a_partition, List<String> a_seedBrokers, int a_port)

			throws Exception {

		// Get point topic partition's meta

		PartitionMetadata metadata = findLeader(a_seedBrokers, a_port, a_topic, a_partition);

		if (metadata == null) {

			log.info("[SimpleKafkaConsumer.run()] - Can't find metadata for Topic and Partition. Exiting");

			return;

		}

		if (metadata.leader() == null) {

			log.info("[SimpleKafkaConsumer.run()] - Can't find Leader for Topic and Partition. Exiting");

			return;

		}

		String leadBroker = metadata.leader().host();

		String clientName = "Client_" + a_topic + "_" + a_partition;

		SimpleConsumer consumer = new SimpleConsumer(leadBroker, a_port, 100000, 64 * 1024, clientName);

		long readOffset = getLastOffset(consumer, a_topic, a_partition, kafka.api.OffsetRequest.EarliestTime(),

				clientName);

		int numErrors = 0;

		while (a_maxReads > 0) {

			if (consumer == null) {

				consumer = new SimpleConsumer(leadBroker, a_port, 100000, 64 * 1024, clientName);

			}

			FetchRequest req = new FetchRequestBuilder().clientId(clientName)

					.addFetch(a_topic, a_partition, readOffset, 100000).build();

			FetchResponse fetchResponse = consumer.fetch(req);

			if (fetchResponse.hasError()) {

				numErrors++;

				// Something went wrong!

				short code = fetchResponse.errorCode(a_topic, a_partition);

				log.info("[SimpleKafkaConsumer.run()] - Error fetching data from the Broker:" + leadBroker

						+ " Reason: " + code);

				if (numErrors > 5)

					break;

				if (code == ErrorMapping.OffsetOutOfRangeCode()) {

					// We asked for an invalid offset. For simple case ask for

					// the last element to reset

					readOffset = getLastOffset(consumer, a_topic, a_partition, kafka.api.OffsetRequest.LatestTime(),

							clientName);

					continue;

				}

				consumer.close();

				consumer = null;

				leadBroker = findNewLeader(leadBroker, a_topic, a_partition, a_port);

				continue;

			}

			numErrors = 0;

			long numRead = 0;

			for (MessageAndOffset messageAndOffset : fetchResponse.messageSet(a_topic, a_partition)) {

				long currentOffset = messageAndOffset.offset();

				if (currentOffset < readOffset) {

					log.info("[SimpleKafkaConsumer.run()] - Found an old offset: " + currentOffset + " Expecting: "

							+ readOffset);

					continue;

				}

				readOffset = messageAndOffset.nextOffset();

				ByteBuffer payload = messageAndOffset.message().payload();

				byte[] bytes = new byte[payload.limit()];

				payload.get(bytes);

				System.out.println(String.valueOf(messageAndOffset.offset()) + ": " + new String(bytes, "UTF-8")); // Message deal enter

				numRead++;

				a_maxReads--;

			}

			if (numRead == 0) {

				try {

					Thread.sleep(1000);

				} catch (InterruptedException ie) {

				}

			}

		}

		if (consumer != null)

			consumer.close();

	}

	public static long getLastOffset(SimpleConsumer consumer, String topic, int partition, long whichTime,

			String clientName) {

		TopicAndPartition topicAndPartition = new TopicAndPartition(topic, partition);

		Map<TopicAndPartition, PartitionOffsetRequestInfo> requestInfo = new HashMap<TopicAndPartition, PartitionOffsetRequestInfo>();

		requestInfo.put(topicAndPartition, new PartitionOffsetRequestInfo(whichTime, 1));

		kafka.javaapi.OffsetRequest request = new kafka.javaapi.OffsetRequest(requestInfo,

				kafka.api.OffsetRequest.CurrentVersion(), clientName);

		OffsetResponse response = consumer.getOffsetsBefore(request);

		if (response.hasError()) {

			log.info("[SimpleKafkaConsumer.getLastOffset()] - Error fetching data Offset Data the Broker. Reason: "

					+ response.errorCode(topic, partition));

			return 0;

		}

		long[] offsets = response.offsets(topic, partition);

		return offsets[0];

	}

	/**

	 * @param a_oldLeader

	 * @param a_topic

	 * @param a_partition

	 * @param a_port

	 * @return String

	 * @throws Exception

	 *             find next leader broker

	 */

	private String findNewLeader(String a_oldLeader, String a_topic, int a_partition, int a_port) throws Exception {

		for (int i = 0; i < 3; i++) {

			boolean goToSleep = false;

			PartitionMetadata metadata = findLeader(m_replicaBrokers, a_port, a_topic, a_partition);

			if (metadata == null) {

				goToSleep = true;

			} else if (metadata.leader() == null) {

				goToSleep = true;

			} else if (a_oldLeader.equalsIgnoreCase(metadata.leader().host()) && i == 0) {

				// first time through if the leader hasn't changed give

				// ZooKeeper a second to recover

				// second time, assume the broker did recover before failover,

				// or it was a non-Broker issue

				//

				goToSleep = true;

			} else {

				return metadata.leader().host();

			}

			if (goToSleep) {

				try {

					Thread.sleep(1000);

				} catch (InterruptedException ie) {

				}

			}

		}

		throw new Exception("Unable to find new leader after Broker failure. Exiting");

	}

	private PartitionMetadata findLeader(List<String> a_seedBrokers, int a_port, String a_topic, int a_partition) {

		PartitionMetadata returnMetaData = null;

		loop: for (String seed : a_seedBrokers) {

			SimpleConsumer consumer = null;

			try {

				consumer = new SimpleConsumer(seed, a_port, 100000, 64 * 1024, "leaderLookup");

				List<String> topics = Collections.singletonList(a_topic);

				TopicMetadataRequest req = new TopicMetadataRequest(topics);

				kafka.javaapi.TopicMetadataResponse resp = consumer.send(req);

				List<TopicMetadata> metaData = resp.topicsMetadata();

				for (TopicMetadata item : metaData) {

					for (PartitionMetadata part : item.partitionsMetadata()) {

						if (part.partitionId() == a_partition) {

							returnMetaData = part;

							break loop;

						}

					}

				}

			} catch (Exception e) {

				log.error("Error communicating with Broker [" + seed + "] to find Leader for [" + a_topic + ", "

						+ a_partition + "] Reason: " + e);

			} finally {

				if (consumer != null)

					consumer.close();

			}

		}

		if (returnMetaData != null) {

			m_replicaBrokers.clear();

			for (kafka.cluster.Broker replica : returnMetaData.replicas()) {

				m_replicaBrokers.add(replica.host());

			}

		}

		return returnMetaData;

	}

}

4.总结

　　在使用 Kafka 低级消费 API 时，要明确我们所使用的业务场景，一般建议还是使用高级消费 API，除非遇到特殊需要。另外，在使用过程中，注意 Leader Broker 的处理，和 Offset 的管理。

5.结束语

　　这篇博客就和大家分享到这里，如果大家在研究学习的过程当中有什么问题，可以加群进行讨论或发送邮件给我，我会尽我所能为您解答，与君共勉！

Kafka - 消费接口分析的更多相关文章

kafka 消费
前置资料 kafka kafka消费中的问题及解决方法: 情况1: 问题:脚本读取kafka 数据,写入到数据库,有时候出现MySQL server has gone away,导致脚本死掉.再次启 ...
分享一些 Kafka 消费数据的小经验
前言之前写过一篇<从源码分析如何优雅的使用 Kafka 生产者> ,有生产者自然也就有消费者. 建议对 Kakfa 还比较陌生的朋友可以先看看. 就我的使用经验来说,大部分情况都是处于数 ...
Go语言学习之12 etcd、contex、kafka消费实例、logagent
本节内容: 1. etcd介绍与使用 2. ElastcSearch介绍与使用 1. etcd介绍与使用概念:高可用的分布式key-value存储,可以使用配置共享和服务发现 ...
Kafka消费时报错：Producer connection to xxx:9092 unsuccessful
使用kafka消费数据时报Producer错误,具体错误如下: kafka.producer.SyncProducer:103 Producer connection to xxx:9092 unsu ...
Kafka设计解析（十三）Kafka消费组(consumer group)
转载自 huxihx,原文链接 Kafka消费组(consumer group) 一直以来都想写一点关于kafka consumer的东西,特别是关于新版consumer的中文资料很少.最近Kafka ...
双十一问题：kafka消费能力低下原因思考
抛去cpu.内存等机器原因,在每个分区皆分配一个进程消费的情况下,利用扩机器来提高kafka消费速率已无能为力此时发现,在实际洪峰时段的消费速率元达不到先前压测时的消费速率原因思考: 1.洪峰时段 ...
Kafka消费不到数据的特殊情况
我大约是把kafka消费不到数据的特殊情况都经历了一遍了吧= =. kafka消费不到数据的原因,首先检查配置之类的,如是否设置了group.id,对应的topic是否正确等等,这些不多说. 下面是我 ...
Kafka消费分组和分区分配策略
Kafka消费分组,消息消费原理同一个消费组里的消费者不能消费同一个分区,不同消费组的消费组可以消费同一个分区 Kafka分区分配策略在 Kafka 内部存在两种默认的分区分配策略:Range 和 ...
kafka消费失败
kafka消费失败搞半天是路径错误,但是不会报错改为 job 就对了

随机推荐

C++混合编程之idlcpp教程Python篇(3)
上一篇 C++混合编程之idlcpp教程Python篇(2) 是一个 hello world 的例子,仅仅涉及了静态函数的调用.这一篇会有新的内容. 与PythonTutorial0相似,工程Pyth ...
orcale 匿名代码块
declare cursor readflow_cur is select * from od_readflow t where t.flowid is null; l_emp od_readflow ...
使用 New Relic 监控接口服务性能
偶然看到贴子在使用[Rails API] 使用这个APM监控,今天试了下.NET IIS环境下,配置一路NEXT即可. 主要指标服务响应时间 Segment SQL执行时间安全问题 1.走HTTP ...
如何在Global.asax中判断是否是ajax请求
今天在一个应用场景中需要在Global.asax中判断一个请求是否是ajax请求,而在ASP.NET MVC中已经提供了一个现成的扩展方法IsAjaxRequest: namespace System ...
C#与数据库访问技术总结（九）之实例
实例更新记录在本例子中,建立一个供用户输入学生学号和姓名的文本框和几个对应不同操作类型的更新信息按钮,当用户输入信息以后单击相应的按钮则执行相应的操作.在此实例中还将接触到服务器信息验证的相关知识 ...
利用模拟退火提高Kmeans的聚类精度
http://www.cnblogs.com/LBSer/p/4605904.html Kmeans算法是一种非监督聚类算法,由于原理简单而在业界被广泛使用,一般在实践中遇到聚类问题往往会优先使用Km ...
windows下安装mingw
windows环境下使用gcc MinGw是Minimal GNU on Windows的缩写,允许在GNU/linux和windows平台生成本地的windows程序而不需要第三方运行时库.本文主要 ...
atitit.客户端连接oracle数据库的方式总结
客户端连接oracle数据库的方式总结目录 Java程序连接一般使用jar驱动连接..... 桌面GUI一般采取c语言驱动oci.dll 直接连接... 间接连接(需要配置tns及其envi var ...
iOS开发---集成百度地图，位置偏移问题
iOS 集成百度SDK 请参考百度地图官方文档 ,这里不就多啰嗦了本文介绍的是在百度地图上根据经纬度,自定义气泡时,气泡位置的偏移,在我们天朝这种事是很常见的,也见怪不怪了,在项目中使用的百度地图 ...
Gridview用法大总结
Gridview用法大总结啦!精彩效果截图加详细源代码注释,需要的朋友赶紧过来看看吧:走过路过,千万不要错过哦! 由于篇幅限制,代码就不贴啦,要下载源码的请点击这里:希望朋友们能给出一些好的建 ...

Kafka - 消费接口分析