from kafka import KafkaConsumer,TopicPartition

import json

scrapy_kafka_hosts = ["ip:端口", "ip:端口"]

topic = 'wangliang_test'

consumer = KafkaConsumer(bootstrap_servers=scrapy_kafka_hosts,
group_id='', # 消费组

                         value_deserializer=lambda m: json.loads(m.decode('ascii')), # 消费json 格式的消息

                         auto_offset_reset='latest', # latest 最新的偏移量，默认最新的 # earliest 最早的偏远量，在还一个组时候才可以使用最早的

                         enable_auto_commit=True, # 是否开启自动提交 默认开启

                            auto_commit_interval_ms = 6000 # 提交偏移量的时间间隔，默认5000ms = 5 秒

                         )

consumer.subscribe([topic]) # 消息的主题，可以指定多个

print(consumer.partitions_for_topic(topic))

# print(consumer.topics())  #获取主题列表

# print(consumer.subscription())   #获取当前消费者订阅的主题

# print(consumer.assignment())   #获取当前消费者topic、分区信息

# print(consumer.beginning_offsets(consumer.assignment()))  #获取当前消费者可消费的偏移量

consumer.assign([

    TopicPartition(topic=topic, partition=0),

    TopicPartition(topic=topic, partition=1),

    TopicPartition(topic=topic, partition=3)

]) # 该命令与 subscribe 操作只能存在一个 表示指定主题和分区 获取 consumer 消息

# print(consumer.assignment())   #获取当前消费者topic、分区信息

consumer.seek(TopicPartition(topic=topic, partition=0), 1) # 指定起始offset为12  1表示offset 表示offset 开始连接

# consumer.seek(TopicPartition(topic=topic, partition=1), 0) # 可以注册多个分区，此分区从第一条消息开始接收

consumer.seek(TopicPartition(topic=topic, partition=3), 0) # 没有注册的分区上的消息不会被消费

for msg in consumer:

    print(msg)

    recv = "%s:%d:%d: key=%s value=%s" % (msg.topic, msg.partition, msg.offset, msg.key, msg.value)

    print(recv)

    print(msg.value["name"],msg.value["age"])

可以指定分区和消费者消费组和管道时间控制，消费数据。

from kafka import KafkaProducer, KafkaConsumer, TopicPartition

import time

class ConsumerForKFK(object):

    _MESSAGE_NAME = 'wangliang_test'

    def __init__(self, kafkahost, client_id):

        self.kafkaHost = kafkahost

        self.group_id = client_id

    @property

    def consumer_client(self, group_id=None):

        return KafkaConsumer(

            bootstrap_servers=self.kafkaHost,

            # client_id = self.client_id,

            group_id=self.group_id,

            auto_offset_reset="latest"

            # 若不指定 consumer_timeout_ms，默认一直循环等待接收，若指定，则超时返回，不再等待

            # consumer_timeout_ms ： 毫秒数

            # consumer_timeout_ms=5000

        )

    def consumer_seek(self, partition=None, partition_all=None, offset_time=None):

        partition_number = range(partition_all) if partition_all else partition

        consumer = self.consumer_client

        Partition_list = []

        for i in partition_number:

            Partition_list.append(TopicPartition(topic=self._MESSAGE_NAME, partition=i))

        consumer.assign(Partition_list)

        print(consumer.assignment())  # 获取当前消费者topic、分区信息

        if offset_time:

            for Partition in Partition_list:

                consumer.seek(Partition, 0)

            # 发送到指定的消息主题（异步，不阻塞）

            for msg in consumer:  # 迭代器，等待下一条消息

                print(int(time.time()) - int(msg.timestamp / 1000))

                if int(time.time()) - int(msg.timestamp / 1000) <= offset_time:  # 打印消息

                    print(msg)

        else:

            for msg in consumer:  # 迭代器，等待下一条消息

                print(msg)

scrapy_kafka_hosts = ["ip:端口", "ip:端口"]

topic = 'wangliang_test'

cl = ConsumerForKFK(scrapy_kafka_hosts, "")

cl.consumer_seek(

    partition=[1, 2],

    # partition_all=3,

    offset_time=3000

)

c89997867d48

Python往kafka生产消费数据 https://www.cnblogs.com/longsongpong/p/11010195.html

python操作kafka实践 https://www.cnblogs.com/small-office/p/9399907.html

kafka消费者的更多相关文章

kafka消费者客户端（0.9.0.1API）
转自:http://orchome.com/203 kafka客户端从kafka集群消费消息(记录).它会透明地处理kafka集群中服务器的故障.它获取集群内数据的分区,也和服务器进行交互,允许消费者 ...
Kafka消费者-从Kafka读取数据
(1)Customer和Customer Group (1)两种常用的消息模型队列模型(queuing)和发布-订阅模型(publish-subscribe). 队列的处理方式是一组消费者从服务器读 ...
Python 基于pykafka简单实现KAFKA消费者
基于pykafka简单实现KAFKA消费者 By: 授客 QQ:1033553122 1．测试环境 python 3.4 zookeeper-3.4.13.tar.gz 下载地址1 ...
Kafka集群安装部署、Kafka生产者、Kafka消费者
Storm上游数据源之Kakfa 目标: 理解Storm消费的数据来源.理解JMS规范.理解Kafka核心组件.掌握Kakfa生产者API.掌握Kafka消费者API.对流式计算的生态环境有深入的了解 ...
Kafka权威指南读书笔记之（四）Kafka 消费者一一从 Kafka读取数据
KafkaConsumer概念消费者和消费者群组 Kafka 消费者从属于消费者群组.一个群组里的消费者订阅的是同一个主题,每个消费者接收主题一部分分区的消息. 往群组里增加消费者是横向伸缩消费能力 ...
kafka 消费者 timeout 6000
kafka 消费者 timeout 6000 1:查看zookeeper 的状态,kafka默认是自带zookeeper配置,我建议安装单独的zookeeper 服务,并且配置文件也很简单..直接改 ...
Kafka消费者APi
Kafka客户端从集群中消费消息,并透明地处理kafka集群中出现故障服务器,透明地调节适应集群中变化的数据分区.也和服务器交互,平衡均衡消费者. public class KafkaConsumer ...
kafka 消费者offset记录位置和方式
我们大家都知道,kafka消费者在会保存其消费的进度,也就是offset,存储的位置根据选用的kafka api不同而不同. 首先来说说消费者如果是根据javaapi来消费,也就是[kafka.jav ...
JAVA封装消息中间件调用二（kafka消费者篇）
上一遍我简单介绍了kafka的生成者使用,调用方式比较简单,今天我给大家分享下封装kafka消费者,作为中间件,我们做的就是最大程度的解耦,使业务方接入我们依赖程度降到最低. 第一步,我们先配置一个消 ...
kafka消费者客户端
Kafka消费者 1.1 消费者与消费者组消费者与消费者组之间的关系每一个消费者都隶属于某一个消费者组,一个消费者组可以包含一个或多个消费者,每一条消息只会被消费者组中的某一个消费者所消费.不 ...

随机推荐

jmeter5实现文件上传接口测试
背景:在公司做接口自动化编写过程中,遇到需要测试一个在线下载导入模板的接口,之前都没有接触过关于文件上传下载的接口测试,此处做个记录,为后续工作开展做个参考. 步骤: 打开浏览器按F12 手动进行文件 ...
flask上下管理文相关 - RequestContetxt & AppContext对象
RequestContetxt / AppContext对象 1.flask程序启动时当flask程序启动时,通过源码可知,首先会创建两个LocalStack对象,二者内部会分别创建Local对象( ...
最新智联java校招面经（含整理过的面试题大全）
从6月到10月,经过4个月努力和坚持,自己有幸拿到了网易雷火.京东.去哪儿.智联等10家互联网公司的校招Offer,因为某些自身原因最终选择了智联.6.7月主要是做系统复习.项目复盘.LeetCode ...
SpringBoot：SpringBoot整合JdbcTemplate
个人其实偏向于使用类似于JdbcTemplate这种的框架,返回数据也习惯于接受Map/List形式,而不是转化成对象,一是前后台分离转成json方便,另外是返回数据格式,数据字段可以通过SQL控制, ...
Linux系统下GDB调试
GDB 一.gdb常用命令: 命令描述 backtrace(或bt) 查看各级函数调用及参数 finish 连续运行到当前函数返回为止,然后停下来等待命令 frame(或f) 帧编号选择栈帧 in ...
BIO和NIO实现文件复制
普通文件复制 public void copyFile() throws Exception{ FileInputStream fis=new FileInputStream("C:\\Us ...
处理vue页面406问题纪要
1.servlet-mapping url-pattern / 与 /* 的区别注意关注 2.mvc:resource 是否生效,注意关注,如不生效,可在 web.xml中配置<servlet- ...
HashMap集合排序方法
首先我们先来看看Map集合获取元素的三种常见方法(1)entrySet(),(2)keySet(),(3)values() 1. entrySet():(1)先返回map集合的所有"映射&q ...
Oracle的查询-多行查询
多行函数[聚合函数],作用于多行,返回一个值 ) from emp;--查询总数量 select count(empno) from emp;--查询总数量 select count(*) from ...
Win7 Eclipse 搭建spark java1.8(lambda)环境：WordCount helloworld例子
[学习笔记] Win7 Eclipse 搭建spark java1.8(lambda)环境:WordCount helloworld例子 lambda表达式是java8给我们带来的一个重量的新特性,借 ...

kafka消费者

消费者学习 https://www.jianshu.com/p/c89997867d48

Python往kafka生产消费数据 https://www.cnblogs.com/longsongpong/p/11010195.html

python操作kafka实践 https://www.cnblogs.com/small-office/p/9399907.html

kafka消费者的更多相关文章

随机推荐

热门专题