python-kafka实现produce与consumer

1.python-kafka：

api送上：https://kafka-python.readthedocs.io/en/latest/apidoc/KafkaConsumer.html

2.实现一个broker、topic可配置的生产者与消费者：

#coding=utf-8

import time

import logging

import sys

import json

import etc.config as conf

sys.path.append('***********/kafka-python-1.3.3')

from kafka import KafkaProducer

from kafka import KafkaConsumer

from kafka.errors import KafkaError

from kafka import TopicPartition

def log_name():

    base_name = conf.kafka_logDir

    date = time.strftime('%Y%m%d',time.localtime(time.time())) + '.log'

    return base_name + date

logging.basicConfig(level=logging.DEBUG,

        format='%(asctime)-15s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',

        datefmt='%Y-%m-%d %H:%M:%S',

        filename=log_name(),

        filemode='a'

        )

console = logging.StreamHandler()

console.setLevel(logging.INFO)

logging.getLogger('').addHandler(console)

class kfkProducer(object):

    # producer = None

    def __init__(self, broker, kafkaPort, kafkaTopic=''):

        self._broker = broker

        self._kafkaPort = kafkaPort

        self._kafkaTopic = kafkaTopic

    def __str__(self):

        logging.info("--------------------------------")

        logging.info("kafka-producer params ...")

        logging.info("[KAFKA-BROKER]:%s" %self._broker)

        logging.info("[KAFKA-PORT]:%s" %self._kafkaPort)

        logging.info("[KAFKA-TOPIC]:%s" %self._kafkaTopic)

        logging.info("--------------------------------")

    def registerKfkProducer(self):

        try:

            producer = KafkaProducer(bootstrap_servers = '{kafka_host}:{kafka_port}'.format(

                kafka_host=self._broker,

                kafka_port=self._kafkaPort

                ))

        except KafkaError as e:

            logging.info(e)

        return producer

    def produceMsg(self, topic, msg, partition=0):

        # 自动将输入字符串转化为json格式，产出消息

        if(topic in ('', None)):

            logging.error("topic is None, plz check!")

        else:

            try:

                # parmas_message = json.dumps(msg)#转化为json格式

                producer = self.registerKfkProducer()

                producer.send(topic, value=msg, partition=partition)

                producer.flush()

                # time.sleep(1)

            except KafkaError as e:

                logging.info(e)

class kfkConsumer(object):

    # consumer = None

    def __init__(self, broker, kafkaPort, kafkaTopic=''):

        self._broker = broker

        self._kafkaPort = kafkaPort

        self._kafkaTopic = kafkaTopic

    def __str__(self):

        logging.info("--------------------------------")

        logging.info("kafka-consumer params ...")

        logging.info("[KAFKA-BROKER]:%s" %self._broker)

        logging.info("[KAFKA-PORT]:%s" %self._kafkaPort)

        logging.info("[KAFKA-TOPIC]:%s" %self._kafkaTopic)

        logging.info("--------------------------------")

    def registerConsumer(self):

        try:

            consumer = KafkaConsumer(

                bootstrap_servers=[self._broker+':'+self._kafkaPort],

                auto_offset_reset='earliest')

        except KafkaError as e:

            logging.info(e)

        return consumer

    def consumerMsg(self, topic, partition=0):

        if(topic in ('', None)):

            logging.error("topic is None, plz check!")

        else:

            try:

                v_consumer = self.registerConsumer()

                v_consumer.assign([TopicPartition(topic,partition)])

                # self.registerConsumer.subscribe([self._kafkaTopic])

                for message in v_consumer:

                    # message value and key are raw bytes -- decode if necessary!

                    # e.g., for unicode: `message.value.decode('utf-8')

                    logging.info("%s:%d:%d: msg=%s" % (message.topic, message.partition,

                                                            message.offset, message.value.decode('utf-8')))

            except KafkaError as e:

                logging.info(e)

3.实现命令行输入topic和partition，即可生产消息：

#coding=utf-8

import os

import sys

import json

import etc.config as conf

from PykafkaMgr import kfkProducer

#从json文件获取消息

def getMsgFromJsonfile(filePath):

    if(not os.path.isfile(filePath)):

        print(u"[%s] 输入的json文件路径有误,请检查..." %filePath)

    else:

        with open(filePath) as json_file:

            return json.load(json_file)

def except4v():

    if(len(sys.argv) <= 1):

        print(u"未输入topic和partition！\n你可以--help查看具体使用方法...")

    elif(sys.argv[1].startswith("--")):

        option = sys.argv[1][2:]

        # print(option)

        if(option in ("version", "Version")):

            print("Version 1.0 \nPython 2.7.3 (default, Nov  6 2015, 14:11:14) \

                    \n[GCC 4.4.7 20120313 (Red Hat 4.4.7-4)] on linux2")

        elif(option == "help"):

            print(u"produceMsg.py 接收两个参数, 第一个是topic, 第二个是partition \neg:python produceMsg.py test 0 \n向topic名为test第0分区生产消息")

def calcMsg(jsonMsg):

    sumMsg, sumAcct = 0, 0

    msgNum = len(jsonMsg)

    print("------------------------------------------")

    for i in range(msgNum):

        acct_num = len(jsonMsg[i]["MSGBODY"])

        print(u"第[%d]条消息，包含ACCT_ID账户数:[%d]个"%(i+1, acct_num))

        sumMsg = i+1

        sumAcct += acct_num

        acct_num = 0

    print(u"本次生产消息总共[%d]条, 总共账户数：[%d]个"%(sumMsg, sumAcct))

    print("------------------------------------------")

if __name__ == '__main__':

    except4v()

    if(len(sys.argv) == 3):

        topic = sys.argv[1]

        partition = int(sys.argv[2])

        produce = kfkProducer(conf.kafka_mgr["broker"], conf.kafka_mgr["port"], topic)

        produce.__str__()

        jsonMsg = getMsgFromJsonfile(conf.kafka_produce)

        for i in range(len(jsonMsg)):

            produce.produceMsg(topic, ('%s'%jsonMsg[i]).encode('utf-8'), partition)

        calcMsg(jsonMsg)

4.设置两个配置文件：

第一个是config.py

#coding=utf-8

#broker配置还有一种方式是：kafka_mgr={"broker":'ip1:port,ip2:port,...,ipn:port'},就是改为kafka集群，不过代码要稍微作调整（参数列表改下就行了）。当然配置两种，通过一个开关去控制也可以。自选

kafka_mgr = {

    "broker" : '10.***.***.***',

    "port" : 6667,

}

kafka_logDir = r"/*******/log/****"

#生产者输入json文件

kafka_produce = r"/**********/data/input/produceMsg.json"

生产者输入json文件：
produceMsg.json

json文件附上说明，具体可以按照说明配置

hi, welcome here~

produceMsg.json

=================================

输入json格式数据，作为生产者消息的输入。

1.支持多条json数据输入。格式如下：

    [

    json1,

    json2,

    ...,

    jsonN

    ]

总体结构是：[  ,  ]

2.此json文件不能加注释，因为会破坏json文件格式，导致无法解析

3.输入只要是json格式，不需要关注是不是一行或多行，多换行、空格等都不影响解析

消费者也是利用以上两个配置文件去实现即可。此处代码略

python-kafka实现produce与consumer的更多相关文章

Python Kafka Client 性能测试
一.前言由于工作原因使用到了 Kafka,而现有的代码并不能满足性能需求,所以需要开发高效读写 Kafka 的工具,本文是一个 Python Kafka Client 的性能测试记录,通过本次测试, ...
python kafka client--confluent-kafka-python
项目中需要使用python 向Kafka生产和消费数据,最初使用pykafka .后来发现pykafka不支持client.id. 最后,终于找到confluent-kafka. python kaf ...
.net Kafka.Client多个Consumer Group对Topic消费不能完全覆盖研究总结（二）
依据Partition和Consumer的Rebalance策略,找到Kafka.Client Rebalance代码块,还原本地环境,跟踪调试,发现自定义Consumer Group 的Consum ...
Kafka客户端Producer与Consumer
Kafka客户端Producer与Consumer 一.pom.xml 二.相关配置文件 producer.properties log4j.properties base.properties 三. ...
ReferenceError: weakly-referenced object no longer exists Python kafka
Python存入kafka报错,ReferenceError: weakly-referenced object no longer exists. Exception in thread 14: p ...
SpringBoot整合kafka(实现producer和consumer)
本文代码使用的是Spring Boot 2.1.8.RELEASE 版本 <parent> <groupId>org.springframework.boot</grou ...
Kafka的Producer和Consumer源码学习
先解释下两个概念: high watermark (HW) 它表示已经被commited的最后一个message offset(所谓commited, 应该是ISR中所有replica都已写入),HW ...
Kafka的Producer以及Consumer远程调用问题
公司需要分布式的JMS,所以研究了Kafka,之前在本地都没有出现问题,但是在服务器上布Kafka的时候发现了消费者无法消费的问题. kafka布到一台服务器上面,由于业务原因,producer和ka ...
设计Kafka的High Level Consumer
原文:https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example 为什么使用High Level Consumer ...

随机推荐

Maven json包找不到解决办法
在Maven中央仓库找到Maven的jar <dependency> <groupId>net.sf.json-lib</groupId> <artifact ...
win10外接键盘失灵
故障描述:笔记本外接的键盘突然之间就失灵,键盘的灯不亮,无法输入处理方程: 1. 我的电脑右击--> 管理 --> 设备管理器(开始失灵时,键盘下的HID Keyboard Device ...
震撼功能:逐浪CMS全面支持PWA移动生成意指未来
Progressive Web App, 简称 PWA,是提升 Web App 的体验的一种新方法,能给用户原生应用的体验. PWA 能做到原生应用的体验不是靠特指某一项技术,而是经过应用一些新技术进 ...
ubuntu14.04 安装redis 2.8.9
ubuntu14.04安装前准备工作,为了保证安装顺利,请先执行apt-get update 然后安装make 和gcc(已安装的可忽略) apt-get install make apt-get i ...
react按需加载(getComponent优美写法),并指定输出模块名称解决缓存(getComponent与chunkFilename)
react配合webpack进行按需加载的方法很简单,Route的component改为getComponent,组件用require.ensure的方式获取,并在webpack中配置chunkFil ...
嵌入式Linux引导过程之1.3——Xloader的sys_init
上一篇文章对XLOADER_ENTRY进行了分析,看到其中调用的第一个标号就是sys_init,本文就对这个标号对应的代码段进行粗略的分析,这里我也还有好多没有搞明白的,就先留着,日后慢慢明白,先把自 ...
6.3 x86处理器如何处理MSI-X中断请求
PCIe设备发出MSI-X中断请求的方法与发出MSI中断请求的方法类似,都是向Message Address所在的地址写Message Data字段包含的数据.只是MSI-X中断机制为了支持更多的中断 ...
R︱shiny实现交互式界面布置与搭建（案例讲解+学习笔记）
要学的东西太多,无笔记不能学~~ 欢迎关注公众号,一起分享学习笔记,记录每一颗"贝壳"~ --------------------------- 看了看往期的博客,这个话题竟然是第 ...
FusionCharts 3D环饼图报错
1.在设计FusionCharts 3D环饼图时,出现错误,图显示不出来,具体错误如下图: 2.经过检查,发现声明的变量和下面引用的变量不一致 var doughnut2D = new FusionC ...
PL/SQL 记录 Record 简介
记录类型是表中当行数据结构的一个镜像.每个记录只存储一行数据,记录包含的是字段,而不是列. 1.用%rowtype属性隐式定义记录类型 declare individual individuals%r ...

python-kafka实现produce与consumer

python-kafka实现produce与consumer的更多相关文章

随机推荐

热门专题