Kafka消费者从Kafka中读取数据

最近有需求要从kafak上消费读取实时数据，并将数据中的key输出到文件中，用于发布端的原始点进行比对，以此来确定是否传输过程中有遗漏数据。

不废话，直接上代码，公司架构设计 kafak 上有多个TOPIC，此代码每次需要指定一个TOPIC，一个TOPIC有3个分区Partition，所以消费的时候用多线程，

读取数据过程中直接过滤重复的key点，因为原始推送点有20W的量(可能发生在一秒或者几秒)。当时我直接用的HASHMAP来过滤。

1、ConsumerGroup

 import java.util.ArrayList;

 import java.util.HashMap;

 import java.util.List;

 public class ConsumerGroup {

     private List<ConsumerRunnable> consumers;

     public ConsumerGroup(int consumerNum, String groupId, String topic, String brokerList,HashMap<String,String> points) {

         consumers = new ArrayList<>(consumerNum);

         for (int i = 0; i < consumerNum; ++i) {

             ConsumerRunnable consumerThread = new ConsumerRunnable(brokerList, groupId, topic, points);

             consumers.add(consumerThread);

         }

     }

     public void execute() {

         for (ConsumerRunnable task : consumers) {

             new Thread(task).start();

         }

     }

 }

2、ConsumerRunnable

 import com.google.gson.JsonArray;

 import com.google.gson.JsonObject;

 import com.google.gson.JsonParser;

 import org.apache.kafka.clients.consumer.ConsumerRecord;

 import org.apache.kafka.clients.consumer.ConsumerRecords;

 import org.apache.kafka.clients.consumer.KafkaConsumer;

 import java.util.Arrays;

 import java.util.HashMap;

 import java.util.Properties;

 public class ConsumerRunnable implements Runnable {

     // 每个线程维护私有的KafkaConsumer实例

     private final KafkaConsumer<String, String> consumer;

     HashMap<String,String> points = new HashMap<>();

     public ConsumerRunnable(String brokerList, String groupId, String topic,HashMap<String,String> nodepoint) {

         Properties props = new Properties();

         props.put("bootstrap.servers", brokerList);

         props.put("group.id", groupId);

         props.put("enable.auto.commit", "true");        //本例使用自动提交位移

         props.put("auto.commit.interval.ms", "1000");

         props.put("session.timeout.ms", "30000");

         props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

         props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

         this.consumer = new KafkaConsumer<>(props);

         consumer.subscribe(Arrays.asList(topic));   // 本例使用分区副本自动分配策略

         points = nodepoint;

     }

     @Override

     public void run() {

         while (true) {

             ConsumerRecords<String, String> records = consumer.poll(200);

             for (ConsumerRecord<String, String> record : records) {

 //                System.out.printf("Partition = %s , offset = %d, key = %s, value=%s",record.partition(),record.offset(),record.key(),record.value());

                 JsonParser parse = new JsonParser();

                 JsonObject jsonObject = (JsonObject) parse.parse(record.value());

                 JsonArray jsonArray = jsonObject.get("list").getAsJsonArray();

                 for (int i=0 ;i <jsonArray.size();i++){

                     JsonObject subject = jsonArray.get(i).getAsJsonObject();

                     String cedian = subject.get("id").getAsString().trim();

                     if(points.containsKey(cedian) == false){

                         points.put(cedian,cedian);

                         WriterDataFile.writeData(cedian);

                     }

 //                    System.out.println(subject.get("id").getAsString());

                 }

             }

         }

     }

 }

3、ConsumerTest

 import java.util.HashMap;

 public class ConsumerTest {

     public static void main(String[] args) {

         String brokerList = "172.16.10.22:9092,172.16.10.23:9092,172.16.10.21:9092";

         String groupId = "test20190722";

         String topic = "SDFD";

         int consumerNum = 3;

         HashMap<String,String> points = new HashMap<>();

         ConsumerGroup consumerGroup = new ConsumerGroup(consumerNum, groupId, topic, brokerList,points);

         consumerGroup.execute();

     }

 }

4、WriterDataFile

 import java.io.*;

 import java.util.HashMap;

 public class WriterDataFile {

    private static String path = "E:\\kafkadata_SDFD.txt";

     public static void writeData(String strvalue){

         FileWriter fw ;

         try {

             fw = new FileWriter(path,true);

             BufferedWriter bw = new BufferedWriter(fw);

             bw.write(strvalue+"\r\n");

             bw.flush();

             bw.close();

             fw.close();

         } catch (IOException e) {

             e.printStackTrace();

         }

     }

 }

都是基础写法，没有时间整理，如有不合理处请谅解。

码字不易...

Kafka消费者从Kafka中读取数据并写入文件的更多相关文章

Java从.CSV文件中读取数据和写入
.CSV文件是以逗号分割的数据仓储,读取数据时从每一行中读取一条数据元祖,也就是一条数据,再用字符分割的方式获取表中的每一个数据项. import java.io.BufferedReader; ...
从多个XML文档中读取数据用于显示webapi帮助文档
前言: 你先得知道HelpPageConfig文件,不知道说明你现在不需要这个,所以下文就不用看了,等知道了再看也不急.当然如果你很知道这个,下文也不用看了,因为你会了. 方法一: new XmlDo ...
ffmpeg 从内存中读取数据（或将数据输出到内存）
更新记录(2014.7.24): 1.为了使本文更通俗易懂,更新了部分内容,将例子改为从内存中打开. 2.增加了将数据输出到内存的方法. 从内存中读取数据 ffmpeg一般情况下支持打开一个本地文件, ...
程序一用记事本建立文件src.dat，其中存放若干字符。编写程序，从文件src.dat中读取数据，统计其中的大写字母、小写字母、数字、其它字符的个数，并将这些数据写入到文件test.dat中。
用记事本建立文件src.dat,其中存放若干字符.编写程序,从文件src.dat中读取数据,统计其中的大写字母.小写字母.数字.其它字符的个数,并将这些数据写入到文件test.dat中. #inclu ...
java从文件中读取数据然后插入到数据库表中
实习工作中,完成了领导交给的任务,将搜集到的数据插入到数据库中,代码片段如下: static Connection getConnection() throws SQLException, IOExc ...
ffmpeg 从内存中读取数据（或将数据输出到内存）(转)
更新记录(2014.7.24): 1.为了使本文更通俗易懂,更新了部分内容,将例子改为从内存中打开. 2.增加了将数据输出到内存的方法. 从内存中读取数据 ffmpeg一般情况下支持打开一个本地文件, ...
ffmpeg 从内存中读取数据 .
http://blog.csdn.net/leixiaohua1020/article/details/12980423 ——————————————————————————————————————— ...
一个I/O线程可以并发处理N个客户端连接和读写操作 I/O复用模型基于Buf操作NIO可以读取任意位置的数据 Channel中读取数据到Buffer中或将数据 Buffer 中写入到 Channel 事件驱动消息通知观察者模式
Tomcat那些事儿 https://mp.weixin.qq.com/s?__biz=MzI3MTEwODc5Ng==&mid=2650860016&idx=2&sn=549 ...
【Python】从文件中读取数据
从文件中读取数据 1.1 读取整个文件要读取文件,需要一个包含几行文本的文件(文件PI_DESC.txt与file_reader.py在同一目录下) PI_DESC.txt 3.1415926535 ...

随机推荐

C语言入门-数据类型
一.C语言的类型整数:char.short.int.long.longlong 浮点型:float.double.long double 逻辑:bool 指针自定义类型类型有何不同类型名称:i ...
Windows认证 | 域认证
在Windows中的身份认证方式有很多,也在不断的升级,但是在域中,依旧使用的是Kerberos认证. Kerberos 是一种网络认证协议,它的实现不依赖于主机操作系统的认证,无需基于主机地址的信任 ...
数据分析--numpy的基本使用
一.numpy概述 NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: ndarray,一个多维数组结构,高效且节省空间无需循环对整组数据进 ...
RocketMQ学习 -> NameServer路由中心
RocketMQ项目代码核心目录说明 broker:broker启动进程 client:消息客户端,包含消息生产者,消息消费者相关类 common:公共包 dev:开发者信息(非源代码) distri ...
【IT技术概念】WebAPI与传统的WebService有哪些不同？
在.net平台下,有大量的技术让你创建一个HTTP服务,像Web Service,WCF,现在又出了Web API.在.net平台下,你有很多的选择来构建一个HTTP Services.我分享一下我对 ...
在网页中打印一个99乘法表--JavaScript描述
99乘法表使用for循环,在很多公司的面试中常会要求面试者手写这个算法,算是比较经典的for循环的应用 <!DOCTYPE html><html lang="en" ...
Windows Terminal 安装及美化
windows terminal 是今年微软Build大会上推出的一款的全新终端,用来代替cmder之类的第三方终端.具有亚克力透明.多标签.Unicode支持(中文,Emoji).自带等宽字体等这些 ...
at,crontab例行性任务
at:仅执行一次就结束的调度命令 at [-mldvc] TIME -m:当at的工作完成后,即使没有输出信息,也会以email的方式通知用户工作已完成 -l:相当于atq,列出系统上所有该用户的at ...
navicat for mysql中使用模型？
登录进数据库后,点击模型--新建模型,如下点击“小手”下面的图标----双击右边的空白处,即出现一个表格,可命名,此时我们命名为A 双击A表下空白处---即可设计A表属性,点确定.如下同理,生成一 ...
docker 使用及基本命令
一.docker简单使用 a.列出镜像 docker images b.从docker hub拉取最新版本镜像 docker pull xxx 错误: Error response from daem ...

Kafka消费者 从Kafka中读取数据并写入文件

Kafka消费者 从Kafka中读取数据

1、ConsumerGroup

2、ConsumerRunnable

4、WriterDataFile

Kafka消费者 从Kafka中读取数据并写入文件的更多相关文章

随机推荐

热门专题

Kafka消费者从Kafka中读取数据并写入文件

Kafka消费者从Kafka中读取数据

Kafka消费者从Kafka中读取数据并写入文件的更多相关文章