Storm整合Kafka Java API源码

1.Maven项目的pom.xml源码如下:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <groupId>com.yg</groupId>

    <artifactId>storm</artifactId>

    <version>0.0.1-SNAPSHOT</version>

    <packaging>jar</packaging>

    <name>storm</name>

    <url>http://maven.apache.org</url>

    <properties>

        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>

    </properties>

    <dependencies>

        <dependency>

            <groupId>org.apache.storm</groupId>

            <artifactId>storm-core</artifactId>

            <version>1.1.3</version>

            <scope>provided</scope>

        </dependency>

        <dependency>

            <groupId>org.apache.kafka</groupId>

            <artifactId>kafka_2.12</artifactId>

            <version>0.10.2.1</version>

        </dependency>

        <dependency>

            <groupId>org.apache.storm</groupId>

            <artifactId>storm-kafka</artifactId>

            <version>1.1.3</version>

        </dependency>

    </dependencies>

    <build>

        <plugins>

            <plugin>

                <artifactId>maven-assembly-plugin</artifactId>

                <configuration>

                    <descriptorRefs>

                        <descriptorRef>jar-with-dependencies</descriptorRef>

                    </descriptorRefs>

                    <archive>

                        <manifest>

                            <mainClass>com.path.to.main.Class</mainClass>

                        </manifest>

                    </archive>

                </configuration>

            </plugin>

            <plugin>

                <groupId>org.apache.maven.plugins</groupId>

                <artifactId>maven-compiler-plugin</artifactId>

                <version>3.5</version>

                <configuration>

                    <source>1.8</source>

                    <target>1.8</target>

                </configuration>

            </plugin>

        </plugins>

    </build>

</project>

2.KafkaSpout.java源码如下:

package com.yg.storm.kafka.spouts;

import java.util.Arrays;

import java.util.Map;

import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

public class KafkaSpout extends BaseRichSpout {

    private static final long serialVersionUID = 7582771881226024741L;

    private KafkaConsumer<String, String> consumer;

    final private String TOPIC = "myTopic";

    SpoutOutputCollector collector;

    @Override

    public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {

        this.collector = collector;

        Properties props = new Properties();

        props.put("bootstrap.servers", "hadoop211:9092,hadoop212:9092,hadoop213:9092");

        props.put("group.id", "test");

        props.put("enable.auto.commit", "true");

        props.put("auto.commit.interval.ms", "1000");

        props.put("session.timeout.ms", "30000");

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        consumer = new KafkaConsumer<String, String>(props);

        consumer.subscribe(Arrays.asList(TOPIC));

    }

    @Override

    public void nextTuple() {

        try {

            consumer.subscribe(Arrays.asList(TOPIC));//向topic订阅数据

            //无限循环拉取

            while (true) {

                ConsumerRecords<String, String> records = consumer.poll(10);//一次拉取10条数据

                for (ConsumerRecord<String, String> record : records) {

                    String key = record.key();

                    String value = record.value();

                    System.out.printf("offset = %d, key = %s, value = %s", record.offset(), key ,value);

                    collector.emit(new Values(value));//发射数据

                }

                Thread.sleep(1000*1);//每隔一秒拉取一次

            }

        } catch (InterruptedException e) {

            e.printStackTrace();

        } finally {

            consumer.close();

        }

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        // TODO Auto-generated method stub

        declarer.declare(new Fields("sentence"));

    }

}

3.HelloWorldBolt.java源码如下:

package com.yg.storm.bolts;

import java.util.Map;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.tuple.Tuple;

public class HelloWorldBolt extends BaseRichBolt{

    /**

     * 功能：就收到spout发送的数据，打印并统计hello world的数量

     * 实现：打印，创建计数变量用于统计hello world

     */

    private static final long serialVersionUID = -5061906223048521415L;

    private int myCount = 0;//计数变量，不能在execute函数中初始化

    private TopologyContext context;//上下文变量

    private OutputCollector collector;

    //相当于spout中的open

    @Override

    public void prepare(Map stormConf,

            TopologyContext context,

            OutputCollector collector) {

        this.context = context;

        this.collector = collector;

    }

    //相当于spout中的nextTuple

    @Override

    public void execute(Tuple input) {

        //拿到数据，用字段名取出

        String text = input.getStringByField("sentence");

        System.out.println("One tuple gets in: " + context.getThisTaskId() + text);

        if ("Hello World".equals(text)){

            myCount++;

            System.out.println("Found a Hello World! My count is now:" + myCount);

        }

        collector.ack(input);//处理完成要通知Storm

//        collector.fail(input);//处理失败要通知Storm    

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

    }

}

4.KafkaHelloWorldTopology.java源码如下:

package com.yg.storm.kafka.topologies;

import org.apache.storm.Config;

import org.apache.storm.LocalCluster;

import org.apache.storm.StormSubmitter;

import org.apache.storm.kafka.BrokerHosts;

import org.apache.storm.kafka.KafkaSpout;

import org.apache.storm.kafka.SpoutConfig;

import org.apache.storm.kafka.ZkHosts;

import org.apache.storm.spout.SchemeAsMultiScheme;

import org.apache.storm.topology.TopologyBuilder;

import org.apache.storm.utils.Utils;

import com.yg.storm.bolts.HelloWorldBolt;

public class KafkaHelloWorldTopology {

    //可以向main函数传入一个参数作为集群模式下Topology的名字，如果不传入任何参数则使用本地模式

    public static void main(String[] args) {

            final String brokerZkStr = "hadoop211:2181,hadoop212:2181,hadoop213:2181";

            final String topic  = "myTopic";

            BrokerHosts brokerHosts = new ZkHosts(brokerZkStr);

//          //使用KafkaConfig

//          KafkaConfig kafkaConfig = new KafkaConfig(

//                  brokerHosts,

//                  topic

//                  );

            //使用SpoutConfig，它继承自KafkaConfig，延伸了几个功能配置

            SpoutConfig spoutConfig = new SpoutConfig(

                    brokerHosts, //storm要连接的kafka的对应的zk列表

                    topic, //storm要消费的kafka的topic

                    "/HWTopo", //storm在kafka消费的过程中需要在zk中设置一个工作目录

                    "kafkaspout");  //storm在kafka中消费过程中生产一个标识ID

            //指定自定义的scheme

            spoutConfig.scheme = new SchemeAsMultiScheme(new MessageScheme());

            TopologyBuilder builder = new TopologyBuilder();

            builder.setSpout("spout", new KafkaSpout(spoutConfig));

            builder.setBolt("bolt1", new HelloWorldBolt()).shuffleGrouping("spout");

            Config conf = new Config();

//          Map<String, String> map = new HashMap<String, String>();

//

//          map.put("metadata.broker.list", "hadoop211:9092,hadoop212:9092,hadoop213:9092");

//          map.put("serializer.class", "kafka.serializer.StringEncoder");

//          conf.put("kafka.broker.properties", map);

//          conf.put("topic", topic);

            if(args != null && args.length > 0) {

                //提交到集群运行

                try {

                    StormSubmitter.submitTopology(args[0], conf, builder.createTopology());

                } catch (Exception e) {

                    e.printStackTrace();

                }

            } else {

                //本地模式运行

                LocalCluster cluster = new LocalCluster();

                cluster.submitTopology("SchemeTopo", conf, builder.createTopology());

                Utils.sleep(1000000);

                cluster.killTopology("SchemeTopo");

                cluster.shutdown();

            }

        }

}

5.自定义schema类MessageScheme.java源码如下:

package com.yg.storm.kafka.topologies;

import java.nio.ByteBuffer;

import java.nio.CharBuffer;

import java.nio.charset.Charset;

import java.nio.charset.CharsetDecoder;

import java.util.List;

import org.apache.storm.spout.Scheme;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

//编写storm消费kafka的逻辑

/*

 * MultiScheme is an interface that dictates how the ByteBuffer consumed

 * from Kafka gets transformed into a storm tuple.

 * It also controls the naming of your output field.

 *

 * The default RawMultiScheme just takes the ByteBuffer and returns a tuple

 * with the ByteBuffer converted to a byte[].

 * The name of the outputField is "bytes".

 * There are alternative implementations like SchemeAsMultiScheme and

 * KeyValueSchemeAsMultiScheme which can convert the ByteBuffer to String.

 *

 */

public class MessageScheme implements Scheme {

    private static final long serialVersionUID = 1033379821285531859L;

    @Override

    public List<Object> deserialize(ByteBuffer buffer) {

        try {

            Charset charset = Charset.forName("UTF-8");

            CharsetDecoder decoder = charset.newDecoder();

            CharBuffer charBuffer = decoder.decode(buffer.asReadOnlyBuffer());

            String sentence = charBuffer.toString();

            return new Values(sentence);

        } catch (Exception e) {

            System.out.println(e);

            return null;

        }

    }

    @Override

    public Fields getOutputFields() {

        return new Fields("sentence");

    }

}

直接本地运行KafkaHelloWorldTopology类即可.

Storm整合Kafka Java API源码的更多相关文章

kafka java API的使用
Kafka包含四种核心的API: 1.Producer API支持应用将数据流发送到Kafka集群的主题 2.Consumer API支持应用从Kafka集群的主题中读取数据流 3.Streams A ...
Android 如何在Eclipse中查看Android API源码及 support包源码
当我们阅读android API开发文档时候,上面的每个类,以及类的各个方法都是已经写好的方法和控件,可是我们只是在搬来使用,不知道它的原理,它是如何被实现的.android系统是开源的,所以谷歌官方 ...
Java集合源码学习（一）集合框架概览
>>集合框架 Java集合框架包含了大部分Java开发中用到的数据结构,主要包括List列表.Set集合.Map映射.迭代器(Iterator.Enumeration).工具类(Array ...
【转】Android 如何在Eclipse中查看Android API源码及 support包源码
原文网址:http://blog.csdn.net/vipzjyno1/article/details/22954775 当我们阅读android API开发文档时候,上面的每个类,以及类的各个方法都 ...
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合（注解及源码）
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合(注解及源码) 备注: 之前在Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合中 ...
Java Reference 源码分析
@(Java)[Reference] Java Reference 源码分析 Reference对象封装了其它对象的引用,可以和普通的对象一样操作,在一定的限制条件下,支持和垃圾收集器的交互.即可以使 ...
在Eclipse中关联Android API源码
在Eclipse中快速关联API源码,便于查看类以及方法.方法如下: 1. 在对应的项目文件右键——>properties——>java build path——>libraries ...
Java Collections 源码分析
Java Collections API源码分析侯捷老师剖析了不少Framework,如MFC,STL等.侯老师有句名言: 源码面前,了无秘密这句话还在知乎引起广泛讨论. 我对教授程序设计的一点想 ...
自学Java HashMap源码
自学Java HashMap源码参考:http://zhangshixi.iteye.com/blog/672697 HashMap概述 HashMap是基于哈希表的Map接口的非同步实现.此实现提 ...
Java集合源码分析（三）——LinkedList
简介 LinkedList是一个链表结构的列表,也可以被作为堆栈.队列或双端队列使用.它继承于AbstractSequentialList双向链表,实现了List.Deque.Cloneable.ja ...

随机推荐

ODOO13之五：Odoo 13开发之导入、导出以及模块数据
大多数Odoo 模块的定义,如用户界面和安全规则,实际是存储在对应数据表中的数据记录.模块中的 XML 和 CSV 文件不是 Odoo 应用运行时使用,而是载入数据表的手段.正是因为这个原因,Odoo ...
在树莓派上实现numpy的LSTM长短期记忆神经网络做图像分类，加载pytorch的模型参数，推理mnist手写数字识别
这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是LSTM识别mnist手写数字识别训练代码在电脑上,cpu就能训练,很快的: import torch imp ...
18.详解AQS家族的成员：Semaphore
关注:王有志,一个分享硬核Java技术的互金摸鱼侠. 欢迎你加入Java人的提桶跑路群:共同富裕的Java人今天我们来聊一聊AQS家族中另一个重要成员Semaphore,我只收集到了一道关于Sema ...
专访泛境科技：如何借助3DCAT实时云渲染打造元宇宙解决方案
随着5G.VR/AR等技术的发展,元宇宙(Metaverse)这一概念越来越受到关注.元宇宙是一个由虚拟世界构成的网络空间,其中人们可以通过数字化的身份和形象进行各种社交.娱乐.创作和商业活动.元宇宙 ...
Python正则表达式完全指南
本篇文章将深入探讨python的一项强大工具:正则表达式.正则表达式是一个强大的文本处理工具,可以用来匹配,搜索,替换和解析文本.我们将逐步展示如何在Python中使用正则表达式,包括其基本语法,常见 ...
Java 网络编程 —— RMI 框架
概述 RMI 是 Java 提供的一个完善的简单易用的远程方法调用框架,采用客户/服务器通信方式,在服务器上部署了提供各种服务的远程对象,客户端请求访问服务器上远程对象的方法,它要求客户端与服务器端都 ...
CKS 考试题整理（07）-RBAC - RoleBinding
Context 绑定到 Pod 的 ServiceAccount 的 Role 授予过度宽松的权限,完成以下项目以减少权限集. Task 一个名为 web-pod 的现有 Pod 已在 namespa ...
2-SQL
1. SQL 全称 Structured Query Language,结构化查询语言.操作关系型数据库的编程语言,定义了一套操作关系型数据库统一标准 . 2. SQL 通用语法 1). SQL 语 ...
SpringBoot 2 种方式快速实现分库分表，轻松拿捏！
大家好,我是小富- (一)好好的系统,为什么要分库分表? (二)分库分表的 21 条法则,hold 住! 本文是<分库分表ShardingSphere5.x原理与实战>系列的第三篇文章,本 ...

Storm整合Kafka Java API源码

Storm整合Kafka Java API源码的更多相关文章

随机推荐

热门专题