Storm集成Siddhi

《Siddhi初探》中我们介绍了Siddhi的基本使用方法，并表示我们将把Siddhi集成到Storm中作为流任务处理引擎。本文将用《Storm初探》中的例子讲解如何集成Siddhi。

《Storm初探》中的例子把名字字符串进行分割与输出，我们将增加一个SIddhiBolt进行名字过滤，过滤规则是筛选出小于50岁的人的名字。

对于输出：刘备 49 关羽 50 张飞 51，曹操 49 郭嘉 50 荀彧 51。我们将过滤出刘备，曹操两个名字。代码如下：

package com.coshaho.learn.storm;

import java.util.ArrayList;

import java.util.List;

import java.util.Map;

import org.wso2.siddhi.core.SiddhiAppRuntime;

import org.wso2.siddhi.core.SiddhiManager;

import org.wso2.siddhi.core.event.Event;

import org.wso2.siddhi.core.query.output.callback.QueryCallback;

import org.wso2.siddhi.core.stream.input.InputHandler;

import backtype.storm.task.OutputCollector;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.IRichBolt;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.tuple.Fields;

import backtype.storm.tuple.Tuple;

/**

 *

 * NamesFilterSiddhiBolt.java Create on 2017年6月26日 下午11:08:45

 *

 * 类功能说明:   根据年龄过滤名称

 *

 * Copyright: Copyright(c) 2013

 * Company: COSHAHO

 * @Version 1.0

 * @Author coshaho

 */

public class NamesFilterSiddhiBolt implements IRichBolt

{

    private static final long serialVersionUID = 1L;

    private OutputCollector collector;

    private InputHandler inputHandler;

    @SuppressWarnings("rawtypes")

    public void prepare(Map stormConf, TopologyContext context,

            OutputCollector collector)

    {

        this.collector = collector;

        init();

    }

    private void init()

    {

        SiddhiManager siddhiManager = new SiddhiManager();

        String siddhiApp = "" +

                "define stream namesStream (name string, age int, streamid String); " +

                "" +

                "@info(name = 'namefilter') " +

                "from namesStream[age < 50] " +

                "select name,streamid,age " +

                "insert into outputStream ;";

        SiddhiAppRuntime siddhiAppRuntime = siddhiManager.createSiddhiAppRuntime(siddhiApp);

        siddhiAppRuntime.addCallback("namefilter", new QueryCallback()

        {

            @Override

            public void receive(long timeStamp, Event[] inEvents, Event[] removeEvents)

            {

                for(Event event : inEvents)

                {

                    String name = event.getData(0) + "";

                    String streamId = event.getData(1) + "";

                    String age = event.getData(2) + "";

                    List<Object> splitList = new ArrayList<Object>();

                    splitList.add(name);

                    System.out.println(name + " 年龄为 " + age);

                    collector.emit(streamId, splitList);

                }

            }

        });

        inputHandler = siddhiAppRuntime.getInputHandler("namesStream");

        siddhiAppRuntime.start();

    }

    public void execute(Tuple input)

    {

        String name = input.getString(0);

        int age = input.getInteger(1);

        String inputStream = input.getSourceStreamId();

        try

        {

            inputHandler.send(new Object[]{name, age, inputStream});

        }

        catch (InterruptedException e)

        {

            e.printStackTrace();

        }

        collector.ack(input);

    }

    public void cleanup()

    {

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer)

    {

        declarer.declare(new Fields("name"));

    }

    public Map<String, Object> getComponentConfiguration()

    {

        return null;

    }

}

需要简单的修改一下名称切割Bolt，增加age字段输出

    public void execute(Tuple input)

    {

        // 打印线程号用于追踪Storm的分配策略

        Thread current = Thread.currentThread();

        String names = input.getString(0);

        System.out.println("准备拆分" + names + "。当前线程号是" + current.getId() + "。");

        List<Tuple> inputList = new ArrayList<Tuple>();

        inputList.add(input);

        String[] nameArray = names.split(" ");

        int age = 49;

        for(String name : nameArray)

        {

            List<Object> splitList = new ArrayList<Object>();

            splitList.add(name);

            splitList.add(age);

            collector.emit(inputList, splitList);

            age++;

        }

        collector.ack(input);

    }

Topo发布时增加Siddhi过滤节点

    public static void main(String[] args) throws InterruptedException

    {

        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("names-reader", new NamesReaderSpout());

        // 启动两个名字分割Task，名字列表随机分配给一个Task

        builder.setBolt("names-spliter", new NamesSpliterBolt(), 2)

            .shuffleGrouping("names-reader");

        builder.setBolt("names-filter", new NamesFilterSiddhiBolt(), 1)

            .shuffleGrouping("names-spliter");

        // 启动两个Hello World Task，相同名字发送到同一个Task

        builder.setBolt("hello-world", new HelloWorldBolt(), 2)

            .fieldsGrouping("names-filter", new Fields("name"));

        Config conf = new Config();

        LocalCluster cluster = new LocalCluster();

        cluster.submitTopology("storm-test", conf, builder.createTopology());

    }

输出如下

Storm集成Siddhi的更多相关文章

Storm集成Kafka应用的开发
我们知道storm的作用主要是进行流式计算,对于源源不断的均匀数据流流入处理是非常有效的,而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的,如果 ...
storm集成kafka的应用，从kafka读取，写入kafka
storm集成kafka的应用,从kafka读取,写入kafka by 小闪电 0前言 storm的主要作用是进行流式的实时计算,对于一直产生的数据流处理是非常迅速的,然而大部分数据并不是均匀的数据流 ...
Storm 学习之路（八）—— Storm集成HDFS和HBase
一.Storm集成HDFS 1.1 项目结构本用例源码下载地址:storm-hdfs-integration 1.2 项目主要依赖项目主要依赖如下,有两个地方需要注意: 这里由于我服务器上安装的是 ...
Storm 系列（八）—— Storm 集成 HDFS 和 HBase
一.Storm集成HDFS 1.1 项目结构本用例源码下载地址:storm-hdfs-integration 1.2 项目主要依赖项目主要依赖如下,有两个地方需要注意: 这里由于我服务器上安装的是 ...
storm集成kafka
kafkautil: import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.produce ...
Storm集成Kafka的Trident实现
原本打算将storm直接与flume直连,发现相应组件支持比较弱,topology任务对应的supervisor也不一定在哪个节点上,只能采用统一的分布式消息服务Kafka. 原本打算将结构设 ...
Storm集成Kafka编程模型
原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/3974417.html 本文主要介绍如何在Storm编程实现与Kafka的集成一.实现模型数据流程: ...
Storm 学习之路（七）—— Storm集成 Redis 详解
一.简介 Storm-Redis提供了Storm与Redis的集成支持,你只需要引入对应的依赖即可使用: <dependency> <groupId>org.apache.st ...
Storm 系列（七）—— Storm 集成 Redis 详解
一.简介 Storm-Redis 提供了 Storm 与 Redis 的集成支持,你只需要引入对应的依赖即可使用: <dependency> <groupId>org.apac ...

随机推荐

用AT命令调试调制解调器
最早生产调制解调器的公司是贺氏,后来组建的厂家制造的调制解调器都与HAYES兼容,大部分的通信软件使用菜单来对调制解调器进行配置.检测.但是有些通信软件要求用户直接发命令给调制解调器,在这种情况下必须 ...
CentOS7下Elastic Stack 5.0日志分析系统搭建
原文链接:http://www.2cto.com/net/201612/572296_3.html 在http://localhost:5601下新建索引页面输入“metricbeat-*”,之后ki ...
html5播放器制作小结
链接:http://snowinmay.net/6rooms/html/music.php 9月份前的版本: 播放,暂停,点赞,播放状态显示. 9.2版本: 下载歌曲,静音,时间倒计时(点击暂停时倒计 ...
一个js文件如何加载另外一个js文件
方法一,在调用文件的顶部加入下例代码: document.write(”<script language=javascript src=’/js/import.js’></scrip ...
Windows Server 2008 R2之二从介质安装 AD DS
可以使用 Ntdsutil.exe 为在域中创建的其他域控制器创建安装介质.通过从介质安装,可以最大程度地减少网络上目录数据的复制.有利于在远程站点中更高效地安装其他域控制器. 实验环境: 在Wind ...
你不可缺少的技能——Markdown编辑
Markdown简介 Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式.请不要被「标记」.「语言」所迷惑,Markdown 的语法十分 ...
PyQT5初学(一)
PyQt5 是Digia的一套Qt5与python绑定的应用框架,同时支持2.x和3.x.本教程使用的是3.x.Qt库由Riverbank Computing开发,是最强大的GUI库之一 ,官方网站: ...
Linux下搭建hadoop开发环境-超详细
先决条件:开发机器需要联网已安装java 已安装Desktop组 1.上传安装软件到linux上: 2.安装maven,用于管理项目依赖包:以hadoop用户安装apache-maven-3.0.5 ...
python数据结构之堆栈
本篇我以堆栈的数据类型和操作方法两个方面总结学习笔记堆栈(Stack) 一种后进先出(LIFO)的线性数据结构,对堆栈的插入和删除操作都只能在栈顶(top)进行. 堆栈可以通过数组和链表轻松实现一 ...
python3学习笔记(3)_dict-set
# !/usr/bin/env python3 # -*- coding:utf8 -*- #dict 和 set #dict dictionary 用于存放键值对的, 无序,key 不可变 #姓名 ...

Storm集成Siddhi

Storm集成Siddhi的更多相关文章

随机推荐

热门专题