storm的可靠性

消息确认机制：

在数据发送的过程中可能会数据丢失导致没能接收到，spout有个超时时间（默认是30S），如果30S过去了还是没有接收到数据，也认为是处理失败。

运行结果都是处理成功

参考代码StormTopologyAcker.java

package yehua.storm;

import java.util.Map;

import org.apache.storm.Config;

import org.apache.storm.LocalCluster;

import org.apache.storm.StormSubmitter;

import org.apache.storm.generated.AlreadyAliveException;

import org.apache.storm.generated.AuthorizationException;

import org.apache.storm.generated.InvalidTopologyException;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.TopologyBuilder;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

import org.apache.storm.utils.Utils;

public class StormTopologyAcker {

    public static class MySpout extends BaseRichSpout{

        private Map conf;

        private TopologyContext context;

        private SpoutOutputCollector collector;

        @Override

        public void open(Map conf, TopologyContext context,

                SpoutOutputCollector collector) {

            this.conf = conf;

            this.collector = collector;

            this.context = context;

        }

        int num = 0;

        @Override

        public void nextTuple() {

            num++;

            System.out.println("spout:"+num);

            int messageid = num;

            //开启消息确认机制，就是在发送数据的时候发送一个messageid，一般情况下，messageid可以理解为mysql数据里面的主键id字段

            //要保证messageid和tuple之间有一个唯一的对应关系，这个关系需要程序员自己维护

            this.collector.emit(new Values(num),messageid);

            Utils.sleep(1000);

        }

        @Override

        public void declareOutputFields(OutputFieldsDeclarer declarer) {

            declarer.declare(new Fields("num"));

        }

        @Override

        public void ack(Object msgId) {

            System.out.println("处理成功！"+msgId);

        }

        @Override

        public void fail(Object msgId) {

            System.out.println("处理失败！"+msgId);

            //TODO  可以吧这个数据单独记录下来

        }

    }

    public static class MyBolt extends BaseRichBolt{

        private Map stormConf;

        private TopologyContext context;

        private OutputCollector collector;

        @Override

        public void prepare(Map stormConf, TopologyContext context,

                OutputCollector collector) {

            this.stormConf = stormConf;

            this.context = context;

            this.collector = collector;

        }

        int sum = 0;

        @Override

        public void execute(Tuple input) {

            try{

                Integer num = input.getIntegerByField("num");

                sum += num;

                System.out.println("sum="+sum);

                this.collector.ack(input);

            }catch(Exception e){

                this.collector.fail(input);

            }

        }

        @Override

        public void declareOutputFields(OutputFieldsDeclarer declarer) {

        }

    }

    public static void main(String[] args) {

        TopologyBuilder topologyBuilder = new TopologyBuilder();

        String spout_id = MySpout.class.getSimpleName();

        String bolt_id = MyBolt.class.getSimpleName();

        topologyBuilder.setSpout(spout_id, new MySpout());

        topologyBuilder.setBolt(bolt_id, new MyBolt()).shuffleGrouping(spout_id);

        Config config = new Config();

        config.setMaxSpoutPending(1000);//如果设置了这个参数，必须要保证开启了acker机制才有效

        String topology_name = StormTopologyAcker.class.getSimpleName();

        if(args.length==0){

            //在本地运行

            LocalCluster localCluster = new LocalCluster();

            localCluster.submitTopology(topology_name, config, topologyBuilder.createTopology());

        }else{

            //在集群运行

            try {

                StormSubmitter.submitTopology(topology_name, config, topologyBuilder.createTopology());

            } catch (AlreadyAliveException e) {

                e.printStackTrace();

            } catch (InvalidTopologyException e) {

                e.printStackTrace();

            } catch (AuthorizationException e) {

                e.printStackTrace();

            }

        }

    }

}

storm的可靠性的更多相关文章

Storm系列三： Storm消息可靠性保障
Storm系列三: Storm消息可靠性保障在上一篇 Storm系列二: Storm拓扑设计中我们已经设计了一个稍微复杂一点的拓扑. 而本篇就是在上一篇的基础上再做出一定的调整. 在这里先大概提一 ...
Storm编程入门API系列之Storm的可靠性的ACK消息确认机制
概念,见博客 Storm概念学习系列之storm的可靠性什么业务场景需要storm可靠性的ACK确认机制? 答:想要保住数据不丢,或者保住数据总是被处理.即若没被处理的,得让我们知道. publi ...
Storm概念学习系列之storm的可靠性
这个概念,对于理解storm很有必要. 1.worker进程死掉 worker是真实存在的.可以jps查看. 正是因为有了storm的可靠性,所以storm会重新启动一个新的worker进程. 2.s ...
Storm可靠性实例解析——ack机制
对于Storm,它有一个很重要的特性:“Guarantee no data loss” ——可靠性很显然,要做到这个特性,必须要track每个data的去向和结果.Storm是如何做到的呢——ack ...
Storm入门（六）深入理解可靠性机制
转自http://blog.csdn.net/zhangzhebjut/article/details/38467145 一可靠性简介 Storm的可靠性是指Storm会告知用户每一个消息单元是否在 ...
apache Storm学习之三-消息可靠性
4.1 简介 storm可以确保spout发送出来的每个消息都会被完整的处理.本章将会描述storm体系是如何达到这个目标的,并将会详述开发者应该如何使用storm的这些机制来实现数据的可靠处理. 4 ...
Storm如何保证可靠的消息处理
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 本文主要翻译自Storm官方文档Guaranteeing messag ...
Storm介绍(一)
作者:Jack47 PS:如果喜欢我写的文章,欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 内容简介本文是Storm系列之一,介绍了Storm的起源,Storm ...
storm 入门原理介绍
1.hadoop有master与slave,Storm与之对应的节点是什么? 2.Storm控制节点上面运行一个后台程序被称之为什么? 3.Supervisor的作用是什么? 4.Topology与W ...

随机推荐

Netty网络聊天室之会话管理
写过web的同学们应该对Session这个东西很熟悉.浏览器第一次与服务器建立连接的时候,服务器就会自动为之分配一个Session.Session可以用来判断用户是否经过登录验证,也可以保存用户的各种 ...
NBUT 1224 Happiness Hotel 2010辽宁省赛
Time limit 1000 ms Memory limit 131072 kB The life of Little A is good, and, he managed to get enoug ...
UI基础:target...action设计模式,手势识别器.UIimageview
使用target..action和delegate设计模式可以实现解耦.使代码更加优化. 手势识别器: 手势识别器:是对触摸事件做了封装,无需自己去判断某个手势是否触发,手势识别器本身起到了识别作用, ...
convertTo函数
前言使用opencv常常会需要用到数据类型之间的转换,此时需要使用convertTo函数. 代码: cv::Mat samples; cv::Mat tdata; samples.convertTo ...
HBulider打包
1. manifest配置按照Manifest.json文档说明 manifest配置把工程中的manifest.json文件配置好,下面以我的项目为例进行配置. (1).应用信息 (2).图标配置 ...
linux搜索命令之find和grep
在使用linux时,经常需要进行文件查找,其中查找的命令主要有find和grep.两个命令是有区的. 区别:(1)find命令是根据文件的属性进行查找,如文件名,文件大小,所有者,所属组,是否为空,访 ...
HDU 2089：不要62
Problem Description 杭州人称那些傻乎乎粘嗒嗒的人为62(音:laoer). 杭州交通管理局经常会扩充一些的士车牌照,新近出来一个好消息,以后上牌照,不再含有不吉利的数字了,这样一来 ...
python笔记-6（import导入、time/datetime/random/os/sys模块）
一.了解模块导入的基本知识此部分此处不展开细说import导入,仅写几个点目前的认知即可.其它内容待日后有深入理解了再来细说 1.import可以导入的两种不同的内容 1.1 *.py文件结尾的文件 ...
POI解析excel格式的文件（xls,xlsx）
先贴出所需的jar包: 1.poi-3.17-beta1.jar 2.poi-ooxml-3.17-beta1.jar 3.poi-ooxml-schemas-3.17-beta1.jar 4.com ...
自制数据结构（容器）-java开发用的最多的ArrayList和HashMap
public class MyArrayList<E> { private int capacity = 10; private int size = 0; private E[] val ...

storm的可靠性

storm的可靠性的更多相关文章

随机推荐

热门专题