Storm的数据可靠性(理论)

Xsky 2024-09-26 13:51:01 原文

Storm的数据可靠性(理论)
.note-content {font-family: "Helvetica Neue",Arial,"Hiragino Sans GB","STHeiti","Microsoft YaHei","WenQuanYi Micro Hei",SimSun,Song,sans-serif;}

.note-content h2 {line-height: 1.6; color: #0AA89E;}
.note-content {background: #FFFFFF;}
.note-content h1 {color: #7AB3A7;}
.note-content h3 {color: #147A67;}

Storm的数据可靠性(理论)

我们都知道，分布式计算系统一般都管理着许多的机器。我们假设，现在有1000台机器的集群，假设每天每台机器出故障的几率只有1/1000，也就是说三年出一次故障，那么我们来算算每天至少有一台机器出故障的概率是多少？

也就是说，即使平均每台机器三年才出一次故障，这么对于1000台机器的集群，每天也会有一半以上的概率机器会挂掉。

所以说，分布式计算里面经常需要考虑任何的机器(Worker)挂掉，数据依然能够正常处理

故障处理

○ Nimbus故障，换台机器重启即可

○ Supervisor挂掉，迁移其上Worker即可

○ Worker挂掉，迁移走数据能正确处理吗？也就是说，如果Storm把所有数据发到Worker上面计算，它又是如何保证这些数据正确的恢复？如何保证这些数据不被重复计算？

Storm是使用一种叫做源端重放的方法来保证其可靠性的。

也就是说，Worker在运行其间有些什么原因导致数据丢失或者处理超时，这个时候Storm会通过一种叫Acker的机制来计算出这个错误是由源端的哪个tuple产生的，然后通知产生tuple的那个spout”这个tuple处理失败了，重发一下”，这个时候就会重发一个tuple使得下游能处理完

Spout数据保障

不丢：Acker机制保证数据如果未成个处理，可以及时发现，并通知Spout重发
不重：使用msgID去重

Spout容错

NextTuple中，emit时，指定msgID

1._collector.emit(new Values(sentence),1111);//1111为msgID

如果哪个tuple处理超时了，那么fail就会被调用

1.@Override
2.public void fail(Object id){
3.}

返回一个msgID，这样就知道哪一个tuple fail了，重发哪个tuple

Bolt容错

emit时，锚定输入Tuple
ack输入tuple

Trident API

为用户屏蔽掉一些状态与计算一致的细节
使用户更方便书写可容错的作业

Storm的数据可靠性(理论)的更多相关文章

Kafka数据可靠性深度解读
原文链接:http://www.infoq.com/cn/articles/depth-interpretation-of-kafka-data-reliability Kafka起初是由Linked ...
【Kafka】Kafka数据可靠性深度解读
转帖:http://www.infoq.com/cn/articles/depth-interpretation-of-kafka-data-reliability Kafka起初是由LinkedIn ...
kafka数据可靠性深度解读【转】
1 概述 Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用.目前越来越多的开源分布式处理系统如Cl ...
Kafka数据可靠性与一致性解析
Partition Recovery机制每个Partition会在磁盘记录一个RecoveryPoint, 记录已经flush到磁盘的最大offset.broker fail 重启时,会进行load ...
论SparkStreaming的数据可靠性和一致性
转自: http://www.csdn.net/article/2015-06-21/2825011 摘要:眼下大数据领域最热门的词汇之一便是流计算了,而其中最耀眼的无疑是来自Spark社区的Spar ...
kafka如何保证数据可靠性和数据一致性
数据可靠性 Kafka 作为一个商业级消息中间件,消息可靠性的重要性可想而知.本文从 Producter 往 Broker 发送消息.Topic 分区副本以及 Leader 选举几个角度介绍数据的可靠 ...
数据准备<1>:数据质量检查-理论篇
数据行业有一句很经典的话--"垃圾进,垃圾出"(Garbage in, Garbage out, GIGO),意思就是,如果使用的基础数据有问题,那基于这些数据得到的任何产出都是没 ...
Storm大数据实时计算
大数据也是构建各类系统的时候一种全新的思维,以及架构理念,比如Storm,Hive,Spark,ZooKeeper,HBase,Elasticsearch,等等 storm,在做热数据这块,如果要做复 ...
TCP/IP 协议是如何保证数据可靠性的？
原文: 网络基础:TCP协议-如何保证传输可靠性 TCP协议传输的特点主要就是面向字节流.传输可靠.面向连接.这篇博客,我们就重点讨论一下TCP协议如何确保传输的可靠性的. 确保传输可靠性的方式TCP ...

随机推荐

ORACLE表空间bigfile和smallfile
BIGFILE | SMALLFILE Use this clause to determine whether the tablespace is a bigfile or smallfile ta ...
水平居中的两种方法margin text-align
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
hdu 4710 Balls Rearrangement
题意就不说了,刚开始做我竟然傻傻地去模拟,智商捉急啊~~超时是肯定的求出 a ,b 的最小公倍数,因为n够长的话,就会出现循环,所以就不要再做不必要的计算了.如果最小公倍数大于n的话,就直接计算n吧 ...
light 1012 Guilty Prince
题意:一共有 T 组测试数据,每组先给两个数,w,h,表示给一个高h,宽w的矩阵,‘#’表示不能走,‘.’表示能走,‘@’表示起始点,问,从起始点出发能访问多少个点. 简单的BFS题,以前做过一次. ...
hql中or的用法（代替union）
hql中不支持union和unionAll关键字因为在查询出的结果集中无法进行排序.代替union起到相同作用的是or关键字.在构造hql时考虑使用or代替union产生多个结果集的组合. 详解如下 ...
我的DbHelper数据操作类(转)
其实,微软的企业库中有一个非常不错的数据操作类了.但是,不少公司(起码我遇到的几个...),对一些"封装"了些什么的东西不太敢用,虽然我推荐过微软的企业库框架了...但是还是要&q ...
codeforces 702E Analysis of Pathes in Functional Graph 倍增
题目链接给一个图, 然后给出每条边的权值和一个k值. 让你求出从每个点出发, 走k次能获得的边权的和以及边权的最小值. 用倍增的思想, 求出每个点走一次能到达的点, 权值和以及最小值, 走两次..四 ...
A fatal error has been detected by the Java Runtime Environment:
在Eclipse中运行项目遇到如下错误: ## A fatal error has been detected by the Java Runtime Environment:## EXCEPTIO ...
Linux学习之十一、环境变量的功能
环境变量的功能可以利用两个命令来查阅,分别是 env 与 export 呢! 范例一:列出目前的 shell 环境下的所有环境变量与其内容. [root@www ~]# env SHELL 告知我们 ...
Productivity Improvements for the Entity Framework(实体框架设计)【转】
Background We’ve been hearing a lot of good feedback on the recently released update to the Entity F ...