Zookeeper介绍
Zookeeper是一个分布式的开源系统,目的是为分布式应用提供协调一致性服务。
分布式应用可以在Zookeeper提供的简单原语集之上构造更高层次的服务。比如统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。
Zookeeper使用了类似文件系统的文件夹树结构的数据模型,帮助简化程序编写。
眼下,一些知名的大数据开源框架就是利用了Zookeeper来完好分布式的协调一致性服务,比如HDFS的HA特性,HBase。Storm等。
架构
Zookeeper服务
作为一个分布式系统,Zookeeper自身也是由几台server之间复制同样的镜像状态对外提供服务。一台server必须知道其他全部的server的存在。server在内存保留了一份镜像状态,同一时候利用事务日志和快照保留在持久化存储中。仅仅要大部分server可以正常工作。Zookeeper就处于可用状态。
一般client会连接当中一台Zookeeperserver。
client通过维持一个TCP连接。发送请求、获得对应、监控事件、还有心跳包。假设TCP连接失效,client会连接另外的server。
Zookeeper之间有Leader、Follower。
通过选举算法选举出唯一的Leader以后,Leader就要负责对其他Follower进行状态同步,保证每台server的数据一致性。
数据模型
Zookeeper分层命名空间
Zookeeper提供的命名空间类似于规范的文件系统。一个命名就是用反斜杠分隔的路径元素序列。
Zookeeper命名空间的每一个节点都是用一个路径来区分的。
与规范的文件系统不同的是。Zookeeper命名空间中的每一个节点(znode)都有数据关联。这些节点用来保存协调一致性数据:状态信息。配置,位置信息等,所以每一个节点保存的数据一般都比較小,都在kb范围内。
Znode的读写操作都是原子性的。
读操作会返回znode关联的全部数据,写操作会替换全部数据。每一个节点都有ACL限制。
Zookeeper也有暂时节点的概念。暂时节点的生命周期和建立znode的会话保持一致。会话结束,暂时节点就会被删除。
Zookeeper支持观察(watches)的功能。client在znode上设置一个watch事件。当znode改变的时候。一个watch事件就会被触发。
实现
原子广播(AtomicBroadcast)
Zookeeper的核心原理是通过原子性消息系统保证全部的server同步。
该消息系统包含下面特性:
可依赖传递
假设消息m被server传递,它终于会被全部server传递过。
全序性
假设消息a在消息b之前传递在server上,则终于在全部server上。a都会在b之前传递过。
因果顺序
假设消息b在消息a之后被发送者b传递,a一定会在b的顺序之前。
假设发送者发送b之后发送c,在c一定会在b的顺序之后。
Zookeeper在server之间建立了点对点的FIFO通道。通道是TCP通信,因为TCP的顺序性以及保证关闭后没有消息传递。另外为了保证在失败的时候保持一致性,使用了TCP的超时特性,当超时失效的时候。消息系统可能会被挂起。但不会破坏一致性。这样Zookeeper就保证了消息的全序性。
Zookeeper使用全局唯一的事务id(zxid)来区分每一个消息(proposal)。zxid是一个64位数字,高32位是时间戳。低32位是计数值。时间戳代表了Leader的改变,每次一个新的Leader选举出来时,就有自己的时间戳数值。
Leader简单添加zxid的值设置到每一个消息上。Leader选举算法会确保仅仅有一个Leader使用特定的时间戳,这样就保证每一个消息都会有唯一的id。
Zookeeper的消息传递包括两个基本的阶段:
Leader选举以及消息传递。
Leader选举
Leader选举算法较为复杂。主要是參考Paxos算法(经典的消息传递一致性算法)。大致有两种选举算法:LeaderElection和FastLeaderElection(AuthFastLeaderElection是FastLeaderElection变种。使用了UDP以及同意server使用简单的鉴权避免IP欺骗)。
详细算法能够參考文章http://www.cnblogs.com/lpshou/archive/2013/06/14/3136738.html,这里不再赘述。
要注意的是,当选举出新的Leader后。Leader须要对Follower进行数据同步。Leader会发送Follower缺少的消息。假设一个Follower丢失太多消息,则Leader会发送一个全状态快照到Follower。
如果Follower有一个消息U,但并没有到达的Leader。因为消息是按顺序发送,因此消息U一定比Leader所訪问过最大的zxid更大。这个时候当Follower连接到Leader的时候,Leader会告诉Follower丢弃U。
消息传递
client的读操作(查询和管理命令)仅仅须要读取当中一台server的数据就可以。
写操作(create,setData,setAcl,delete。createSession。closeSession等)则较为复杂,正常情况下,
当中一台server收到client的写请求后。须要向Leader进行request,Leader就会对Follower广播改动请求(proposal),当超过一般数量的Follower(N/2 + 1)响应后(Ack),Leader则会提交(Submit)这个写请求,而且通知之前的server给client一个回应。
从这里可以看出,写操作比读操作更加耗时,普通情况下,当读写操作约为10 : 1的时候,Zookeeper可以发挥最高性能。
以上全部的通信都是FIFO,所以事件都是有序的。特别是以下的操作必须有序:
- Leader发送proposals到全部的Follower使用同样的顺序。这个顺序依照请求被接收的顺序发送。
- Follower依照接收的顺序处理消息。因此消息会被有序地Acked而且Leader会接收到Followers的有序ACK。
- Leader会提交一个COMMIT到全部的Follower,当最低法定的Follower数返回ACKed消息。
- COMMIT会被有序地处理。
全部的Followers都会在proposal提交之后传递proposal消息。
TheTao of ZooKeeper
关于为何这个分布式协调消息一致性系统被命名为ZooKeeper。
官方有一篇非常有意思的文章介绍,里面还包含了ZooKeeper设计的原则。这里截取一小部分:
ZooKeepers are dedicated to the animals theyare in charge of as well as the people that visit those animals. They areguided by a code, until now known only to those of their
craft, that keep boththe animals and their visitors safe.
有兴趣能够到https://cwiki.apache.org/confluence/display/ZOOKEEPER/Tao阅读全文。
性能
关于Zookeeper的性能,官方给出了一些数据:
首先这个图里,横轴是在请求里读操作所占百分比,纵轴是每秒的处理的请求数RPS。从图能够明显看到,当读操作所占百分比越高。则Zookeeper的RPS也会对应提高。
另外。因为分布式系统的每一个节点都有故障的可能性,假若运气不好,某个节点出现问题。则Zookeeper的性能会有怎样影响呢?相同地,官方给出了下面的数据。
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvUHVuX0M=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
当中虚线代表发生了5个不同的故障:
1、Follower的故障和恢复
2、还有一个Follower的故障和恢复
3、Leader的故障和恢复
4、两个Followers的故障和恢复
5、还有一个Leader的故障和恢复
另外,这里的读操作保持30%的比例。
从图里可以看到。第一。Follower的故障和恢复非常迅速,Zookeeper仍然可以保持一个较高的的吞吐量。第二,重要的是。Leader的选举算法可以保证足够快。避免吞吐量的急剧下降。从数据里看到,Zookeeper少于200ms去选举新的Leader。第三。当Follower恢复的时候。Zookeeper可以再次提升吞吐量。
总结
综上,Zookeeper作为一个分布式的协调消息一致性系统。可以为分布式应用提供高吞吐量、低延迟、高可用性、严格有序的消息一致性功能。充分利用好Zookeeper。就能避免分布式应用对于处理这类问题中经常easy出现的问题和错误。
Zookeeper介绍的更多相关文章
- 竞价广告系统-ZooKeeper介绍
ZooKeeper介绍 为了讲述的完整性,介绍一下ZooKeeper.ZooKeeper在Index和Ad Server里使用比较多,虽然它可能没有google的Chubby好,但它是开源的工具.举一 ...
- Python 基于python操纵zookeeper介绍
基于python操纵zookeeper介绍 by:授客 QQ:1033553122 测试环境 Win7 64位 Python 3.3.4 kazoo-2.6.1-py2.py3-none-any.w ...
- Zookeeper系列一:Zookeeper介绍、Zookeeper安装配置、ZK Shell的使用
https://www.cnblogs.com/leeSmall/p/9563547.html 一.Zookeeper介绍 1. 介绍Zookeeper之前先来介绍一下分布式 1.1 分布式主要是下面 ...
- zookeeper 介绍与集群安装
zookeeper 介绍 ZooKeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization). ...
- Zookeeper介绍及安装部署
本节内容: Zookeeper介绍 Zookeeper特点 Zookeeper应用场景 用到了Zookeeper的一些系统 Zookeeper集群安装部署 一.Zookeeper介绍 是一个针对大型分 ...
- zookeeper介绍(4)zookeeper的完整分布式
参考: zookeeper的单机和伪分布式教程请参考:zookeeper介绍(1)zookeeper介绍与安装 Zookeeper的完整分布式集群搭建: 准备好三台centos主机:(在这我使用的是z ...
- zookeeper 介绍
ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等. Zookeeper是hadoop的一个子项目 ...
- Hbase记录-ZooKeeper介绍
ZooKeeper是一个分布式协调服务来管理大量的主机.协调和管理在分布式环境的一个服务是一个复杂的过程.ZooKeeper 简单解决了其结构和API这个问题.ZooKeeper允许开发人员能够专注于 ...
- zookeeper介绍以及安装配置
Zookeeper启动时默认将Zookeeper.out输出到当前目录,不友好.改变位置有两种方法: 1:在当前用户下~/.bash_profile或在/etc/profile,添加ZOO_LOG_D ...
随机推荐
- Web常用函数介绍(LoadRunner相关)
介绍大纲:1. web_url2. web_image3. web_link4. web_submmit_form 详细介绍: 一. web_url web_url 语法: Int Web_url(c ...
- git 拉取远程分之到本地
git checkout -b newbranch_name --track origin/feature/newbranch_name 如果遇到类似: fatal: git checkout: up ...
- Linux(gnu)环境动态链接库的搜索路径
摘自http://blog.csdn.net/saga1979/article/details/14161229 man ld.so(8)说,如果库依赖不包括“/”,那么它将按照下面的规则按顺序搜索: ...
- OC基础7:变量和数据类型
"OC基础"这个分类的文章是我在自学Stephen G.Kochan的<Objective-C程序设计第6版>过程中的笔记. 1.有时候初始化需要让对象带有初始值,那么 ...
- 获取oracle sql语句中绑定变量值的方法
在诊断 sql的性能问题时,我们有时候须要获取其绑定变量的实际值,然后将此实际值带入到sql语句其中,用原来的sql构成select语句(带where条件),实际的运行一下,看一下选择性怎样. 本文就 ...
- JavaScript创建类的方式
一些写类工具函数或框架的写类方式本质上都是 构造函数+原型.只有理解这一点才能真正明白如何用JavaScript写出面向对象的代码,或者说组织代码的方式使用面向对象方式.当然用JS也可写出函数式的代码 ...
- NVelocity模板引擎学习笔记
NVelocity模板引擎学习笔记 学习模板引擎有一段时间现在做一些总结
- javascript 中 offsetWidth,clientWidth;offsetHeight,clientHeight的区别
javascript 中 offsetWidth 是对象的可见宽度,包滚动条等边线,会随窗口的显示大小改变 clientWidth.offsetWidth.clientHeight区别IE6.0.FF ...
- Angular-UI-Router
原文 http://www.cnblogs.com/youngdze/p/4025538.html 主题 路由器JavaScript 路由 Route 为什么用 Route AJAX 请求不会留 ...
- 百度编辑器ueditor 在vs2008中的使用方法
个人觉得百度编辑器ueditor还是不错的,虽然出生的时间比较短,但某些方面相比其它富文本编辑器更优秀,免费.可定制等等. 由于在官方下载的ueditor包是在vs2012下开发的,可以在vs2010 ...