1,先看看官方的定义吧:

ZooKeeper is a distributed, open-source coordination service for distributed applications. It exposes a simple set of primitives that distributed applications can build upon to implement higher
level services for synchronization, configuration maintenance, and groups and naming. It is designed to be easy to program to, and uses a data model styled after the familiar directory tree structure of file systems.

zookeeper 是一个分布式应用程序提供的分布式的开源的协调服务。

他提供了一个简单的原语集,通过这些原语集能够实现更高层次的同步服务,配置管理,集群管理和命名服务。他被设计为易于编程和以一种和文件系统很类似的数据模型来实现编程。

通过定义能够了解到zookeeper都有哪些作用,无非就是一句话:能够为分布式应用程序提供同步服务,命名服务等功能。可是了解到这里马上就会产生疑问----还有好多开源项目都能够为分布式应用程序提供这些服务啊,为什么要用zookeeper呢?

举两个样例:

能够用redis实现分布式锁啊,或是不用redis随便用个什么其它的什么东西都能够作为分布式应用程序的锁啊;

配置管理好像就更扯了。我随便能够把配置放到什么地方仅仅要让分布式应用去读就能够了。

事实上。zookeeper不过只能提供这些功能也确实就没什么存在的必要了,关键是他可以提高可用的高一致性的这些服务。

提到高可用的这几个字,这时或许我们就会想到採用集群的方式(如今server部署的主流方式)。那么不过由于这个redis相同也能够达到这个标准。可是zookeeper还有高一致性的特性。

整体上来讲。zookeeper作为分布式应用的协调服务拥有一下特性:

高可用性。高一致性,高性能  (是不是对于分布式理论中的cap呢  Consistency Availability Partition Tolerance 事实上cap理论也是受到争议的)

以下主要说一说zookeeper的高一致性

Zookeeper使用了一种称为Zab(Zookeeper Atomic Broadcast)的协议作为其一致性复制的核心,Zookeeper的实现是有Client、Server构成,Server端提供了一个一致性复制、存储服务。

Server端很多其它的是存储一些数据的状态,而非数据内容本身,因此Zookeeper能够作为一个小文件系统使用。数据状态的存储量相对不大。全然能够所有载入到内存中,从而极大地消除了通信延迟。



对于分布式系统的一致性问题,事实上也就是在分布式环境下更新操作的顺序问题。相应于学术术语也就是全序(她是集合其中的一个概念)
 
那么怎样保证分布式环境下更新操作的顺序呢?这个问题在在全然的分布式环境下是不可能的,可是能够通过限定环境条件来解决问题。

例如以下:

 
1。通过物理时钟(即绝对參照系)能够实现,可是前提是在不同地方的物理时钟没有误差 

这个差点儿是不可能的, 由于全部的物理时钟同步。古代关于时钟另一个故事(參见罗辑思维-击溃牛顿的钟表匠)。只是现代google公布的spanner的核心技术中包括用卫星进行全球的datacenter之间的时钟同步
 
2。通过严格的因果关系来确定顺序。对于參照系, 选取不同的參照系可能会有不同的顺序的推断, 可是对于严格的因果关系, 不管在什么參照系下都不会改变的。
 
有人用狭义相对论来解释感觉非常形象,狭义告诉我们时空中的事件并不存在一个始终如一的全序关系, 不同的观察者对两个事件谁先发生可能具有不同的看法. 当且仅当事件e2是由事件e1引起的时候, 事件e1和e2之间才存在一个先后关系
 
对于进程间的事件, 假设两个进程没有关联或通信, 是无法推断顺序的 

仅仅有当两个进程间产生通信后, 产生因果关系, 从而来确定顺序 

如p1为发消息给Q事件, 而q2为从P收到消息事件, 则p1和q2间有明白的因果关系, 故能够说p1 "happen before" q2, 即p1 –> q2
 
对于没有明白的因果关系的事件, 无法推断其顺序, 仅仅能觉得他们属于并发。

 
总结:
    对于zookeeper来说,由于其是master-slave结构。

所以在存在leader正常工作的情况下。由leader作为唯一的參照物就可以。可是当leader down掉选举发生的过程中。或者出现多个leader的情况下就没有办法了。

而zookeeper正是运用fastpaxos和zab来保证这中一致性。总之,zookeeper利用在全序列的思想下利用以ZAB为协议的fastpaxos算法实现了强一致性。

參考:

版权声明:本文博主原创文章,博客,未经同意不得转载。

了解了解你自己的话zookeeper(从那时起,纠正了一些说法在线)的更多相关文章

  1. Zookeeper 的学习与运用

    引子 云计算越来越流行的今天,单一机器处理能力已经不能满足我们的需求,不得不采用大量的服务集群.服务集群对外提供服务的过程中,有很多的配置需要随时更新,服务间需要协调工作,这些信息如何推送到各个节点? ...

  2. Zookeeper的基础知识

    1.Zookeeper是什么? 引用官方的说法:“Zookeeper是一个高性能,分布式的,开源分布式应用协调服务.它提供了简单原始的功能,分布式应用可以基于它实现更高级 的服务.它被设计为易于编程, ...

  3. zookeeper的集群介绍、搭建、环境、安装

    zookeeper是本身是一种分布式协调服务(英文意思动物园园长因为Hadoop就是一个动物园,storm.hadoop.kafkaka.hbaser都是基于zookeeper开发的) 原理:Zook ...

  4. Zookeeper基本使用(转)

    一.Zookeeper架构 云计算越来越流行的今天,单一机器处理能力已经不能满足我们的需求,不得不采用大量的服务集群.服务集群对外提供服务的过程中,有很多的配置需要随时更新,服务间需要协调工作,这些信 ...

  5. 3.0 zookeeper的集群介绍、搭建、环境、安装

    zookeeper是本身是一种分布式协调服务(英文意思动物园园长因为Hadoop就是一个动物园,storm.hadoop.kafkaka.hbaser都是基于zookeeper开发的) 原理:Zook ...

  6. 初识 Zookeeper

    云计算越来越流行的今天,单一机器处理能力已经不能满足我们的需求,不得不采用大量的服务集群.服务集群对外提供服务的过程中,有很多的配置需要随时更新,服务间需要协调工作,这些信息如何推送到各个节点?并且保 ...

  7. Dubbo系列(1)_背景介绍和基本情况

    一.本文目的         主要介绍Dubbo的产生背景和需要解决的问题 二.产生背景         随着大数据量.高并发的互联网应用越来越多,单机系统已经无法满足系统的需要.通过SOA搭建一个分 ...

  8. kafka的高可用和一致性探究

    一.kafka基础 本篇文章讨论的kafka版本是目前最新版 0.10.1.0. 1.1 kafka种的KafkaController 所有broker会通过ZooKeeper选举出一个作为Kafka ...

  9. Kafka leader副本选举与消息丢失场景讨论

    如果某个broker挂了,leader副本在该broker上的分区就要重新进行leader选举.来简要描述下leader选举的过程 1.4.1 KafkaController会监听ZooKeeper的 ...

随机推荐

  1. 玩转Web之JavaScript(四)-----javaScript语法总结(四) JS中的函数

    1.function/return   function用来定义函数(位于head部分),函数包含着一些代码,这些代码只能被事件激活,或者在函数被调用时才会执行.   return 用来从函数中返回值 ...

  2. aauto攫http数据

    说明:灵巧使用上述数据的抓取网页简单的例子. 样例:想把某站点的数据抓回来.然后保存在数据库里边. 步骤:1.打开sql.new一个数据库Test.新建一个表test. 2.打开快手.准备抓数据,以这 ...

  3. 恶意软件"跨平台" 小心钱包很受伤

    什么是跨平台攻击? 举例来说.就像网络诈骗犯为了避开电子商务平台的监控.会在微博上发消息.百度上撒网,腾讯上联系,最后在淘宝上交易.这样的跨平台操作的模式会大大添加犯罪过程监控和取证的难度.而跨平台攻 ...

  4. UVa 10491 - Cows and Cars

    題目:有m+n個們,每個門後面有牛或者車:有n仅仅牛,m輛車,你選擇当中1個: 然後打開当中的k你沒有選中的門後是牛的,問你改變選時得到車的概率. 說明:數學題,概率.全概率公式就可以: 說明:第10 ...

  5. Error opening zip file or JAR manifest missing : D:\play-1.2.5/framework/play-1.2.5.jar

    play框架写的项目,在eclipse中导入.build-path中全部jar包都加入.执行程序,出现: Error occurred during initialization of VM agen ...

  6. Javascript继承之最佳实践

    尊重原创,转载请注明出处:http://blog.csdn.net/zoutongyuan 什么是继承? 继承是面向对象最显著的一个特性.继承是从已有的类中派生出新的类,新的类能吸收已有类的数据属性和 ...

  7. 设计模式16:迭代模式(Iterator)

    迭代模式: 它提供了一种方法没有对象的顺序访问聚合对象的暴漏底层的细节. Provide a way to access the elements of an aggregate object seq ...

  8. Maven: NoClassDefFoundError: org/codehaus/plexus/classworlds/launcher/Launcher

    为了和团队开发环境保持一致,须要 在Ubuntu上安装maven2.2.1,引文我之前已经用apt-get命令安装了3.3的maven.在运行maven命令时报错: Maven: NoClassDef ...

  9. C#动态调用WCF接口

    C#动态调用WCF接口 写在前面 接触WCF还是它在最初诞生之处,一个分布式应用的巨作. 从开始接触到现在断断续续,真正使用的项目少之又少,更谈不上深入WCF内部实现机制和原理去研究,最近自己做一个项 ...

  10. Linux(CentOS)系统下安装好apache(httpd)服务后,其他电脑无法访问的原因

    原文:Linux(CentOS)系统下安装好apache(httpd)服务后,其他电脑无法访问的原因 今天试了下在虚拟机上利用CentOS系统的yum命令安装好了httpd(apache2.4.6), ...