Zookeeper入门概要
ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是Google Chubby的开源实现。ZooKeeper的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用;
分布式一致性特性:
顺序一致性:严格按照其发起顺序
原子性
单一视图:无论连接的是哪个ZK服务器,数据模型都是一致
可靠性
实时性:保证在一定的时间段内,Client最终能从Server读取到最新的数据状态
集群角色:
Leader (提供读和写服务)
Follower(提供读服务)
Observer(提供读服务,不参与Leader选举,也不参与写操作的『过半写成功』策略)
1.数据模型
树形结构,每个节点ZNode,通过其路径唯一标识,跟Unix文件系统有些类似。ZNode可存储少量数据(默认是1M,可以通过配置修改,不建议ZNode上存储大量数据),还存储了其Acl信息;
2.重要概念
节点
ZNode可以分为持久节点(persistent)和临时节点(ephemeral)两类;
Session
Client与Zookeeper之间的通信会创建一个Session,通过心跳检测和服务器保持有效的会话,有超时时间,集群会持久化连接的Session信息;
Watcher
事件监听器,用于监听znode事件(create、delete、update、get),一次性的,即触发一次就会被取消
3.ZK特性
1.读写模式(读性能好,写需要Leader进行请求广播并有半数以上成功的ACK — 『过半写成功』策略)
2.WAL和Snapshot(i.write-ahead-log:先写WAL, 然后再对内存中的数据做更新,然后向Client通知更新结果;ii.定期将内存中的目录树进行Snapshot,落地到磁盘上;)
3.FIFO(i.通信基于TCP;ii.请求是按照FIFO顺序)
4.Linearizability(有严格的偏序关系,更新操作是串行执行)
4.Client API
create、delete、exists、getData、setData、getChildren、sync、setAcl、getAcl
5.应用场景
1. 命名服务(NameService) :通过简单的名字来访问指定的HDFS机群
2. 配置管理(Configuration Management) :统一配置(比如Job的多个实例配置信息),也就是数据发布与订阅;
3. 组员管理(Group Membership):新增节点和Slave宕机的调整
4. 简单互斥锁(Simple Lock) :broadcast(会造成羊群效应(Herd Effect))
5. 互斥锁(Simple Lock without Herd Effect):next(临时的顺序结点)
6. 读写锁(Read/Write Lock) :多个读可以并发执行,但写读写写互斥
7. 屏障(Barrier) :等待多个进程完成各自的任务,然后继续往前进行下一步
8. 双屏障(Double Barrier):它可以用来同步一个任务的开始和结束,当有足够多的进程进入屏障后,才开始执行任务;当所有的进程都执行完各自的任务后,屏障才撤销;
ZooKeeper是一个典型的分布式数据一致性的解决方案。具有数据发布/订阅、负载均衡、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能;
6.ZAB协议
ZooKeeper并没有完全采用Paxos算法,而是使用了一种称为ZooKeeper Atomic Broadcast(ZAB,ZooKeeper原子广播协议)的协议作为其数据一致性的核心算法;
ZAB协议并不像Paxos算法和Raft协议一样,是通用的分布式一致性算法,它是一种特别为ZooKeeper设计的崩溃可恢复的原子广播算法。
ZAB协议的两种基本模式:崩溃恢复和消息广播;
崩溃恢复模式包括两个阶段:
i.Leader选举和数据同步;
ii.退出恢复模式后进入消息广播模式;
Leader选举:
利用ZooKeepr的强一致性,能够很好地保证在分布式高并发情况下节点的创建一定能够保证全局唯一性,即ZooKeeper将会保证客户端无法创建一个已经存在的ZNode;
实现过程:多个客户端请求创建同一个临时节点,那么最终一定只有一个客户端请求能够创建成功。利用这个特性,就能很容易地在分布式环境中进行Master选举了;
Leader(Master) 选举的具体步骤:
1、客户端连接时,在指定的目录(这里假定为"/leader")创建一个EPHEMERAL_SEQUENTIAL的节点,把内网的IP数据存入创建节点。
2、获取目录的子点节,并取得序列号最小的节点,我们把这个节点设置为leader。当此节点被删除时,证明leader断线。
3、其它机器监听leader节点,当leader节点的删除时,再取目录的最小子点节作为leader。
ZooKeeper原理及使用:http://www.wuzesheng.com/?p=2609
ZooKeeper原理与应用:https://www.jianshu.com/p/84ad63127cd1
Leader(Master)选举:https://blog.csdn.net/massivestars/article/details/53894551
Zookeeper入门概要的更多相关文章
- 分布式进阶(十六)Zookeeper入门基础
Zookeeper入门基础 前言 在Zookeeper中,znode是一个跟Unix文件系统路径相似的节点,可以往这个节点存储或获取数据.如果在创建znode时Flag设置为EPHEMERAL,那么当 ...
- zookeeper 入门知识
作为开启分布式架构的基石,除了必会还有的选么 自己的一些理解,有错误的话请一定要给予指正! 一.是什么? 分布式数据一致性的解决方案. 二.有什么用 数据的发布/订阅(配置中心) . 负载均衡(du ...
- 学习Zookeeper之第1章Zookeeper入门
第 1 章 Zookeeper入门 1.1 概述 1.2 特点 1.3 数据结构 1.4 应用场景 统一命名服务 统一配置管理 统一集群管理 服务器动态上下线 软负载均衡 1.5 下载地址 第 1 章 ...
- [转帖]Zookeeper入门看这篇就够了
Zookeeper入门看这篇就够了 https://my.oschina.net/u/3796575/blog/1845035 Zookeeper是什么 官方文档上这么解释zookeeper,它是一个 ...
- Zookeeper入门(一)之概述
今天主要讲这么几个方面? 1.分布式应用: 2.什么是Zookeeper: 3.使用Zookkeeper有什么好处: ZooKeeper是一种分布式协调服务,用于管理大型主机.在分布式环境中协调和管理 ...
- ZooKeeper入门(四)
入门:使用ZooKeeper的协调分布式应用 这个文档使你对ZooKeeper快速入门,它主要针对想尝试它的开发者.并且包含简单的单机的ZooKeeper服务的安装说明,一些验证是否运行的命令,和一个 ...
- Zookeeper 入门第一篇
转载原文地址: ZooKeeper学习总结 第一篇:ZooKeeper快速入门 ZooKeeper学习总结 第二篇:ZooKeeper深入探讨 ZooKeeper学习第一期---Zookeeper简单 ...
- java springboot整合zookeeper入门教程(增删改查)
java springboot整合zookeeper增删改查入门教程 zookeeper的安装与集群搭建参考:https://www.cnblogs.com/zwcry/p/10272506.html ...
- Zookeeper入门看这篇就够了!!
Zookeeper是什么 官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名 ...
随机推荐
- java文件断点续传的简单实现
一.概述 所谓断点续传,其实只是指下载,也就是要从文件已经下载的地方开始继续下载.在以前版本的HTTP协议是不支持断点的,HTTP/1.1开始就支持了.一般断点下载时才用到Range和Content- ...
- [spring jpa] 解决SimpleJpaRepository的多数据源配置问题
前言 前段时间使用spring jpa做了一个项目,由于涉及到了多个数据库,因此需要进行多数据源的配置.网上找了很多的资料,尝试着配置,都以失败告终.之后通过断点最终完成了多数据源的配置.这篇博客主要 ...
- js基本数据类型+判断数据类型方法
摘要:不管是什么类型的,Object.prototype.toString.call();都可以判断出其具体的类型,简单基本类型(String.Number.Boolean.Null.Undefine ...
- java学习之- 创建线程run和start特点
标签(空格分隔): run,start 为什么做run方法的覆盖? 1.Thread类用于描述线程,该类就定义一个功能用于存储线程要运行的代码,该存储功能就是run方法: 也就是说Thread种的ru ...
- JSON.stringify方法报错:Converting circular structure to JSON
别以为JSON.parse(JSON.stringify(data))做深拷贝无敌,对于以下这种情况,当你需要保留父级对象,即 对象存在循环引用,就会报错. var a = [ { "id& ...
- k8s 添加ingress 暴露服务
vim file.yaml apiVersion: extensions/v1beta1 kind: Ingress metadata: name: pgadmin labels: k8s-app: ...
- system系统调用返回值判断命令是否执行成功
system函数对返回值的处理,涉及3个阶段: 阶段1:创建子进程等准备工作.如果失败,返回-1. 阶段2:调用/bin/sh拉起shell脚本,如果拉起失败或者shell未正常执行结束(参见备注1) ...
- WCF 配置说明
关于WCF中的地址和绑定,需要补充一下. WCF中支持的传输协议包括HTTP.TCP.Peer network(对等网).IPC(基于命名管道的内部进程通信)以及MSMQ(微软消息队列),每个协议对应 ...
- HAProxy、Keepalived 在 Ocatvia 的应用实现与分析
目录 文章目录 目录 Amphora 启动 keepalived 启动 haproxy 最后 Amphora 创建一个 loadbalancer 需要占用一到两台 Amphora Instance 作 ...
- 快速入门分布式消息队列之 RabbitMQ(2)
目录 目录 前文列表 RabbitMQ 的特性 Message Acknowledgment 消息应答 Prefetch Count 预取数 RPC 远程过程调用 vhost 虚拟主机 插件系统 最后 ...