Zookeeper入门概要
ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是Google Chubby的开源实现。ZooKeeper的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用;
分布式一致性特性:
顺序一致性:严格按照其发起顺序
原子性
单一视图:无论连接的是哪个ZK服务器,数据模型都是一致
可靠性
实时性:保证在一定的时间段内,Client最终能从Server读取到最新的数据状态
集群角色:
Leader (提供读和写服务)
Follower(提供读服务)
Observer(提供读服务,不参与Leader选举,也不参与写操作的『过半写成功』策略)
1.数据模型
树形结构,每个节点ZNode,通过其路径唯一标识,跟Unix文件系统有些类似。ZNode可存储少量数据(默认是1M,可以通过配置修改,不建议ZNode上存储大量数据),还存储了其Acl信息;
2.重要概念
节点
ZNode可以分为持久节点(persistent)和临时节点(ephemeral)两类;
Session
Client与Zookeeper之间的通信会创建一个Session,通过心跳检测和服务器保持有效的会话,有超时时间,集群会持久化连接的Session信息;
Watcher
事件监听器,用于监听znode事件(create、delete、update、get),一次性的,即触发一次就会被取消
3.ZK特性
1.读写模式(读性能好,写需要Leader进行请求广播并有半数以上成功的ACK — 『过半写成功』策略)
2.WAL和Snapshot(i.write-ahead-log:先写WAL, 然后再对内存中的数据做更新,然后向Client通知更新结果;ii.定期将内存中的目录树进行Snapshot,落地到磁盘上;)
3.FIFO(i.通信基于TCP;ii.请求是按照FIFO顺序)
4.Linearizability(有严格的偏序关系,更新操作是串行执行)
4.Client API
create、delete、exists、getData、setData、getChildren、sync、setAcl、getAcl
5.应用场景
1. 命名服务(NameService) :通过简单的名字来访问指定的HDFS机群
2. 配置管理(Configuration Management) :统一配置(比如Job的多个实例配置信息),也就是数据发布与订阅;
3. 组员管理(Group Membership):新增节点和Slave宕机的调整
4. 简单互斥锁(Simple Lock) :broadcast(会造成羊群效应(Herd Effect))
5. 互斥锁(Simple Lock without Herd Effect):next(临时的顺序结点)
6. 读写锁(Read/Write Lock) :多个读可以并发执行,但写读写写互斥
7. 屏障(Barrier) :等待多个进程完成各自的任务,然后继续往前进行下一步
8. 双屏障(Double Barrier):它可以用来同步一个任务的开始和结束,当有足够多的进程进入屏障后,才开始执行任务;当所有的进程都执行完各自的任务后,屏障才撤销;
ZooKeeper是一个典型的分布式数据一致性的解决方案。具有数据发布/订阅、负载均衡、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能;
6.ZAB协议
ZooKeeper并没有完全采用Paxos算法,而是使用了一种称为ZooKeeper Atomic Broadcast(ZAB,ZooKeeper原子广播协议)的协议作为其数据一致性的核心算法;
ZAB协议并不像Paxos算法和Raft协议一样,是通用的分布式一致性算法,它是一种特别为ZooKeeper设计的崩溃可恢复的原子广播算法。
ZAB协议的两种基本模式:崩溃恢复和消息广播;
崩溃恢复模式包括两个阶段:
i.Leader选举和数据同步;
ii.退出恢复模式后进入消息广播模式;
Leader选举:
利用ZooKeepr的强一致性,能够很好地保证在分布式高并发情况下节点的创建一定能够保证全局唯一性,即ZooKeeper将会保证客户端无法创建一个已经存在的ZNode;
实现过程:多个客户端请求创建同一个临时节点,那么最终一定只有一个客户端请求能够创建成功。利用这个特性,就能很容易地在分布式环境中进行Master选举了;
Leader(Master) 选举的具体步骤:
1、客户端连接时,在指定的目录(这里假定为"/leader")创建一个EPHEMERAL_SEQUENTIAL的节点,把内网的IP数据存入创建节点。
2、获取目录的子点节,并取得序列号最小的节点,我们把这个节点设置为leader。当此节点被删除时,证明leader断线。
3、其它机器监听leader节点,当leader节点的删除时,再取目录的最小子点节作为leader。
ZooKeeper原理及使用:http://www.wuzesheng.com/?p=2609
ZooKeeper原理与应用:https://www.jianshu.com/p/84ad63127cd1
Leader(Master)选举:https://blog.csdn.net/massivestars/article/details/53894551
Zookeeper入门概要的更多相关文章
- 分布式进阶(十六)Zookeeper入门基础
Zookeeper入门基础 前言 在Zookeeper中,znode是一个跟Unix文件系统路径相似的节点,可以往这个节点存储或获取数据.如果在创建znode时Flag设置为EPHEMERAL,那么当 ...
- zookeeper 入门知识
作为开启分布式架构的基石,除了必会还有的选么 自己的一些理解,有错误的话请一定要给予指正! 一.是什么? 分布式数据一致性的解决方案. 二.有什么用 数据的发布/订阅(配置中心) . 负载均衡(du ...
- 学习Zookeeper之第1章Zookeeper入门
第 1 章 Zookeeper入门 1.1 概述 1.2 特点 1.3 数据结构 1.4 应用场景 统一命名服务 统一配置管理 统一集群管理 服务器动态上下线 软负载均衡 1.5 下载地址 第 1 章 ...
- [转帖]Zookeeper入门看这篇就够了
Zookeeper入门看这篇就够了 https://my.oschina.net/u/3796575/blog/1845035 Zookeeper是什么 官方文档上这么解释zookeeper,它是一个 ...
- Zookeeper入门(一)之概述
今天主要讲这么几个方面? 1.分布式应用: 2.什么是Zookeeper: 3.使用Zookkeeper有什么好处: ZooKeeper是一种分布式协调服务,用于管理大型主机.在分布式环境中协调和管理 ...
- ZooKeeper入门(四)
入门:使用ZooKeeper的协调分布式应用 这个文档使你对ZooKeeper快速入门,它主要针对想尝试它的开发者.并且包含简单的单机的ZooKeeper服务的安装说明,一些验证是否运行的命令,和一个 ...
- Zookeeper 入门第一篇
转载原文地址: ZooKeeper学习总结 第一篇:ZooKeeper快速入门 ZooKeeper学习总结 第二篇:ZooKeeper深入探讨 ZooKeeper学习第一期---Zookeeper简单 ...
- java springboot整合zookeeper入门教程(增删改查)
java springboot整合zookeeper增删改查入门教程 zookeeper的安装与集群搭建参考:https://www.cnblogs.com/zwcry/p/10272506.html ...
- Zookeeper入门看这篇就够了!!
Zookeeper是什么 官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名 ...
随机推荐
- hdu_3466(01背包)
其实,就是让C商品的q不等于p,其他都相同,这时,你就会发现如果要买C商品的话,肯定得先买C商品,因为买C商品的代价最大.所以,我们可以按照qi-pi的顺序来确定大顺序.这里我们还可以用更严谨的方式来 ...
- Linux whatis命令失效 nothing appropriate
在虚拟机中安装Linux的时候,可能没有生成whatis的数据库,所以whatis的命令无法使用. 如果出现无法使用whatis命令失效,那就生成whatis数据库. 命令: /usr/sbin/ma ...
- ZooKeeper 原生API操作
zookeeper客户端和服务器会话的建立是一个异步的过程,也就是说在程序中,程序方法在处理完客户端初始化后立即返回(即程序继续往下执行代码,这样,在大多数情况下并没有真正的构建好一个可用会话,在会话 ...
- [CSP-S模拟测试]:彩球问题(记忆化搜索)
题目传送门(内部题91) 输入格式 第一行一个正整数$N$,表示颜色种类数. 第二行$N$个正整数$k[i],k[i]$表示第$i$种颜色的数量$(1\leqslant k[i]\leqslant 3 ...
- sql 查询每天数据
一 表 内数据存的是 ‘2017-09-08 15:13:59’这样格式 表 customer_mate_follow 时间字段 created_at 1, SELECT ,) as day, C ...
- HTTP头详解:
GET/mycode/2.gifHTTP/1.1 [表示发送的是GET请求,请求资源是/mycode/2.gif,协议HTTP/1.1] Host:localhost [主机] Connectio ...
- python - 代码调试的好帮手sys._getframe()
python 的调试,令人非常忧伤,通过将输出路径打印的方式,可以提高很大的方便性: import sys #coding=utf-8 def get_cur_info(): print sys._g ...
- Mysql登录报1045错误
MySQL在使用root密码登陆报 1045 ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password ...
- linux打包
1.打成tar包 sudo tar -zcf boot.tar /boot/ 2.打成zip包 sudo zip -r boot.zip ./*
- 【BW系列】SAP BW实时抽取ECC数据的实现
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[BW系列]SAP BW实时抽取ECC数据的实现 ...