zk系列一:zookeeper基础介绍
聊完kafka必不可少的需要再聊一聊zk了,下面开始
一、ZK是什么
ZooKeeper是分布式应用程序的高性能协调服务。它可以实现分布式的选主、统一配置管理,命名,分布式节点同步,分布式锁等分布式常用功能;它以path节点的形式保存数据,每个节点都可以存储数据,因为ZK只是分布式的协调者而不推荐做数据库,所以需要减少没必要的写操作,确保对外提供的服务高效、快速,因此其节点的最大容量限制为1M;
1、ZK的节点类型
- 持久节点 即客户端创建后不会随着客户端的下线而消失,会一直存在;
- 临时节点 即随着客户端的下线而被删除;这里需要说下的是,zk会给每个客户端创建一个session,且该session是会同步到集群其他节点的;
2、ZK的几个特征
- 顺序一致性 ===> 即客户端的更新将按发送顺序执行
- 原子性 ===> 即更新要么成功要么失败,没有中间状态
- 统一视图 ===> 无论连接到哪个服务器,客户端都将看到相同的服务视图,即集群内各节点对外展示的视图统一不会有偏差
- 可靠性 ===> 节点更新以后在下次操作它之前,该节点的数据不会发生变更
- 及时性 ===> 集群对外提供的客户视图保证在特定时间范围内是最新的,可以理解成最终一致性,某个节点发生编号后会在特定时间内同步到集群其他节点,这也呼应了统一视图的特征
3、常用命令
- create [-s] [-e] path data
-s 可选,表示创建的是序列节点,会给节点编号,可以在分布式集群环境下保证向同一个节点写入数据的安全性(不被覆盖)
-e 可选,表示创建的是临时节点
path 必填,表示期望创建的节点路径
data 必填,表示期望存储的数据,需要注意的是如果不用存数据该参数也不可缺省,可用""代替 - get path
获取path路径下的子节点信息 - set path data
设置path下存储的值 - delete path
删除path - sync path
获取path下集群一致性达成后的最终数据,即如果请求的是非leader节点需同步向leader请求数据
二、ZK的集群
zk是主从复制集群,一个leader多个follower,只有leader能写,其余节点只提供读功能,但是客户端是可以连接集群中任意节点的,当连接的是leader则直接写,当连接的是follower则会被转发到leader进行写操作;zk集群分为两种状态,一种为leader存活的可用状态,另一种为leader挂了的不可用状态(无主);当集群处于不可用状态即leader下线时,分为两种情况,一种是剩余存活节点的个数满足过半选举条件,此时会进行选主操作,过半通过即产生新的leader集群恢复成可用状态;另一种是剩余存活节点数不满足过半选举条件,如leader挂了后集群只剩两台机子了,这样会出现脑裂问题,会导致选主失败整个集群仍会处于不可用状态。需要注意的是第二种选主失败集群不可用的情况下,只是集群对外不可用,对应存活实例的进程仍然存在,直到有新的服务上线满足选主条件,从而使集群快速恢复到可用状态;下面通过图示直观展现:

集群间数据同步问题
zk集群由leader负责数据的增改操作,那么leader的数据同步到集群各节点是如何做到数据一致性的呢?zk采用的是最终一致性策略,通过ZAB协议实现,下面介绍ZAB协议
- ZAB(原子广播协议)
ZAB是zk特有的一致性协议,并非分布式通用的一致性协议,其基于Paxos演变而来;leader会为每个follower分配一个FIFO的队列,当leader接收到写请求时,会为写入节点分配Zxid,同时将其放入队列;follower按序从队列中取出对应信息向自身的磁盘写日志成功后向leader回一个ack;当leader收到ack的个数大于集群一半时即认为消息确认成功,执行commit操作;并向各follower发起将数据写到内存的操作,至此写入操作完成;
文字描述太难懂了,于是昨晚画了一个图来展示zk集群内的数据同步过程,如下:

总结:ZAB协议队列和广播以及两阶段提交来实现数据同步。通过队列的FIFO特性以及两阶段提交保证了数据同步的原子性;
通过广播给各个follower集群并且不要求每个follower都同步成功(过半)保证了集群间数据同步的高效性;
leader维护的队列也为最终一致性的策略提供了保证,leader会将所有的写请求都放入队列,follower按顺序消费最终必然会与leader保持数据一致
集群是如何选主的
当leader挂了后,集群中任意节点发现后都会进行选主投票,只要有一个节点触发投票那么集群中每个节点都会被动参与投票,因为集群各节点是互相连通的;zk集群第一次启动谁的ID大谁就是leader,后续集群出了问题重启的话,则谁的数据完整(Zxid大)谁是leader,如果保留的数据一样大则再比较节点自身的myId;
补充
Zxid指的是当前节点的事物id,数值越大表示该节点的数据同步情况越完整;myid指的是在创建zk集群的时候,我们给它配置的值
zk系列一:zookeeper基础介绍的更多相关文章
- 【Zookeeper系列】Zookeeper简单介绍(转)
原文链接:https://www.cnblogs.com/sunddenly/p/4033574.html 一.分布式协调技术 在给大家介绍ZooKeeper之前先来给大家介绍一种技术——分布式协调技 ...
- 大数据系列文章-Hadoop基础介绍(一)
Hadoop项目背景简介 2003-2004年,Google公开了部分GFS个Mapreduce思想的细节,以此为基础Doug Cutting等人用了2年的业余时间,实现了DFS和Mapreduce机 ...
- Git系列教程二 基础介绍
一.存储方式 如果让我们设计一个版本控制系统,最简单的方式就是每做一次更改就生成一个新的文件. 这样的方式太占用空间,所以传统的版本控制系统都是保存一个文件的某个版本的全部内容以及其他版本相对于这个版 ...
- zk系列-zookeeper的使用
zk支持java/c访问,java常用的有apache-zkclient.社区版的i0tec-zkclient.github.adyliu,apache-zkclient是zk自身提供的接口,i0te ...
- Hadoop系列-zookeeper基础
目前是刚刚初学完zookeeper,这篇文章主要是简单的对一些基本的概念进行梳理强化. zookeeper基础概念的理解 有时候计算机领域很多名词都是从一长串英文提取首字母缩写而来,但很不幸zooke ...
- Zookeeper系列一:Zookeeper基础命令操作
有些事不是努力就可以改变的,五十块的人民币设计的再好看,也没有一百块的招人喜欢. 前言 由于公司年底要更换办公地点,所以最近投了一下简历,发现面试官现在很喜欢问dubbo.zookeeper和高并发等 ...
- 【01】emmet系列之基础介绍
[01]emmet系列之基础介绍 [02]emmet系列之HTML语法 [03]emmet系列之CSS语法 [04]emmet系列之编辑器 [05]emmet系列之各种缩写 相关网址 官网:http: ...
- 【Hadoop离线基础总结】zookeeper的介绍以及集群环境搭建、网络编程和RPC的简单了解
ZooKeeper的介绍以及集群环境搭建.网络编程和RPC的简单了解 ZooKeeper介绍 概述 ZooKeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题.例如 ...
- 死磕 java同步系列之zookeeper分布式锁
问题 (1)zookeeper如何实现分布式锁? (2)zookeeper分布式锁有哪些优点? (3)zookeeper分布式锁有哪些缺点? 简介 zooKeeper是一个分布式的,开放源码的分布式应 ...
随机推荐
- session,cookie,jwt的简单使用
cookie的使用 https://blog.csdn.net/qq_58168493/article/details/122492358 session的使用 https://blog.csdn.n ...
- 修改窗体的Title
直接上代码 /// <summary> /// 获取窗体的名称 /// </summary> /// <param name="hWnd">&l ...
- 一文快速上手 Nacos 注册中心+配置中心!
Spring Cloud Alibaba 是阿里巴巴提供的一站式微服务开发解决方案,目前已被 Spring Cloud 官方收录.而 Nacos 作为 Spring Cloud Alibaba 的核心 ...
- 从代码到发包,一个程序全搞定!Gitea 推出软件包自托管功能 Package Registry
2022 年 7 月的最后一天,随着 Gitea 1.17.0 版本的正式发布,Gitea 开源社区推出了一项名为 Package Registry 的包管理功能,与 Gitea 代码仓库无缝集成,类 ...
- 使用SSH连接Windows Server
之前发过一篇在Windows Server上启用SSH服务器的文章.最近正好有这个需求,需要使用密钥免密登录服务器,试了一下,发现之前的方法不行了.需要再修正一些文件权限. 需要使用Repair-Au ...
- kube-scheduler 调度调优
文章转载自:https://www.kuboard.cn/learning/k8s-advanced/schedule/tuning.html kube-scheduler 是 Kubernetes ...
- CentOS6 配置阿里云 NTP 服务
本文以Centos 6.5为例介绍如何修改Linux实例时区,以及开启和配置Linux NTP服务,保证实例本地时间精确同步. 前提条件 NTP服务的通信端口为UDP 123,设置NTP服务之前请确保 ...
- MySQL学习(2)---MySQL数据类型
ps:此随笔基于mysql 5.7.*版本. 补充: UNSIGNED:所有整数类型都可以有一个可选(非标准)UNSIGNED属性.无符号类型可用于在列中仅允许非负数存在,或者当开发者需要该列的较大数 ...
- NSIS限制程序运行次数和使用日期
#七八年前写着玩的小东西,实际用途不大,但对刚接触nsis的新手来说应该还有一些帮助,包括创建控件,获取系统时间等,与诸位共勉! !system '>blank set/p=MSCF<nu ...
- Wine 安装迅雷5.8.14.176
测试过的系统版本:Kubuntu 22.04 测试过的Wine版本 Wine7.8 程序下载地址: https://pan.baidu.com/s/1pSgunVH3WtACssX5we3DdQ 提取 ...