kazoo python zookeeper 选主
本文讲述基于zookeeper选主与故障切换的方法。我们的例子使用的是python。
使用的库是kazoo,安装方式
pip install kazoo
应用场景:
- 多个实例部署,但不是“去中心化”的部署方式;
- 有且只有一个节点作为master,履行master的职责,在例子中是注册调度器;
- 其他实例作为slave,不提供调度功能,但是在master节点挂掉之后,可以重新进行选主调度。
1、注册调度器
我们只给出伪代码,简单的打印调度器注册结果。
# -*- coding:utf-8 -*- # 调度器注册和关闭
# 模拟主节点的职责
class MyScheduler(object): # 注册调度器
def init_scheduler(self):
print '########## 开启调度器成功 ############' # 关闭调度器
def stop_scheduler(self):
print '########## 关闭调度器成功 ############'
2、选主与故障切换代码
1)使用add_listener注册监听器,监听zookeeper会话超时,Session Expired,否则在会话超时的场景中会出现锁不一致的问题,可以参看这篇文章。
- 会话超时之后,我们要重新建立Session,在我们的例子里,会循环直到Session重新建立。
- 重新注册Watcher,因为Watcher会随着Session失效而失效。在我们的例子里,通过执行get_children重新注册了Watcher。
2)向zookeeper注册自己,使用参数makepath=True级联创建节点;使用参数ephemeral=True, sequence=True参数,也就是创建临时有序节点:
- 当实例挂掉,session断开,注册的节点会自行消失
- 有序节点,会节点后添加一个有序编号
3)注册Watcher,观察/dmonitor/master的子节点,当发生以下事件时:
- Created:新增子节点
- Deleted:删除子节点
- Changed:子节点数据变化
- Child:子节点的下一级节点
进行重新选主。
# -*- coding:utf-8 -*- import socket
import traceback
from kazoo.client import KazooClient
from kazoo.client import KazooState
from MyScheduler import MyScheduler class HAMaster(object): def __init__(self):
self.path = '/dmonitor/master'
self.scheduler = MyScheduler()
self.zk = KazooClient('10.93.21.21:2181,10.93.18.34:2181,10.93.18.35:2181', timeout=10)
self.zk.start()
self.zk.add_listener(self.my_listener)
self.is_leader = False def create_instance(self):
instance = self.path + '/' + socket.gethostbyname(socket.gethostname()) + '-'
self.zk.create(path=instance, value="", ephemeral=True, sequence=True, makepath=True) # 选主逻辑: master节点下, 所有ephemeral+sequence类型的节点中, 编号最大的获得领导权.
def choose_master(self):
print "########## 选主开始 ############"
instance_list = self.zk.get_children(path=self.path, watch=self.my_watcher)
instance = max(instance_list).split('-')[0]
# 本实例获得领导权
if instance == socket.gethostbyname(socket.gethostname()):
if not self.is_leader:
self.scheduler.init_scheduler()
self.is_leader = True
print "######### 我被选为master, 我以前不是master, 注册调度 ##########"
else:
print "######### 我被选为master, 我以前是master, 不再注册调度 ##########"
# 本实例没有获得领导权
else:
if self.is_leader:
self.scheduler.stop_scheduler()
self.is_leader = False
print "######### 我被选为slave, 我以前不是slave, 关闭调度 ##########"
else:
print "######### 我被选为slave, 我以前是slave, 不再关闭调度 ##########"
print "########## 选主完成 ############" def my_listener(self, state):
if state == KazooState.LOST:
print "########## 会话超时:KazooState.LOST ############"
while True:
try:
self.create_instance()
self.zk.get_children(path=self.path, watch=self.my_watcher)
print "########## 会话超时:重建会话完成! ############"
break
except Exception, _:
traceback.print_exc()
elif state == KazooState.SUSPENDED:
print "########## 会话超时:KazooState.SUSPENDED ############"
elif state == KazooState.CONNECTED:
print "########## 会话超时:KazooState.CONNECTED ############"
else:
print "########## 会话超时:非法状态 ############" def my_watcher(self, event):
if event.state == "CONNECTED" and event.type == "CREATED" or event.type == "DELETED" or event.type == "CHANGED" or event.type == "CHILD":
print "########## 监听到子节点变化事件 ############"
self.choose_master()
else:
print "########## 监听到未识别的事件 ############"
3、测试一下
测试代码如下
# -*- coding:utf-8 -*-
import time
from HAMaster import HAMaster ha = HAMaster()
# 向zk注册自己
ha.create_instance()
# 进行选主
ha.choose_master() while 1:
time.sleep(10)
运行这个脚本,模拟如下几个场景:
1)初始选主
顺序在两台机器上启动测试脚本。
client10
[data_monitor@bigdata-arch-client10 zookeeper]$ python run.py
client11
[data_monitor@bigdata-arch-client11 zookeeper]$ python run.py
client10输出
[data_monitor@bigdata-arch-client10 zookeeper]$ python run.py
########## 选主开始 ############
########## 开启调度器成功 ############
######### 我被选为master, 我以前不是master, 注册调度 ##########
########## 选主完成 ############
########## 监听到子节点变化事件 ############
########## 选主开始 ############
######### 我被选为master, 我以前是master, 不再注册调度 ##########
########## 选主完成 ############
client11输出
[data_monitor@bigdata-arch-client11 zookeeper]$ python run.py
########## 选主开始 ############
######### 我被选为slave, 我以前是slave, 不再关闭调度 ##########
########## 选主完成 ############
可以看到,client10倍选为主节点并注册调度器,client11作为slave节点。
2)主实例挂掉
我们把client10上的实例kill掉。
client10上不再输出
client11上总体输出如下
[data_monitor@bigdata-arch-client11 zookeeper]$ python run.py
########## 选主开始 ############
######### 我被选为slave, 我以前是slave, 不再关闭调度 ##########
########## 选主完成 ############
########## 监听到子节点变化事件 ############
########## 选主开始 ############
########## 开启调度器成功 ############
######### 我被选为master, 我以前不是master, 注册调度 ##########
########## 选主完成 ############
可以看到监听到节点的变化,并进行了重新选主,client11被选为主节点(只剩他了)并注册了调度器。
tips:观察到节点变化的实效性是通过timeout=10参数控制的,也就是超过10s session不能维持就会认为实例挂了,zookeeper会删除节点。
kazoo python zookeeper 选主的更多相关文章
- zookeeper curator选主(Leader)
在分布式系统设计中,选主是一个常见的场景.选主是一个这样的过程,通过选主,主节点被选择出来控制其他节点或者是分配任务. 选主算法要满足的几个特征: 1)各个节点均衡的获得成为主节点的权利,一旦主节点被 ...
- 聊聊Zookeeper应用场景、架构设计、选主机制
Zookeeper作为一个分布式协调系统提供了一项基本服务:分布式锁服务,分布式锁是分布式协调技术实现的核心内容.像配置管理.任务分发.组服务.分布式消息队列.分布式通知/协调等,这些应用实际上都是基 ...
- Zookeeper笔记之使用zk实现集群选主
一.需求 在主从结构的集群中,我们假设硬件机器是很脆弱的,随时可能会宕机,当master挂掉之后需要从slave中选出一个节点作为新的master,使用zookeeper可以很简单的实现集群选主功能. ...
- 简述 zookeeper 基于 Zab 协议实现选主及事务提交
Zab 协议:zookeeper 基于 Paxos 协议的改进协议 zookeeper atomic broadcast 原子广播协议. zookeeper 基于 Zab 协议实现选主及事务提交. 一 ...
- 使用Kazoo操作ZooKeeper服务治理
单机服务的可靠性及可扩展性有限,某台服务宕机可能会影响整个系统的正常使用:分布式服务能够有效地解决这一问题,但同时分布式服务也会带来一些新的问题,如:服务发现(新增或者删除了服务如何确保能让客户端知道 ...
- kafka分区选主机制
Kafka Partition Leader选主机制 https://blog.csdn.net/qq_27384769/article/details/80115392 kafka leader选举 ...
- Etcd 使用场景:通过分布式锁思路实现自动选主
分布式锁?选主? 分布式锁可以保证当有多台实例同时竞争一把锁时,只有一个人会成功,其他的都是失败.诸如共享资源修改.幂等.频控等场景都可以通过分布式锁来实现. 还有一种场景,也可以通过分布式锁来实现, ...
- python开发_tkinter_窗口控件_自己制作的Python IDEL_博主推荐(二)
在上一篇blog:python开发_tkinter_窗口控件_自己制作的Python IDEL_博主推荐 中介绍了python中的tkinter的一些东西,你可能对tkinter有一定的了解了.这篇b ...
- ES选主策略
ES版本5.6.3 1.整个流程的开始,实在node启动后触发的,Node.java中start()方法,通过调用ZenDiscovery.java中的doStart()方法,之后会调用startIn ...
随机推荐
- AT&T汇编语言学习:利用c库、文件读写
AT&T汇编.调用C库函数.读/写文件 d0321:更新读文件代码(图片)以后会更新代码版. d0329:汇编文本读取.简单动画. ============================== ...
- WeTest+微信:小程序云端测试系统上线
日前,微信新增小程序测试系统,可便于开发者检测小程序缺陷,评估小程序产品质量.在小程序发布之前,开发者可将小程序代码提交到测试系统,在不同型号的手机真机上运行,执行完毕后自动生成测试报告.小程序云端测 ...
- JavaScript 的使用基础总结②DOM
HTML DOM 通过 HTML DOM,可访问 JavaScript HTML 文档的所有元素. 当网页被加载时,浏览器会创建页面的文档对象模型(Document Object Model). HT ...
- 【Alpha阶段】第五次 Scrum Meeting
每日任务 1.本次会议为第 五次 Meeting会议: 2.本次会议在上午09:35,大课间休息时间在陆大召开,召开本次会议为20分钟,汇报自己的任务和讨论接下来的任务: 一.今日站立式会议照 二.每 ...
- 团队作业8——第二次项目冲刺(Beta阶段)Day5--5.23
1.提供当天站立式会议照片一张 2.会议内容 讨论已完成的功能 对于界面,谈谈各自的看法 商定测试计划 用户需求进一步调研 3.工作安排 队员 今日任务 明日任务 贡献比 林燕 测试运行效果 根据测试 ...
- 201521123098 《Java程序设计》第11周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多线程相关内容. 1. 在编写类时,要有写构造函数和各变量的getter()和setter()方法的习惯: 2. 同步操作时要记得在 ...
- 201521123113《Java程序设计》第13周学习总结
1. 本周学习总结 2. 书面作业 Q1. 网络基础 1.1 比较ping www.baidu.com与ping cec.jmu.edu.cn,分析返回结果有何不同?为什么会有这样的不同? 返回的结果 ...
- JDBC操作数据库之删除数据
删除数据使用的SQL语句为delete语句,如果删除图书id为1的图书信息,其SQL语句为: delete from book where id=1 在实际开发中删除数据通常使用PreparedSta ...
- composer设置忽略版本匹配
composer install 时遇到错误: Your requirements could not be resolved to an installable set of packages. 原 ...
- Mybatis逆向生成Mapper文件
本文参考博客 http://blog.csdn.net/for_my_life/article/details/51228098 1. 在resources根目录下添加generator.proper ...