提一个问题先

  zxid有64位,分成两部分:

  高32位是Leader的epoch:选举时钟,每次选出新的Leader,epoch累加1

  低32位是在这轮epoch内的事务id:对于用户的每一次更新操作集群都会累加1。

  这么设计会存在什么问题?

  Zookeeper 的事务 ID 有可能会超过 32 位。

  epoch增长非常慢,超过32位需要非常久的时间,几乎可以忽略这个问题,但是事务 ID 似乎不行。我们来算下。

  如果我们每秒钟操作1000次 Zookeeper ,即 1k/s ops,那么

  2^32/(86400∗1000)≈49.7

  49.7天后,事务 ID 就将溢出,那溢出会发生什么,看代码:

 

  /**

  * create a proposal and send it out to all the members

  *

  * @param request

  * @return the proposal that is queued to send to all the members

  */

  public Proposal propose(Request request) throws XidRolloverException { /**

  * Address the rollover issue. All lower 32bits set indicate a new leader

  * election. Force a re-election instead. See ZOOKEEPER-1277

  */

  if ((request.zxid 0xffffffffffL) == 0xffffffffffL) {

  String msg = zxid lower 32 bits have rolled over, forcing re-election, and therefore new epoch start;

  shutdown(msg); throw new XidRolloverException(msg);

  }

  从上面的代码可以看到,

  Zookeeper 的 Leader 节点会throw new XidRolloverException(msg) 强制进行 re-election重新选举,

  即服务会停止一段时间,在一些场景下,这种情况过于频繁是不能容忍的,那我们来看看如何解决。

  如何解决?

  上面说了epoch增长速度慢到可以忽略它溢出的问题,那么可以重新设计 ZXID,

  设计成高 24 位用于 epoch,低 40 位用于 事务 ID 增长。

  我们再来算一下:

  2^40/(86400∗1000)≈12725.8即12725.8/365≈34.9年

  1k/s ops 的情况下, 34.9 年之后才会进行一次强制选举。

  设想不错,可以解决我们的问题,那我们继续。

  还有一个担心

  从操作系统的底层来说,对于32位操作系统,单次操作能处理的最长长度为32bit,而long类型8字节64bit,所以对long的读写都要两条指令才能完成(即每次读写64bit中的32bit)。

  为什么说这个,因为也许有人会把这个和 ZXID 的设计联想起来,上面的ZOOKEEPER-2784里面也提到了这个问题。

  However, i thought the ZXID islongtype, reading and writing the long type (anddoubletype the same) in JVM, is divided into high 32bit and low 32bit part of the operation, and because theZXIDvariable is not modified withvolatileand is not boxed for the corresponding reference type (Long/Double), so it belongs to [non-atomic operation]

  我大概翻译一下:

  ZXID 是 long 类型,32 bit 的 JVM 在对 long 读写时(和 double 类型一样),是分为高 32 位和 低 32 位两部分进行操作的,由于 ZXID 变量没有用 volatile 修饰,且也没有装箱为对应的引用类型(Long / Double),属于非原子操作。

  这位老哥担心对 ZXID 重新设计时把高 32 位和 低 32 位改成高 24 位和 低 40 位,可能会存在并发的问题。

  会不会有这个问题,我们先来看看源码:

  Iteratoriterator = servers.iterator(); long zxid = Long.valueOf(m.group(2)); int count = (int)zxid;// 0xFFFFFFFFL;

  int epoch = (int)Long.rotateRight(zxid, 32);// 32;

  注意这个 0xFFFFFFFFL,实际上后面的代码还有很多这种按位与的操作,就不贴出来了。

  翻了这一块的源码就可以知道,这个担心是多余的,关于ZXID的所有操作都是位操作而不是“=”的赋值操作,它不会造成JVM级别的并发问题。

  如何修改

  接下来我们就用源码中“位与”的方式,把 32 为改成 40 位。

  即:zxid按位于()0xffffffffffL(40位)获得zxid的后40位。

  注意要把count之前的int类型改为long类型,因为int为32bit,long为64bit,此时count有40位所以换成long。

  Iteratoriterator = servers.iterator(); long zxid = Long.valueOf(m.group(2)); // int count = (int)zxid;// 0xFFFFFFFFL;

  // int epoch = (int)Long.rotateRight(zxid, 32);// 32;

  long count = zxid 0xffffffffffL; int epoch = (int)Long.rotateRight(zxid, 40);// 40;

  后面还有多处类似的地方要修改,就不一一列出来了,

zookeeper篇-如何修改源码的更多相关文章

  1. zookeeper-如何修改源码-《每日五分钟搞定大数据》

    本篇文章仅仅是起一个抛砖迎玉的作用,举一个如何修改源码的例子.文章的灵感来自 ZOOKEEPER-2784. 提一个问题先 之前的文章讲过zxid的设计,我们先复习下: zxid有64位,分成两部分: ...

  2. openvswitch2.11.0修改源码后重新编译(2)

    一:前提 已经正常安装了SDN环境(mininet和openswitch2.11.0和Ryu) 使用前面教程安装环境SDN实验---使用git安装Mininet (一)测试ovs是否正常使用 1.ry ...

  3. WordPress安装篇(5):源码编译安装LNMP并部署WordPress

    与YUM方式安装相比,源码编译安装方式更灵活,安装过程中能自定义功能和参数,特别是在批量部署服务器又要求软件版本及配置一致时,源码编译安装的优势很明显.本文介绍如何通过源码编译方式安装Nginx1.1 ...

  4. Sentinel控制台1.8.3修改源码,修改配置后推送到Nacos

    目录 1. 接着上一篇 2. 思路 3. 下载Sentinel源码 4. 看Gateway里面读取的配置信息 5. 修改Sentinel控制台源码 6. 熔断规则测试 7. 限流规则测试 8. 打包使 ...

  5. Android5.1.1 - APK签名校验分析和修改源码绕过签名校验

    Android5.1.1 - APK签名校验分析和修改源码绕过签名校验 作者:寻禹@阿里聚安全 APK签名校验分析 找到PackageParser类,该类在文件“frameworks/base/cor ...

  6. 75篇关于Tomcat源码和机制的文章

    75篇关于Tomcat源码和机制的文章 标签: tomcat源码机制 2016-12-30 16:00 10083人阅读 评论(1) 收藏 举报  分类: tomcat内核(82)  版权声明:本文为 ...

  7. 设置ZooKeeper服务器地址列表源码解析及扩展

    设置ZooKeeper服务器地址列表源码解析及扩展 ZooKeeper zooKeeper = new ZooKeeper("192.168.109.130:2181",SESSI ...

  8. Windows7 64位环境6sv2.1大气传输模型修改源码添加国产高分卫星GF-1 GF-2光谱响应支持

    下面开始添加国产卫星光谱响应的支持: 以下主要参考文章“6S大气传输模型修改源码添加.自定义卫星光谱响应(以HJ-1B CCD为例)”网址:http://blog.csdn.net/sam92/art ...

  9. element-ui 修改源码实践 --tranfer

    1.element-ui 地址:https://github.com/ElemeFE/element 2.修改elelment-ui版本:2.2.2(请选择和项目相对应的版本) 3.修改内容:穿梭框组 ...

随机推荐

  1. PHP自定义函数返回多个值

    PHP自定义函数只允许用return语句返回一个值,当return执行以后,整个函数的运行就会终止. 有时要求函数返回多个值时,用return是不可以把值一个接一个地输出的. return语句可以返回 ...

  2. Map<String, String>循环遍历的方法

    Map<String, String>循环遍历的方法 Map<String, String>循环遍历的方法 Map<String, String>循环遍历的方法 下 ...

  3. python-计算器实现

    # 开发一个简单的python计算器# 实现加减乘除及括号优先级解析# 用户输入 1 - 2 * ( (60-30 +(-40/5) * (9-2*5/3 + 7 /3*99/4*2998 +10 * ...

  4. unity3d-小案例之角色简单漫游

    准备资源 我这里从网上下载一个角色模型,里面有一组动画.有站立.奔跑.杀怪等 我们来实现角色的前后左后移动,即键盘上的WSDA键,这里因为没有行走的动画.索性就用奔跑代替了!! 暂时先不计较代码冗余的 ...

  5. VMware Coding Challenge: Removing Duplicates Entries

    static LinkedListNode removeDuplicates(LinkedListNode list) { LinkedListNode cur = list; HashSet< ...

  6. liferay中数据库表的解析未完

    页面布局 1:表layout 主要的字段有: 字段 privateLayout 0表示的是公开的页面 字段 layoutId 如果在同一个社区中有很多的界面,layoutId表示各个界面,按照顺序排列 ...

  7. eclipse工具maven项目打包文件不是最新修改的

    1.问题描述:maven项目,完成一些功能开发后,在进行打包更新服务器系统时,本地eclipse工具对文件打成jar包操作,更新到服务器上没有修改的效果,包括打包整个工程为一个war包,也是有同样问题 ...

  8. Linux基础命令---diffstat

    diffstat 这个程序读取diff的输出,并显示每个文件的插入.删除和修改的直方图.Diffstat是一个用于检查大型复杂修补程序文件的程序.它从包含diff输出的一个或多个输入文件中读取,生成针 ...

  9. git仓库按时间、成员等维度分析统计

    git 按时间打印所有成员代码提交: git log --since ==2018-01-01 --until=2018-12-31 --format='%aN' | sort -u | while ...

  10. linux服务器管理员的12个有用的命令

    ifconfig: 在修改内核中已有的网络接口时,你会用到ifconfig命令.这个命令通常用于系统调校和调试,但同时也可以用于在启动过程中设置接口. netstat: 对于Linux用户来说这是一个 ...