Zookeeper数据存储总结

Zookeeper快照文件和事物操作文件以文件的形式存储在硬盘上，以快照文件为主，日志文件为辅。因为当对内存数据进行变更的时候，会保证将事务操作记入log日志，而snapshot只是内存某一个时刻影像，为了性能takeSnapshot生成snapshot并不是实时的，而是由后台线程根据一定规则处理的。详细可参考上一篇文章。

快照文件和事物操作文件在磁盘上如下所示：

-rw-rw-r-- 1 ysl ysl  67108880 10月 23 17:43 log.1

-rw-rw-r-- 1 ysl ysl  67108880 11月  7 16:45 log.9b6

-rw-rw-r-- 1 ysl ysl  67108880 1月  15 17:22 log.c99a

-rw-rw-r-- 1 ysl ysl  67108880 1月  16 09:10 log.ca33

-rw-rw-r-- 1 ysl ysl  67108880 1月  17 11:09 log.ca45

-rw-rw-r-- 1 ysl ysl  67108880 1月  18 12:00 log.ca4c

-rw-rw-r-- 1 ysl ysl  67108880 1月  24 17:59 log.ca52

-rw-rw-r-- 1 ysl ysl  67108880 11月  8 16:34 log.ca8

-rw-rw-r-- 1 ysl ysl  67108880 11月  9 17:32 log.d16

-rw-rw-r-- 1 ysl ysl  67108880 1月  30 15:44 log.d172

-rw-rw-r-- 1 ysl ysl  67108880 2月   1 11:52 log.d18d

-rw-rw-r-- 1 ysl ysl  67108880 2月   2 10:10 log.d1aa

-rw-rw-r-- 1 ysl ysl  67108880 11月 10 16:20 log.d88

-rw-rw-r-- 1 ysl ysl       296 10月 23 12:20 snapshot.0

-rw-rw-r-- 1 ysl ysl      6746 11月 13 09:14 snapshot.104d

-rw-rw-r-- 1 ysl ysl      6746 11月 14 11:00 snapshot.1461

-rw-rw-r-- 1 ysl ysl      5059 10月 24 12:11 snapshot.14f

-rw-rw-r-- 1 ysl ysl      5349 10月 25 10:04 snapshot.20a

-rw-rw-r-- 1 ysl ysl      5277 10月 25 10:21 snapshot.210

-rw-rw-r-- 1 ysl ysl      5277 10月 27 14:10 snapshot.21c

-rw-rw-r-- 1 ysl ysl      5349 10月 30 09:17 snapshot.30d

-rw-rw-r-- 1 ysl ysl      5277 10月 30 11:21 snapshot.313

以上文件名是以log.或者snapshot.加上一串long的16进制数字组成，这个long值就是zxid服务器端事务id。Snapshot文件名生成逻辑在 FileTxnSnapLog.save方法中，如下：

    public void save(DataTree dataTree,

            ConcurrentHashMap<Long, Integer> sessionsWithTimeouts)

        throws IOException {

        long lastZxid = dataTree.lastProcessedZxid;

        File snapshotFile = new File(snapDir, Util.makeSnapshotName(lastZxid));

	........

    }

Util.makeSnapshotName用于生成文件名称

    public static String makeSnapshotName(long zxid) {

	//返回文件名称

        return "snapshot." + Long.toHexString(zxid);

    }

日志Log文件生成，在FileTxnLog.apend方法中，如果被执行了rollLog方法，那么文件输入流会被清空，这里会创建一个新的文件

if (logStream==null) {

       if(LOG.isInfoEnabled()){

            LOG.info("Creating new log file: log." +

                    Long.toHexString(hdr.getZxid()));

       }

       logFileWrite = new File(logDir, ("log." +

               Long.toHexString(hdr.getZxid())));

       fos = new FileOutputStream(logFileWrite);

       logStream=new BufferedOutputStream(fos);

       .........

    }

当客户端请求一个事物操作时，leader的PrepRequestProcessor处理器会对请求进行预处理包括生成zxid设置到请求中去，zxid的生成是通过调用ZookeeperServer.getNextZxid生成：

    long getNextZxid() {

        return hzxid.incrementAndGet();

    }

它是hzxid一个自增的long值，有没有奇怪这个变量取名叫做hzixd多了一个h， h我的理解是high的缩写代表64位long的高32位。Zxid的分为两部分高32位用来存储每次选举的时代epoch，低32位用来存储事务请求的自增序列。所谓选举时代就是一个数值，标记代表一次选举，跟年份一样是自增的。每次服务器启动或者zookeeper异常导致重新选举都会在原来epoch值加一代表一个新的时代，工具类ZxidUtils用来操作前32或者后32位。比如现在epoch=4代表经历了4次选举，如果重新选举后epoch值为5，通过工具类的zxid=hzxid=ZxidUtils.makeZxid(5,0)= 21474836480,此时低32重新开始值为0，如果这时来了新的请求值为zxid=21474836481=21474836480+ 1 = ZxidUtils.makeZxid(5, 1)。

public class ZxidUtils {

	static public long getEpochFromZxid(long zxid) {

		return zxid >> 32L;

	}

	static public long getCounterFromZxid(long zxid) {

		return zxid & 0xffffffffL;

	}

	static public long makeZxid(long epoch, long counter) {

		return (epoch << 32L) | (counter & 0xffffffffL);

	}

	static public String zxidToString(long zxid) {

		return Long.toHexString(zxid);

	}

}

Zookeeper数据存储总结的更多相关文章

zookeeper 数据存储特点
zookeeper 和elasticseaarch 数据存储特点: 1.zookeeper; [Zookeeper提供的一致性是弱一致性,首先数据的复制有如下规则:zookeeper确保对znode树 ...
【分布式】Zookeeper数据与存储
一.前言前面分析了Zookeeper对请求的处理,本篇博文接着分析Zookeeper中如何对底层数据进行存储,数据存储被分为内存数据存储于磁盘数据存储. 二.数据与存储 2.1 内存数据 Zooke ...
Zookeeper数据与存储
一.前言前面分析了Zookeeper对请求的处理,本篇博文接着分析Zookeeper中如何对底层数据进行存储,数据存储被分为内存数据存储于磁盘数据存储. 二.数据与存储 2.1 内存数据 Zooke ...
zookeeper原理解析-数据存储
Zookeeper内存结构 Zookeeper是怎么存储数据的,什么机制保证集群中数据是一致性,在网络异常,当机以及停电等异常情况下恢复数据的,我们知道数据库给我们提供了这些功能,其实zookeepe ...
Zookeeper系列六：服务器角色、序列化与通信协议、数据存储、zookeeper总结
一.服务器角色 1. Leader 1)事务请求的唯一调度者和处理者.保证事务处理的顺序性事务请求:导致数据一致性的请求(数据发生改变).如删除一个节点.创建一个节点.设置节点数据,设置节点权限就是 ...
探索etcd，Zookeeper和Consul一致键值数据存储的性能
这篇博文是探索三个分布式.一致性键值数据存储软件性能的系列文章中的第一篇:etcd.Zookeeper和Consul,由etcd团队所写,可以让我们全面地了解如何评估三个分布式一致存储软件的性能.翻译 ...
1.zookeeper原理解析-数据存储之Zookeeper内存结构
Zookeeper是怎么存储数据的,什么机制保证集群中数据是一致性,在网络异常,当机以及停电等异常情况下恢复数据的,我们知道数据库给我们提供了这些功能,其实zookeeper也实现了类似数据库的功能. ...
环境搭建 Hadoop+Hive(orcfile格式)+Presto实现大数据存储查询一
一.前言 Hadoop简介 Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关 ...
网易大数据之数据存储：HDFS
一.HDFS基础架构 1.HDFS特点:水平扩展.高容错性.廉价硬件.开源生态系统 2.Hadoop生态圈 1).分布式存储系统(HDFS),2).资源管理框架(YARN),3).批处理框架(MapR ...

随机推荐

PS想象的力量无限大，设计师的脑洞无限大！
我(nemanjasekulic)一直对魔法与科幻感兴趣,但是,现实中,它们并不存在.我所做的是尽量体现一切都是可能的,表达一种没有约束的理想概念. 编辑:千锋UI设计
crontab定时任务操作
一.查看定时任务 crontab -l 二.添加定时任务 crontab -e (一)执行外部链接 //每隔10分钟执行1次 */ * * * * /usr/bin/curl "http:/ ...
Reactor 模型（一）基本并发编程模型
Reactor 模型(一)基本并发编程模型 Netty 系列目录 (https://www.cnblogs.com/binarylei/p/10117436.html) 在讲解 Reactor 线程模 ...
KBMMW 4.80.00 发布
一大波更新来了. 4.80.00 March 30 2015 Important notes (changes that may break existing code) ======= ...
说说wee sing（ZZ）
我自己在当当上买过wee sing,也在网上下了wee sing 的DVD,也借过同事在淘宝上买的Wee sing 套装(9cd + 5DVD).所以对这套资料还是很熟悉的. 淘宝上的套装卖 ...
2018.10.23 NOIP模拟 “新”的家园（缩图+dijksta/spfa）
传送门考试70分骗分写挂了=30分=全场最低. 哎今天230垫底了. 这题出的挺好. 对于非关键点直接缩点. 每次把要查的insertinsertinsert进缩好的图里面跑spfa/dijkstr ...
2018.09.27 bzoj2510: 弱题（概率dp+循环矩阵优化）
传送门简单概率dp. 显然每次转移的式子可以用一个矩阵表示出来: 这个是循环矩阵. 因此只用维护第一行快速幂一波就行了. 代码: #include<bits/stdc++.h> #def ...
java多线程同步（转）
原文地址:http://developer.51cto.com/art/201509/490965.htm 一.场景因为当我们有多个线程要同时访问一个变量或对象时,如果这些线程中既有读又有写操作时, ...
C#操作Excel(创建、打开、读写、保存)几种方法的总结
在.NET开发中,不管是web程序还是桌面软件(尤其是涉及数据库操作的MIS系统等),常常需操作Excel,如导出数据到Excel,读取Excel中数据到程序中等.总结起来,其操作不外乎创建.打开.读 ...
MapGIS Mobile开发
1. 先将Android开发环境配置好(包括Java + Eclipse + Android SDK) 2. 加载API类库(运行MapGIS 10 AndroidSDK.exe可以加载Mobile框 ...

Zookeeper数据存储总结

Zookeeper数据存储总结的更多相关文章

随机推荐

热门专题