Zookeeper数据存储总结

Zookeeper快照文件和事物操作文件以文件的形式存储在硬盘上，以快照文件为主，日志文件为辅。因为当对内存数据进行变更的时候，会保证将事务操作记入log日志，而snapshot只是内存某一个时刻影像，为了性能takeSnapshot生成snapshot并不是实时的，而是由后台线程根据一定规则处理的。详细可参考上一篇文章。

快照文件和事物操作文件在磁盘上如下所示：

-rw-rw-r-- 1 ysl ysl  67108880 10月 23 17:43 log.1

-rw-rw-r-- 1 ysl ysl  67108880 11月  7 16:45 log.9b6

-rw-rw-r-- 1 ysl ysl  67108880 1月  15 17:22 log.c99a

-rw-rw-r-- 1 ysl ysl  67108880 1月  16 09:10 log.ca33

-rw-rw-r-- 1 ysl ysl  67108880 1月  17 11:09 log.ca45

-rw-rw-r-- 1 ysl ysl  67108880 1月  18 12:00 log.ca4c

-rw-rw-r-- 1 ysl ysl  67108880 1月  24 17:59 log.ca52

-rw-rw-r-- 1 ysl ysl  67108880 11月  8 16:34 log.ca8

-rw-rw-r-- 1 ysl ysl  67108880 11月  9 17:32 log.d16

-rw-rw-r-- 1 ysl ysl  67108880 1月  30 15:44 log.d172

-rw-rw-r-- 1 ysl ysl  67108880 2月   1 11:52 log.d18d

-rw-rw-r-- 1 ysl ysl  67108880 2月   2 10:10 log.d1aa

-rw-rw-r-- 1 ysl ysl  67108880 11月 10 16:20 log.d88

-rw-rw-r-- 1 ysl ysl       296 10月 23 12:20 snapshot.0

-rw-rw-r-- 1 ysl ysl      6746 11月 13 09:14 snapshot.104d

-rw-rw-r-- 1 ysl ysl      6746 11月 14 11:00 snapshot.1461

-rw-rw-r-- 1 ysl ysl      5059 10月 24 12:11 snapshot.14f

-rw-rw-r-- 1 ysl ysl      5349 10月 25 10:04 snapshot.20a

-rw-rw-r-- 1 ysl ysl      5277 10月 25 10:21 snapshot.210

-rw-rw-r-- 1 ysl ysl      5277 10月 27 14:10 snapshot.21c

-rw-rw-r-- 1 ysl ysl      5349 10月 30 09:17 snapshot.30d

-rw-rw-r-- 1 ysl ysl      5277 10月 30 11:21 snapshot.313

以上文件名是以log.或者snapshot.加上一串long的16进制数字组成，这个long值就是zxid服务器端事务id。Snapshot文件名生成逻辑在 FileTxnSnapLog.save方法中，如下：

    public void save(DataTree dataTree,

            ConcurrentHashMap<Long, Integer> sessionsWithTimeouts)

        throws IOException {

        long lastZxid = dataTree.lastProcessedZxid;

        File snapshotFile = new File(snapDir, Util.makeSnapshotName(lastZxid));

	........

    }

Util.makeSnapshotName用于生成文件名称

    public static String makeSnapshotName(long zxid) {

	//返回文件名称

        return "snapshot." + Long.toHexString(zxid);

    }

日志Log文件生成，在FileTxnLog.apend方法中，如果被执行了rollLog方法，那么文件输入流会被清空，这里会创建一个新的文件

if (logStream==null) {

       if(LOG.isInfoEnabled()){

            LOG.info("Creating new log file: log." +

                    Long.toHexString(hdr.getZxid()));

       }

       logFileWrite = new File(logDir, ("log." +

               Long.toHexString(hdr.getZxid())));

       fos = new FileOutputStream(logFileWrite);

       logStream=new BufferedOutputStream(fos);

       .........

    }

当客户端请求一个事物操作时，leader的PrepRequestProcessor处理器会对请求进行预处理包括生成zxid设置到请求中去，zxid的生成是通过调用ZookeeperServer.getNextZxid生成：

    long getNextZxid() {

        return hzxid.incrementAndGet();

    }

它是hzxid一个自增的long值，有没有奇怪这个变量取名叫做hzixd多了一个h， h我的理解是high的缩写代表64位long的高32位。Zxid的分为两部分高32位用来存储每次选举的时代epoch，低32位用来存储事务请求的自增序列。所谓选举时代就是一个数值，标记代表一次选举，跟年份一样是自增的。每次服务器启动或者zookeeper异常导致重新选举都会在原来epoch值加一代表一个新的时代，工具类ZxidUtils用来操作前32或者后32位。比如现在epoch=4代表经历了4次选举，如果重新选举后epoch值为5，通过工具类的zxid=hzxid=ZxidUtils.makeZxid(5,0)= 21474836480,此时低32重新开始值为0，如果这时来了新的请求值为zxid=21474836481=21474836480+ 1 = ZxidUtils.makeZxid(5, 1)。

public class ZxidUtils {

	static public long getEpochFromZxid(long zxid) {

		return zxid >> 32L;

	}

	static public long getCounterFromZxid(long zxid) {

		return zxid & 0xffffffffL;

	}

	static public long makeZxid(long epoch, long counter) {

		return (epoch << 32L) | (counter & 0xffffffffL);

	}

	static public String zxidToString(long zxid) {

		return Long.toHexString(zxid);

	}

}

Zookeeper数据存储总结的更多相关文章

zookeeper 数据存储特点
zookeeper 和elasticseaarch 数据存储特点: 1.zookeeper; [Zookeeper提供的一致性是弱一致性,首先数据的复制有如下规则:zookeeper确保对znode树 ...
【分布式】Zookeeper数据与存储
一.前言前面分析了Zookeeper对请求的处理,本篇博文接着分析Zookeeper中如何对底层数据进行存储,数据存储被分为内存数据存储于磁盘数据存储. 二.数据与存储 2.1 内存数据 Zooke ...
Zookeeper数据与存储
一.前言前面分析了Zookeeper对请求的处理,本篇博文接着分析Zookeeper中如何对底层数据进行存储,数据存储被分为内存数据存储于磁盘数据存储. 二.数据与存储 2.1 内存数据 Zooke ...
zookeeper原理解析-数据存储
Zookeeper内存结构 Zookeeper是怎么存储数据的,什么机制保证集群中数据是一致性,在网络异常,当机以及停电等异常情况下恢复数据的,我们知道数据库给我们提供了这些功能,其实zookeepe ...
Zookeeper系列六：服务器角色、序列化与通信协议、数据存储、zookeeper总结
一.服务器角色 1. Leader 1)事务请求的唯一调度者和处理者.保证事务处理的顺序性事务请求:导致数据一致性的请求(数据发生改变).如删除一个节点.创建一个节点.设置节点数据,设置节点权限就是 ...
探索etcd，Zookeeper和Consul一致键值数据存储的性能
这篇博文是探索三个分布式.一致性键值数据存储软件性能的系列文章中的第一篇:etcd.Zookeeper和Consul,由etcd团队所写,可以让我们全面地了解如何评估三个分布式一致存储软件的性能.翻译 ...
1.zookeeper原理解析-数据存储之Zookeeper内存结构
Zookeeper是怎么存储数据的,什么机制保证集群中数据是一致性,在网络异常,当机以及停电等异常情况下恢复数据的,我们知道数据库给我们提供了这些功能,其实zookeeper也实现了类似数据库的功能. ...
环境搭建 Hadoop+Hive(orcfile格式)+Presto实现大数据存储查询一
一.前言 Hadoop简介 Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关 ...
网易大数据之数据存储：HDFS
一.HDFS基础架构 1.HDFS特点:水平扩展.高容错性.廉价硬件.开源生态系统 2.Hadoop生态圈 1).分布式存储系统(HDFS),2).资源管理框架(YARN),3).批处理框架(MapR ...

随机推荐

Codeforces 599B. Spongebob and Joke 模拟
B. Spongebob and Joke time limit per test 2 seconds memory limit per test 256 megabytes input standa ...
从Adobe调查问卷看原型设计工具大战
近年国内外原型设计工具新品频出,除了拥趸众多的老牌Axure在RP 8之后没有什么大的动作,大家都拼了命地在出新品.今天 inVision 的 Craft 出了 2.0 的预告视频,明天 Adobe ...
专2-第二课 Eclipse开发环境搭建
2.1下载Eclipse 2.2 安装C/C++版本的Eclipse 2.3 安装JDT插件开发Java程序 2.4 使用Eclipse开发驱动程序既然安装了eclipse来进行驱动学习,那么我们就 ...
系统调用方式文件编程-open
通过Linux系统调用函数编写应用程序,该应用程序实现文件的复制功能文件描述符--在Linux系统中,所有打开的文件也对应一个数字,这个数字由系统来分配. 1.打开文件--open 头文件:#inc ...
system v消息队列demo（未编译）
#include <stdio.h> #include <string.h> #include <stdlib.h> #include <errno.h> ...
2018.10.15 loj#6013. 「网络流 24 题」负载平衡（费用流）
传送门费用流sb题. 直接从sss向每个点连边,容量为现有物品量. 然后从ttt向每个点连边,容量为最后库存量. 由于两个点之间可以互相任意运送物品,因此相邻的直接连infinfinf的边就行了. ...
2018.09.28 牛客网contest/197/A因子（唯一分解定理）
传送门比赛的时候由于变量名打错了调了很久啊. 这道题显然是唯一分解定理的应用. 我们令P=a1p1∗a2p2∗...∗akpkP=a_1^{p_1}*a_2^{p_2}*...*a_k^{p_k}P ...
cuDNN
https://developer.nvidia.com/developer-program https://developer.nvidia.com/cudnn cuda和cuDNN的关系 http ...
mybatis操作数据库
导入jar包共13包注意:mysql-connction的版本是5.1.7版低版本可能不行 2.编写配置文件 a. 配置连接数据库的文件 a.1创建数据库 user表 a.2配置文件目录 a.2. ...
cheerio笔记
不会的东西,再简单都是难:会的东西,再难都是简单. 给自己写的,写的通俗易懂. cheerio:在node服务端,解析网页,是jquery的核心,去除了DOM中不一致的地方. 先获得网页的源码,再通过 ...

Zookeeper数据存储总结

Zookeeper数据存储总结的更多相关文章

随机推荐

热门专题