zk 文件存储

zk 有 2 种文件，快照和事务日志，快照是某一时刻的全量数据，事务日志中记录了数据的修改事件。

快照的文件名是 snapshot.zxid，zxid 是当前最大的事务 id

// org.apache.zookeeper.server.persistence.FileTxnSnapLog#save

public void save(DataTree dataTree,

        ConcurrentHashMap<Long, Integer> sessionsWithTimeouts)

    throws IOException {

    long lastZxid = dataTree.lastProcessedZxid;

    // 快照文件名为 snapshot.lastZxid

    File snapshotFile = new File(snapDir, Util.makeSnapshotName(lastZxid));

    LOG.info("Snapshotting: 0x{} to {}", Long.toHexString(lastZxid),

            snapshotFile);

    snapLog.serialize(dataTree, sessionsWithTimeouts, snapshotFile);

}

事务日志的文件名是 log.zxid，zxid 是当前文件第一条日志的事务 id

// org.apache.zookeeper.server.persistence.FileTxnLog#append

public synchronized boolean append(TxnHeader hdr, Record txn)

    throws IOException

{

    if (hdr == null) {

        return false;

    }

    if (hdr.getZxid() <= lastZxidSeen) {

        LOG.warn("Current zxid " + hdr.getZxid()

                + " is <= " + lastZxidSeen + " for "

                + hdr.getType());

    } else {

        lastZxidSeen = hdr.getZxid();

    }

    if (logStream==null) {

       if(LOG.isInfoEnabled()){

            LOG.info("Creating new log file: " + Util.makeLogName(hdr.getZxid()));

       }

       // 创建一个新的事务日志文件 log.zxid，这里的 zxid 是第一条事务日志的 zxid

       logFileWrite = new File(logDir, Util.makeLogName(hdr.getZxid()));

       fos = new FileOutputStream(logFileWrite);

       logStream=new BufferedOutputStream(fos);

       oa = BinaryOutputArchive.getArchive(logStream);

       FileHeader fhdr = new FileHeader(TXNLOG_MAGIC,VERSION, dbId);

       fhdr.serialize(oa, "fileheader");

       // Make sure that the magic number is written before padding.

       logStream.flush();

       filePadding.setCurrentSize(fos.getChannel().position());

       streamsToFlush.add(fos);

    }

    filePadding.padFile(fos.getChannel());

    byte[] buf = Util.marshallTxnEntry(hdr, txn);

    if (buf == null || buf.length == 0) {

        throw new IOException("Faulty serialization for header " +

                "and txn");

    }

    Checksum crc = makeChecksumAlgorithm();

    crc.update(buf, 0, buf.length);

    oa.writeLong(crc.getValue(), "txnEntryCRC");

    Util.writeTxnBytes(oa, buf);

    return true;

}

zk 加载数据：从 snap 文件和 log 文件解析出全量数据

// org.apache.zookeeper.server.persistence.FileTxnSnapLog#restore

public long restore(DataTree dt, Map<Long, Integer> sessions,

        PlayBackListener listener) throws IOException {

    snapLog.deserialize(dt, sessions);

    return fastForwardFromEdits(dt, sessions, listener);

}

逆序选择 100 个 snap 文件，从最新的文件开始解析，如果有一个文件校验正确，则退出

public long deserialize(DataTree dt, Map<Long, Integer> sessions)

        throws IOException {

    // we run through 100 snapshots (not all of them)

    // if we cannot get it running within 100 snapshots

    // we should  give up

    List<File> snapList = findNValidSnapshots(100);

    if (snapList.size() == 0) {

        return -1L;

    }

    File snap = null;

    boolean foundValid = false;

    for (int i = 0; i < snapList.size(); i++) {

        snap = snapList.get(i);

        InputStream snapIS = null;

        CheckedInputStream crcIn = null;

        try {

            LOG.info("Reading snapshot " + snap);

            snapIS = new BufferedInputStream(new FileInputStream(snap));

            crcIn = new CheckedInputStream(snapIS, new Adler32());

            InputArchive ia = BinaryInputArchive.getArchive(crcIn);

            deserialize(dt, sessions, ia);

            long checkSum = crcIn.getChecksum().getValue();

            long val = ia.readLong("val");

            if (val != checkSum) {

                throw new IOException("CRC corruption in snapshot :  " + snap);

            }

            foundValid = true;

            break;

        } catch(IOException e) {

            LOG.warn("problem reading snap file " + snap, e);

        } finally {

            if (snapIS != null)

                snapIS.close();

            if (crcIn != null)

                crcIn.close();

        }

    }

    if (!foundValid) {

        throw new IOException("Not able to find valid snapshots in " + snapDir);

    }

    dt.lastProcessedZxid = Util.getZxidFromName(snap.getName(), SNAPSHOT_FILE_PREFIX);

    return dt.lastProcessedZxid;

}

对比已经解析出的最大 zxid，选择对应的 log 文件

// org.apache.zookeeper.server.persistence.FileTxnLog.FileTxnIterator#init

void init() throws IOException {

    storedFiles = new ArrayList<File>();

    List<File> files = Util.sortDataDir(FileTxnLog.getLogFiles(logDir.listFiles(), 0), LOG_FILE_PREFIX, false);

    for (File f: files) {

        if (Util.getZxidFromName(f.getName(), LOG_FILE_PREFIX) >= zxid) {

            storedFiles.add(f);

        }

        // add the last logfile that is less than the zxid

        else if (Util.getZxidFromName(f.getName(), LOG_FILE_PREFIX) < zxid) {

            storedFiles.add(f);

            break;

        }

    }

    goToNextLog();

    if (!next())

        return;

    while (hdr.getZxid() < zxid) {

        if (!next())

            return;

    }

}

zk 文件存储的更多相关文章

Kafka与RocketMq文件存储机制对比
一个商业化消息队列的性能好坏,其文件存储机制设计是衡量一个消息队列服务技术水平和最关键指标之一. 开头问题 kafka文件结构和rocketMQ文件结构是什么样子?特点是什么? 一.目录结构 Kafk ...
Android数据存储之Android 6.0运行时权限下文件存储的思考
前言: 在我们做App开发的过程中基本上都会用到文件存储,所以文件存储对于我们来说是相当熟悉了,不过自从Android 6.0发布之后,基于运行时权限机制访问外置sdcard是需要动态申请权限,所以以 ...
深入理解Sqlserver文件存储之页和应用（转）
我们每天都在使用数据库,我们部门使用最多的关系数据库有Sqlserver,Oracle,有没有想过这些数据库是怎么存放到操作系统的文件中的?有时候为了能够设计出最优的表结构,写出高性能的Sqlserv ...
app端上传文件至服务器后台，web端上传文件存储到服务器
1.android前端发送服务器请求在spring-mvc.xml 将过滤屏蔽(如果不屏蔽 ,文件流为空) <!-- <bean id="multipartResolver&q ...
MongoDb gridfs-ngnix文件存储方案
在各类系统应用服务端开发中,我们经常会遇到文件存储的问题. 常见的磁盘文件系统,DBMS传统文件流存储.今天我们看一下基于NoSQL数据库MongoDb的存储方案.笔者环境以CentOS ...
Hadoop中pid文件存储
我的hadoop集群部署在自己电脑虚拟机上,有时候我是挂起虚拟机,第二天再打开发现有些线程就挂了,比如namenode,好奇怪,当时看了一些帖子说是和pid存储有关,找到log看到找不到pid.因为基 ...
Android文件存储
文件存储是Android中最基本的一种数据存储方式,它不读存储的内容进行任何的格式化处理,所有数据原封不动的保存在文件之中.如果想用文件存储的方式保存一些较为复杂的数据,就需要定义一套自己的格式规范, ...
Kafka深入理解-1：Kafka高效的文件存储设计
文章摘自:美团点评技术团队 Kafka文件存储机制那些事 Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式.分区的.多副本的.多订阅者,基于zookeeper协调的分布式日 ...
.Net平台下，分布式文件存储的实现
遇到的问题对于Web程序,使用一台服务器的时候,客户端上传的文件一般也都是存储在这台服务器上.但在集群环境中就行不通了,如果每个服务器都存储自己接受到的文件,就乱套了,数据库中明明有这个附件的记录, ...

随机推荐

Linux umask 档案预设权限/touch 建立空档案或修档案件时间
1 建立档案时,权限一般设为-rw-r--r-- 2 建立目录时,权限一般设为drwxr-xr-x 3 touch 选项与参数 -a : 仅修订access time -c :仅修改档案的时间,若该 ...
Highcharts动态获取值
<script type="text/javascript"> $(document).ready(function (){ var o ...
安装驱动模块ko
1. make install 2. 3.手动加载驱动程序 [root@localhost template]# modprobe usbnet [root@localhost template]# ...
高性能mysql 第7章 mysql高级特性之分区表
分区表: 分区表是一个独立的逻辑表,底层通过多个物理表实现. mysql实现分区表的方式是对底层表的封装.这意味着没有全局索引,索引是建立在底层的每个表上的(跟ORACLE不一样). 用到分区表的几种 ...
Linux tcpdump命令详解与Wireshark
简介用简单的话来定义tcpdump,就是:dump the traffic on a network,根据使用者的定义对网络上的数据包进行截获的包分析工具. tcpdump可以将网络中传送的数据包的 ...
写一个基于TCP协议套接字，服务端实现接收客户端的连接并发
''' 写一个基于TCP协议套接字,服务端实现接收客户端的连接并发 ''' client import socket import time client = socket.socket() clie ...
局部处理的边缘连接（python+opencv）
rt import cv2 import numpy as np path = "_lo.png" img = cv2.imread(path) gray = cv2.cvtCol ...
C++ Primer 第 5 版习题参考答案
从 5 月初 - 8 月 16 日,每天基本都在啃 C++ 的语法.起初直接看C++ Primer 中文版(第 5 版),发现后边的章节看着很吃力.所以就转而看了清华大学郑莉老师和李超老师的视频C++ ...
【SPOJ2371】LIS2
题目大意:求二维最长上升子序列的长度. 题解: 可以看出,这个问题等价于三维偏序问题. 不过在进行分治的时候要注意,由于 dp 转移是有顺序的,因此只能先处理左半部分,再处理左半部分对右边的贡献,最后 ...
DevExpress ASP.NET Core v19.1版本亮点：Rich Text Editor
行业领先的.NET界面控件DevExpress 发布了v19.1版本,本文将以系列文章的方式为大家介绍DevExpress ASP.NET Core Controls v19.1中新增的一些控件及增强 ...

zk 文件存储

zk 文件存储的更多相关文章

随机推荐

热门专题