MINIBASE源代码阅读笔记之buffer manager
BufDesc
frame 们的 descriptor(见BufHashTbl注释),包括
- pageNo: 这个 frame 在文件里的id,page number
- prevframe: -1 表示此 frame 为空,如果是hash slot的第一个则为 slot number,否则就是前一个 frame的frame number
- 注意 frame number 是在 buffer pool 里的 id,page number 是在文件里的 id
- nextframe: 下一个 frame 的 number,-1表示没有下一个 frame
- dirty: 1 是 dirty
- int: 1 表示这个 frame 正在被一个新的读取覆盖,可以用1+oldpageno表示原来的frame的page number
方法只有 constructor 和 destructor,constructor设各种 number 为 -1,不 dirty,没人 reading
BufHashTbl
用来登记 buffer pool 里的 page 们
- ht[HTSIZE]:用来登记frame的数组,-1表示对应的hash value 还没有 page 登记过,否则保存对应的链表头的 frame no
- numBuffers:buffer的大小
- bufTable[numBuffers]:保存 frame 们的 descriptor
方法
- hash: 接收 pageNo,返回 hash value,用来做 ht 下标(这里用的是最傻的取模+开放寻址)
- insert: 算好哪个 page 放进 哪个 frame 后,将 page number 和frame number 传给它来放
- 首先会将bufTable的对应指针保存进tmp,如果发现对应所指的frame不为空,报错,提醒先调用remove
- 将page no设成新的
- 设dirty为false,因为刚插进来肯定没改
- 将它插到slot的顶部,设prevframe为index+numBuffers(index是hash过的page id)即slot number
- 通过ht找到index对应的frame number,要么是-1表示这个slot还是空的,要么就是当前slot顶部的frame number,赋给tmp的nextframe,也就是把tmp插到了链表头部
- 如果ht[index]>-1,这个slot不是空的,那么将被挤到后面去的frame的prevframe设成这个新插进去的frame
- 最后将ht[index]设成当前frame 的 frame number,插入头部完成
- lookup: 接收 page number,然后去 hash table 里查找,有的话就返回对应的 frame number,不然返回 -1
- 就是开放寻址,hash之然后不断向后找,直到碰到空的frame就返回-1
- remove: 删掉
- 将frame number对应的descriptor存进tmp先
- 检查是不是在链表头(看tmp->prevframe是否是slot number,即大于numBuffers)
- 如果是,把ht里对应的frame number改成下一个frame
- 如果不是,让自己的prevframe的nextframe指向自己的nextframe
- 如果自己的nextframe不为空(>1),将自己的nextframe的prevframe设成自己的prevframe
- 前后的连接都设置好了,把自己的descriptor的各种值改成跟空的一样,等待caller回收或者覆盖掉里面的东西
Replacer
abstract class,给各种换页算法的class用的
- mgr:跟这个replacer一起的buffer manager
- pin_count[numBuffers]:对应每个frame的pin count
- state_bit[numBuffers]:每个frame的state,包括 {Available, Referenced, Pinned}
- head:clock的head
方法
- pin:接收frame number,加一个 pin
- 设这个frame的state为pinned,然后加pin_count
- unpin:
- 注意如果它的pin_count已经是0,说明有问题,要报错
- 减掉pin_count,如果是0,将state转换到referenced给clock用
- free:给buffer manager的freePage用的,接收 frame number,pin_count和state_bit都初始化掉
- pick_victim:挑选要 free 掉的 frame,不同的算法有不同的选法,所以是 abstract function
- name:?
- info:?
- getNumUnpinnedBuffers:目前还有多少 frame 还是有人用的
- setBufferManager:设置对应的 buffer manager
- 删掉原来的私有变量,然后各种初始化
BufMgr
buffer manager啦~
- hashTable:用来管理 buffer pool里的 frame 的 hash table,一个buffer manager只有一个
- bufPool[numBuffers]:实际放每个frame对应page的的数组
- numBuffers:buffer pool的大小
- replacer:这个buffer manager用的replacer
- _victim_list:里面都是已经从 buffer pool里删除的 page,但都是 dirty 的,而且还没有写回硬盘,每个元素里有对应的 frame number 和 page id
- _valid_victim_entries:当前victim的数量
方法
- _exist_victim_list: 查找 victim list 里是否有符合 pgid 的page,如果有将对应的 frame number 写进参数,返回OK,否则写-1到参数里
- _remove_victim_list: 在 victim list 里查找并删除对应的 page,删除之后把后面的所有entries向前移……(= =)
_add_victim_list:把新的page id 和frame number 对加到尾部
BufMgr: 初始化buffer pool和_victim_list(malloc),将hash table里每个descriptor们的next frame按顺序连起来,_victim_list的所有元素的page id 和 frame number 设置为 -1,给buffer pool里每个元素都设成空的页,这里有个略看不懂的东西:
(void) new(bufPool+i) Page;
貌似是给bufPool+i所指向的空间调用Page的constructor
然后设置好 replacer,如果没有传参进来就分配空间设一个新的,给replacer的buffer manager设成自己
~BufMgr:检查hash table里所有的frame,有dirty的就写回去,然后删除每个malloc过的指针
pinPage:
在 buffer pool里查找 page id 对应的 page
hashTable.lookup(pin_pgid);
如果找不到,用replacer的pick_victim()挑一页来换
- 如果挑不到(全都有人在用),报错
- 如果挑到了但是是 dirty 的
- 暂存这frame里目前的 page number,然后将这frame放进 _victim_list,处理好前后frame的连接(用hash table的remove()),设置好这frame的 reading,然后用hash table的insert()将新的page登记进去
- 以上一路都OK的话就用write_page()将 dirty 的原来的 page 写进去(到这步frameNo还是指向原来的 page 所在的frame,而且这个 frame 里的内容也还没改)
- 如果写好了也没其他错误,就可以将这个old page从_victim_list里拿走了
- 挑完了也写回去了,就可以读进新的 page 了(read_page())
- 如果读取过程中出现错误,需要将这hash table里的这一frame清掉,假装这一frame空了
- 设回 hash table里的reading=0,将读好的frame的地址写进参数传回去
- pin好这个frame
如果有就写进 page 指针,没有就换页再读进来,如果换页的时候发现是 dirty 的,它也负责把原来的 frame 写回去,然后给对应的pin_count + 1
如果设了 BM_TRACE,会接收 filename 方便 trace
- 如果 emptyPage == TRUE,提示要读的 page 是空的,就不会真的去读,返回一个空的 page 就好了
- unpinPage:接收 page id,unpin 掉这个 page(pin_count -1)
- 如果在hash table里找page id的时候发现找不到 or 找到的是空 frame or 没法让 replacer unpin,返回错误
- 如果告知是 dirty 的,设好这个 frame descriptor 的 dirty
- replacer会搞定pin_count的减,如果 pin_count 减完变0了,说明没人在用了,可以拿去做换页的候选
- newPage:让 DB 给一堆(howmany)新的 page 分配硬盘空间,在 buffer pool里找个可以放 page 的 frame 给其中的第一个 page,pin 之(覆写参数 firstPageId 和 firstpage 做返回)。如果 buffer 已满,让 DB 悲催地把已经新建的 page deallocate掉,然后返回 error
- freePage:删掉硬盘上的 page 的时候需要调用这个函数
- 先在hash table里查找page id,如果找不到说明不在buffer pool里,直接deallocate即可
- 如果找得到,要让replacer free掉它,然后从hash table里remove(即从pool里移走),然后再让 DB deallocate 掉这个 page
- flushPage:flush 掉_指定的_ page,把它从 buffer pool 里销掉,需要写回硬盘就写回去
- flushAllPages:顾名思义
- PageInFrame:接收 frame number,把保存在内存里的 page 的指针返回来
MINIBASE源代码阅读笔记之buffer manager的更多相关文章
- MINIBASE源代码阅读笔记之DB
DB 管理数据库的类 file_entry:dir page的元素,保存不同文件对应的page directory_page:dir page的专用结构体,里面有个初始长度为0的variable si ...
- MINIBASE源代码阅读笔记之heapfile
Heapfile 用来管理heap file里的dir page们 成员 _firstDirPageId:这个文件的第一个dir page _ftype:文件类型 _file_deleted:删除的时 ...
- MINIBASE源代码阅读笔记之HFPage
HFPage heap file的page的类 成员 slot_t:用来表示页里的slot,包括offset和length slot[]:倒着生长的slot array slotCnt:有多少已用sl ...
- Spark源代码阅读笔记之DiskStore
Spark源代码阅读笔记之DiskStore BlockManager底层通过BlockStore来对数据进行实际的存储.BlockStore是一个抽象类,有三种实现:DiskStore(磁盘级别的持 ...
- Mongodb源代码阅读笔记:Journal机制
Mongodb源代码阅读笔记:Journal机制 Mongodb源代码阅读笔记:Journal机制 涉及的文件 一些说明 PREPLOGBUFFER WRITETOJOURNAL WRITETODAT ...
- CI框架源代码阅读笔记5 基准測试 BenchMark.php
上一篇博客(CI框架源代码阅读笔记4 引导文件CodeIgniter.php)中.我们已经看到:CI中核心流程的核心功能都是由不同的组件来完毕的.这些组件类似于一个一个单独的模块,不同的模块完毕不同的 ...
- CI框架源代码阅读笔记3 全局函数Common.php
从本篇開始.将深入CI框架的内部.一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说.全局函数具有最高的载入优先权.因此大多数的框架中BootStrap ...
- CI框架源代码阅读笔记2 一切的入口 index.php
上一节(CI框架源代码阅读笔记1 - 环境准备.基本术语和框架流程)中,我们提到了CI框架的基本流程.这里再次贴出流程图.以备參考: 作为CI框架的入口文件.源代码阅读,自然由此開始. 在源代码阅读的 ...
- Java Jdk1.8 HashMap源代码阅读笔记二
三.源代码阅读 3.元素包括containsKey(Object key) /** * Returns <tt>true</tt> if this map contains a ...
随机推荐
- 【莫队】【P3901】 数列找不同
Description 现在有一个长度为\(~n~\)的数列\(~A_1~,~A_2~\dots~A_n~\),\(~Q~\)个询问\(~[l_i~,~r_i]~\),每次询问区间内是否有元素相同 I ...
- UESTC--1732
原题链接:http://acm.uestc.edu.cn/problem.php?pid=1732 分析:dp,n个相同物品放入m个相同的盒子(允许为空)的个数为dp[n][m]=dp[n][m-1] ...
- 「Python」人脸识别应用
人脸识别主要步骤: face_recognition 库的安装 安装此库,首先需要安装编译dlib,此处我们偷个懒,安装软件Anaconda(大牛绕过),此软件预装了dlib. 安装好后,我们直接通过 ...
- 微信小程序语音识别
语音识别现在已经发展的很成熟了,经过比对发现百度对开发者比较友好,提供很多种语言的SDK,对python来说直接安装 pip install baidu-aip 文档写的也不错 具体参考:http: ...
- Tensorboard教程:高维向量可视化
Tensorflow高维向量可视化 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 强烈推荐Tensorflow实战Google深度学习框架 实验平台: Tensorflow1.4. ...
- OpenCV---轮廓发现
推文:OpenCV-Python教程(11.轮廓检测) 轮廓发现 是基于图像边缘提取的基础,寻找对象轮廓的方法,所以边缘提取的阈值选定会影响最终轮廓的发现 相关API findContours 发现轮 ...
- 还不会做! 树上的gcd 树分治 UOJ33
题目链接:http://uoj.ac/problem/33 题解链接:http://vfleaking.blog.uoj.ac/blog/38 现在感觉到了做OI的层层递进的思路的伟大之处,作为一个大 ...
- R0—New packages for reading data into R — fast
小伙伴儿们有福啦,2015年4月10日,Hadley Wickham大牛(开发了著名的ggplots包和plyr包等)和RStudio小组又出新作啦,新作品readr包和readxl包分别用于R读取t ...
- Codeforces Round #419 (Div. 2) A-E
上紫啦! E题1:59压哨提交成功翻盘 (1:00就做完了调了一个小时,还好意思说出来? (逃)) 题面太长就不复制了,但是配图很可爱所以要贴过来 九条可怜酱好可爱呀 A - Karen and Mo ...
- 【leetcode 简单】 第八题 删除排序数组中的重复项
给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度. 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成. 示例 1 ...