XV6学习（9）Lab cow: Copy-on-write fork

代码在github上。总体来说如果理解了COW机制的话，这个实验的完成也没有很复杂。

这一个实验是要完成COW（copy on write）fork。在原始的XV6中，fork函数是通过直接对进程的地址空间完整地复制一份来实现的。但是，拷贝整个地址空间是十分耗时的，并且在很多情况下，程序立即调用exec函数来替换掉地址空间，导致fork做了很多无用功。即使不调用exec函数，父进程和子进程的代码段等只读段也是可以共享的，从而达到节省内存空间的目的。同时COW也可以将地址空间拷贝的耗时进行延迟分散，提高操作系统的效率。

首先就是要对fork函数进行修改，使其不对地址空间进行拷贝。fork函数会调用uvmcopy进行拷贝，因此只需要修改uvmcopy函数就可以了：删去uvmcopy中的kalloc函数，将父子进程页面的页表项都设置为不可写，并设置COW标志位（在页表项中保留了2位给操作系统，这里用的是第8位#define PTE_COW (1L << 8)）

int

uvmcopy(pagetable_t old, pagetable_t new, uint64 sz)

{

  pte_t *pte;

  uint64 pa, i;

  uint flags;

  for(i = 0; i < sz; i += PGSIZE){

    if((pte = walk(old, i, 0)) == 0)

      panic("uvmcopy: pte should exist");

    if((*pte & PTE_V) == 0)

      panic("uvmcopy: page not present");

    pa = PTE2PA(*pte);

    flags = PTE_FLAGS(*pte);

    *pte = ((*pte) & (~PTE_W)) | PTE_COW; // set parent's page unwritable

    // printf("c: %p %p %p\n", i, ((flags & (~PTE_W)) | PTE_COW), *pte);

    // map child's page with page unwritable

    if(mappages(new, i, PGSIZE, (uint64)pa, (flags & (~PTE_W)) | PTE_COW) != 0){

      goto err;

    }

    refcnt_incr(pa, 1);

  }

  return 0;

 err:

  uvmunmap(new, 0, i / PGSIZE, 1);

  return -1;

}

之后设置一个数组用于保存内存页面的引用计数，由于会涉及到并行的问题，因此也需要设置一个锁，同时定义了一些辅助函数：

struct {

  struct spinlock lock;

  uint counter[(PHYSTOP - KERNBASE) / PGSIZE];

} refcnt;

inline

uint64

pgindex(uint64 pa){

  return (pa - KERNBASE) / PGSIZE;

}

inline

void

acquire_refcnt(){

  acquire(&refcnt.lock);

}

inline

void

release_refcnt(){

  release(&refcnt.lock);

}

void

refcnt_setter(uint64 pa, int n){

  refcnt.counter[pgindex((uint64)pa)] = n;

}

inline

uint

refcnt_getter(uint64 pa){

  return refcnt.counter[pgindex(pa)];

}

void

refcnt_incr(uint64 pa, int n){

  acquire(&refcnt.lock);

  refcnt.counter[pgindex(pa)] += n;

  release(&refcnt.lock);

}

修改kfree函数，使其只有在引用计数为1的时候释放页面，其他时候就只减少引用计数：

void

kfree(void *pa)

{

  struct run *r;

  // page with refcnt > 1 should not be freed

  acquire_refcnt();

  if(refcnt.counter[pgindex((uint64)pa)] > 1){

    refcnt.counter[pgindex((uint64)pa)] -= 1;

    release_refcnt();

    return;

  }

  if(((uint64)pa % PGSIZE) != 0 || (char*)pa < end || (uint64)pa >= PHYSTOP)

    panic("kfree");

  // Fill with junk to catch dangling refs.

  memset(pa, 1, PGSIZE);

  refcnt.counter[pgindex((uint64)pa)] = 0;

  release_refcnt();

  r = (struct run*)pa;

  acquire(&kmem.lock);

  r->next = kmem.freelist;

  kmem.freelist = r;

  release(&kmem.lock);

}

修改kalloc函数，使其在分配页面时将引用计数也设置为1：这里注意要判断r是否为0，kalloc实现时没有当r==0时就返回。

void *

kalloc(void)

{

  ...

  if(r)

    memset((char*)r, 5, PGSIZE); // fill with junk

  if(r)

    refcnt_incr((uint64)r, 1); // set refcnt to 1

  return (void*)r;

}

在usertrap中加入判断语句，这里只需要处理scause==15的情况，因为13是页面读错误，而COW是不会引起读错误的。

void

usertrap(void)

{

  ...

  } else if(r_scause() == 15){

    // page write fault

    uint64 va = r_stval();

    if(cowcopy(va) == -1){

      p->killed = 1;

    }

  } else if((which_dev = devintr()) != 0){

  ...

}

在cowcopy函数中先判断COW标志位，当该页面是COW页面时，就可以根据引用计数来进行处理。如果计数大于1，那么就需要通过kalloc申请一个新页面，然后拷贝内容，之后对该页面进行映射，映射的时候清除COW标志位，设置PTE_W标志位；而如果引用计数等于1，那么就不需要申请新页面，只需要对这个页面的标志位进行修改就可以了：



int

cowcopy(uint64 va){

  va = PGROUNDDOWN(va);

  pagetable_t p = myproc()->pagetable;

  pte_t* pte = walk(p, va, 0);

  uint64 pa = PTE2PA(*pte);

  uint flags = PTE_FLAGS(*pte);

  if(!(flags & PTE_COW)){

    printf("not cow\n");

    return -2; // not cow page

  }

  acquire_refcnt();

  uint ref = refcnt_getter(pa);

  if(ref > 1){

    // ref > 1, alloc a new page

    char* mem = kalloc_nolock();

    if(mem == 0)

      goto bad;

    memmove(mem, (char*)pa, PGSIZE);

    if(mappages(p, va, PGSIZE, (uint64)mem, (flags & (~PTE_COW)) | PTE_W) != 0){

      kfree(mem);

      goto bad;

    }

    refcnt_setter(pa, ref - 1);

  }else{

    // ref = 1, use this page directly

    *pte = ((*pte) & (~PTE_COW)) | PTE_W;

  }

  release_refcnt();

  return 0;

  bad:

  release_refcnt();

  return -1;

}

在对引用计数进行读写时注意锁的设置。在mappages函数中会触发一个remap的panic，这里只要注释掉就行了，因为COW就是要对页面进行重新映射的。

XV6学习（9）Lab cow: Copy-on-write fork的更多相关文章

xv6学习笔记(4) : 进程调度
xv6学习笔记(4) : 进程 xv6所有程序都是单进程.单线程程序.要明白这个概念才好继续往下看 1. XV6中进程相关的数据结构在XV6中,与进程有关的数据结构如下 // Per-process ...
XV6学习笔记(2) :内存管理
XV6学习笔记(2) :内存管理在学习笔记1中,完成了对于pc启动和加载的过程.目前已经可以开始在c语言代码中运行了,而当前已经开启了分页模式,不过是两个4mb的大的内存页,而没有开启小的内存页.接 ...
xv6学习笔记(3):中断处理和系统调用
xv6学习笔记(3):中断处理和系统调用 1. tvinit函数这个函数位于main函数内表明了就是设置idt表 void tvinit(void) { int i; for(i = 0; i & ...
xv6学习笔记(5) : 锁与管道与多cpu
xv6学习笔记(5) : 锁与管道与多cpu 1. xv6锁结构 1. xv6操作系统要求在内核临界区操作时中断必须关闭. 如果此时中断开启,那么可能会出现以下死锁情况: 进程A在内核态运行并拿下了p ...
XV6学习笔记(1) : 启动与加载
XV6学习笔记(1) 1. 启动与加载首先我们先来分析pc的启动.其实这个都是老生常谈了,但是还是很重要的(也不知道面试官考不考这玩意), 1. 启动的第一件事-bios 首先启动的第一件事就是运行 ...
XV6学习（2）Lab syscall
实验的代码放在了Github上. 第二个实验是Lab: system calls. 这个实验主要就是自己实现几个简单的系统调用并添加到XV6中. XV6系统调用添加系统调用主要有以下几步: 在use ...
XV6学习（1） Lab util
正在学习MIT的6.S081,把做的实验写一写吧. 实验的代码放在了Github上. 第一个实验是Lab util,算是一个热身的实验,没有涉及到系统的底层,就是使用系统调用来完成几个用户模式的小程序 ...
XV6学习（16）Lab net: Network stack
最后一个实验了,代码在Github上. 这一个实验其实挺简单的,就是要实现网卡的e1000_transmit和e1000_recv函数.不过看以前的实验好像还要实现上层socket相关的代码,今年就只 ...
XV6学习（11）Lab thread: Multithreading
代码放在github上. 这一次实验感觉挺简单的,特别是后面两个小实验.主要就是对多线程和锁进行一个学习. Uthread: switching between threads 这一个实验是要实现一个 ...

随机推荐

Linux嵌入式学习-烟雾传感器驱动-字符设备驱动-按键驱动
MQ-2烟雾气敏传感器模块在X210v3开发板上的驱动. 现在需要一个MQ-2烟雾气敏传感器模块的驱动.其检测烟雾超过一定的标准后,会返回一个不同的电平,和按键驱动差不多. 但是在编写驱动的时候,需要 ...
MyBatis-Plus 多表联查+分页
在写东西的过程中,多表联查和分页功能必不可少.当然,crud也很重要但是又不想写代码和xml. 通过苦苦的查找.发现MyBatis-Plus一款国产的框架.优化了许多操作本次主要记录一下,多表联查 ...
Centos7 安装Teamviewer
参考:链接1 链接2 链接3 由于工作原因,需要再Centos7.6下安装Teamviewer,流程如下: 下载 TeamViewer下载链接 wget https://download.tea ...
JS中var与let的区别
区别: var声明的变量,其作用域在该语句所在的函数之内,存在着变量提升的现象. let声明的变量,其作用域为该句所在的代码块内,不存在变量提升的问题. let相比于var,其不允许在相同作用域内,重 ...
Centos7上以RPM包方式安装Oracle 18c XE
Centos7上以RPM包方式安装Oracle 18c XE 安装阿里云 YUM 源 https://opsx.alibaba.com/mirror?lang=zh-CN 一.安装oracle数据库 ...
hive之Json解析(普通Json和Json数组)
一.数据准备现准备原始json数据(test.json)如下: {"movie":"1193","rate":"5", ...
2020 年度编程语言排行榜出炉！C 语言称霸，Java 遭遇滑铁卢…….
最近,TIOBE 发布了过去一年的编程语言排行榜: 数据来源TIOBE: https://www.tiobe.com/tiobe-index/ TIOBE介绍: TIOBE编程语言索引是编程语言流行程 ...
2021升级版微服务教程3—Eureka完全使用指南
2021升级版SpringCloud教程从入门到实战精通「H版&alibaba&链路追踪&日志&事务&锁」默认文件1610014380163 教程全目录「含视 ...
两个很赞的用法（count函数里的表达式+计算时间间隔）
1.count函数里写表达式 #无效写法,这样写不会判断表达式(ischecked=0),会全部列出来 SELECT cardid FROM search_detail GROUP BY cardid ...
用隧道协议实现不同dubbo集群间的透明通信
用隧道协议实现不同dubbo集群间的透明通信前言笔者最近完成了一个非常有意思的隧道机制(已在产线运行),可以让注册到不同zookeeper之间的dubbo集群之间能够正常进行通信.如下图所示: 例 ...

XV6学习（9）Lab cow: Copy-on-write fork

XV6学习（9）Lab cow: Copy-on-write fork的更多相关文章

随机推荐

热门专题