资源

  1. ucore在线实验指导书
  2. 我的ucore实验代码

练习1:理解通过make生成执行文件的过程

详见《ucore lab1 exercise1》实验报告

练习2:使用qemu执行并调试lab1中的软件

详见《ucore lab1 exercise2》实验报告

练习3:分析bootloader进入保护模式的过程

详见《ucore lab1 exercise3》实验报告

练习4:分析bootloader加载ELF格式的OS的过程

详见《ucore lab1 exercise4》实验报告

练习5:实现函数调用堆栈跟踪函数

详见《ucore lab1 exercise5》实验报告

练习6:完善中断初始化和处理

详见《ucore lab1 exercise6》实验报告

扩展练习1:增加一用户态函数(待完成)

扩展proj4,增加syscall功能,即增加一用户态函数(可执行一特定系统调用:获得时钟计数值),当内核初始完毕后,可从内核态返回到用户态的函数,而用户态的函数又通过系统调用得到内核态的服务。

扩展练习2:用键盘实现用户模式内核模式切换(待完成)

用键盘实现用户模式内核模式切换。具体目标是:“键盘输入3时切换到用户模式,键盘输入0时切换到内核模式”。 基本思路是借鉴软中断(syscall功能)的代码,并且把trap.c中软中断处理的设置语句拿过来。

调Bug日志

【2019-1-3】Bug 2:lab1运行到pmm_init时失败

  1. 解决Bug1后,再次执行make qemu仍然失败,提示以下信息:
ebp:0x00007bf8 eip:0x00007d6e args:0xc031fcfa 0xc08ed88e 0x64e4d08e 0xfa7502a8
<unknow>: -- 0x00007d6d --
qemu-system-i386: Trying to execute code outside RAM or ROM at 0x457e0000
This usually means one of the following happened: (1) You told QEMU to execute a kernel for the wrong machine type, and it crashed on startup (eg trying to run a raspberry pi kernel on a versatilepb QEMU machine)
(2) You didn't give QEMU a kernel or BIOS filename at all, and QEMU executed a ROM full of no-op instructions until it fell off the end
(3) Your guest kernel has a bug and crashed by jumping off into nowhere This is almost always one of the first two, so check your command line and that you are using the right type of kernel for this machine.
If you think option (3) is likely then you can try debugging your guest with the -d debug options; in particular -d guest_errors will cause the log to include a dump of the guest register state at this point. Execution cannot continue; stopping here.
  1. 使用gdb单步跟踪,发现是在pmm_init函数中加载完gdt表后,执行mov %ax, %gs时异常结束了。我尝试将gs寄存器改为dx,则没有问题。这意味着gs等段寄存器此时不能被访问。

  2. 问题比较像是某些权限没设置好,导致无法访问段寄存器。应该是前面的步骤哪里没做好。发散思路:

    • [x] 梳理一遍从BIOS启动到pmm_init之间要做哪些事情,检查各个步骤是否OK,比如保护模式是否设置成功

      • [x] bootloader打开A20门、加载gdt、使能PE(没问题)
      • kern_init在执行pmm_init之前初始化(edata, end)这段内存
      • [x] kern_init在执行pmm_init之前打印字符串及调试信息(没影响)
    • 查找段寄存器无法访问的可能原因
    • 确认加载全局描述符表需要哪些操作,是否有遗漏操作或操作有误
    • 对比lab1和lab2,看下哪些步骤有区别
      • lab1的kernel加载地址为0x100000,lab2的kernel加载地址为0xC0100000
      • [x] lab1和lab2的movl %cr0, %eax对应的汇编代码不一致(使用gdb调试发现没问题,应该是objdump文件将二进制代码翻译成汇编代码时出现的问题)
  3. 最终发现是初始化(edata, end)这段内存导致的问题。这段内存包括.got.plt,.data.rel.local,.bss和.data.rel.ro.local四个段,我缩小为只初始化.bss段就没问题了。这个问题之前在做mit 6.828 lab时也遇到过,现在才想起来。

bin/kernel:     file format elf32-i386

Sections:
Idx Name Size VMA LMA File off Algn
0 .text 00003955 00100000 00100000 00001000 2**0
CONTENTS, ALLOC, LOAD, READONLY, CODE
1 .rodata 000008a0 00103958 00103958 00004958 2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
2 .stab 00007bc1 001041f8 001041f8 000051f8 2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
3 .stabstr 000020cf 0010bdb9 0010bdb9 0000cdb9 2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
4 .data 00000950 0010e000 0010e000 0000f000 2**5
CONTENTS, ALLOC, LOAD, DATA
5 .got.plt 0000000c 0010e950 0010e950 0000f950 2**2
CONTENTS, ALLOC, LOAD, DATA
6 .data.rel.local 000000c6 0010e960 0010e960 0000f960 2**5
CONTENTS, ALLOC, LOAD, DATA
7 .data.rel.ro.local 0000006c 0010ea40 0010ea40 0000fa40 2**5
CONTENTS, ALLOC, LOAD, DATA
8 .bss 00001300 0010eac0 0010eac0 0000faac 2**5
ALLOC
9 .comment 0000002a 00000000 00000000 0000faac 2**0
CONTENTS, READONLY
  1. 那么为什么初始化.got.plt及data.rel.ro.local这些段会有问题?我从RELRO(Relocation Read Only)这个网页中找到了答案:.data.rel.ro.local这个段顾名思义就知道是只读的,现在想将其memset为0,自然会导致问题。

  2. 那么为什么lab2没有问题?对比两个lab的tools/kernel.ld文件,发觉lab2的链接脚本汇总在定义edata前,先用ALIGN命令将位置设置在能被0x1000整除的位置,这样恰好将.got.plt, data.rel.ro.local这些段跳过了,因此(edata, end)这段内存恰好只包含.bss段,这时memset就没问题了!

    . = ALIGN(0x1000);
.data.pgdir : {
*(.data.pgdir)
} PROVIDE(edata = .);

顺便贴上lab2的bin/kernel的这几个段的信息:

 5 .got.plt      0000000c  c0118950  c0118950  00019950  2**2
CONTENTS, ALLOC, LOAD, DATA
6 .data.rel.local 000000c6 c0118960 c0118960 00019960 2**5
CONTENTS, ALLOC, LOAD, DATA
7 .data.rel.ro.local 00000088 c0118a40 c0118a40 00019a40 2**5
CONTENTS, ALLOC, LOAD, DATA
8 .data.rel 00000004 c0118ac8 c0118ac8 00019ac8 2**2
CONTENTS, ALLOC, LOAD, DATA
9 .data.pgdir 00002000 c0119000 c0119000 0001a000 2**12
CONTENTS, ALLOC, LOAD, DATA
10 .bss 00000f28 c011b000 c011b000 0001c000 2**5
ALLOC
  1. 总结:定位问题的常规方法:收集信息、理解原理、推测原因(将所有可能的原因都列举出来,逐一排查)。如果不是之前做mit 6.828 lab遇到过同样的Bug,估计定位起来更艰难,因为我差别就放弃怀疑memset语句有问题了。这个问题的棘手之处也在于:memset时没立即出错,等到后面初始化GDT时才出错。总之,经验很重要,以及不能随便放过任何一个可能。

【2019-1-3】Bug 1:bootblock链接失败

  1. 从陈渝老师的github代码库clone了一份干净的代码到本地,进入labcodes_answer/lab1_result目录,执行make qemu时失败了,提示以下信息:
ld -m    elf_i386 -nostdlib -N -e start -Ttext 0x7C00 obj/boot/bootasm.o obj/boot/bootmain.o -o obj/bootblock.o
600 >> 510!!
'obj/bootblock.out' size: 600 bytes
make: \*\*\* [bin/bootblock] Error 255
  1. 根据提示信息,可知是链接后的obj/bootblock.out文件大于512字节,导致检查不通过。这个检查是在哪里设置的呢?在代码库里搜索,发现是在tools/sign.c中设置的:
    printf("'%s' size: %lld bytes\n", argv[1], (long long)st.st_size);
if (st.st_size > 510) {
fprintf(stderr, "%lld >> 510!!\n", (long long)st.st_size);
return -1;
}
  1. 怎么解决?先确认一下是不是每个lab都有这个问题。进入labcodes_answer/lab2_result目录,执行make qemu成功了,说明lab2是正常的。

  2. 为什么lab1和lab2的现象不一样呢?有两种可能:一是链接脚本不同,lab2增加了某些链接选项,使得链接后的文件可以变小;二是代码文件不同,lab1的代码文件比lab2大。于是首先比较两个lab的链接脚本,发现基本相同。然后比较两个lab的diamante文件,发现boot/nootmain.c有以下两处差异:

// lab1
unsigned int SECTSIZE = 512 ;
struct elfhdr * ELFHDR = ((struct elfhdr *)0x10000) ; // scratch space // lab2
#define SECTSIZE 512
#define ELFHDR ((struct elfhdr *)0x10000) // scratch space
  1. 可以推测lab2的写法是比lab1省内存的,因为使用宏代替了全局变量。但这点差异足够大到lab1链接不通过吗?先将lab2的写法同步到lab1,再make一把,发现果然可以了,boot/bootblock.out的size由600字节减少到488字节,少了112字节。真神奇,两个全局变量竟会导致增加了112字节!

  2. 总结:定位问题的一种思路:如果有两份代码,一份有问题,另一份正常,那么可以使用对比法。

《ucore lab1》实验报告的更多相关文章

  1. [操作系统实验lab3]实验报告

    [感受] 这次操作系统实验感觉还是比较难的,除了因为助教老师笔误引发的2个错误外,还有一些关键性的理解的地方感觉还没有很到位,这些天一直在不断地消化.理解Lab3里的内容,到现在感觉比Lab2里面所蕴 ...

  2. Ucore lab1实验报告

    练习一 Makefile 1.1 OS镜像文件ucore.img 是如何一步步生成的? + cc kern/init/init.c + cc kern/libs/readline.c + cc ker ...

  3. ucore操作系统学习(三) ucore lab3虚拟内存管理分析

    1. ucore lab3介绍 虚拟内存介绍 在目前的硬件体系结构中,程序要想在计算机中运行,必须先加载至物理主存中.在支持多道程序运行的系统上,我们想要让包括操作系统内核在内的各种程序能并发的执行, ...

  4. 《ucore lab3》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1:给未被映射的地址映射上物理页 题目 完成do_pgfault(mm/vmm.c)函数,给未被映射的地址映射上物理页.设置访问权限的时候需 ...

  5. 《ucore lab1 exercise5》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 题目:实现函数调用堆栈跟踪函数 我们需要在lab1中完成kdebug.c中函数print_stackframe的实现,可以通过函数print_s ...

  6. 《ucore lab8》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1: 完成读文件操作的实现(需要编码) 题目 首先了解打开文件的处理流程,然后参考本实验后续的文件读写操作的过程分析,编写在sfs_inod ...

  7. 《ucore lab7》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1: 理解内核级信号量的实现和基于内核级信号量的哲学家就餐问题(不需要编码) 题目 完成练习0后,建议大家比较一下(可用meld等文件dif ...

  8. 《ucore lab6》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1: 使用 Round Robin 调度算法(不需要编码) 题目 完成练习0后,建议大家比较一下(可用kdiff3等文件比较软件) 个人完成 ...

  9. 《ucore lab5》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1: 加载应用程序并执行(需要编码) 题目 do_execv函数调用load_icode(位于kern/process/proc.c中) 来 ...

  10. 《ucore lab4》实验报告

    资源 ucore在线实验指导书 我的ucore实验代码 练习1:分配并初始化一个进程控制块 题目 alloc_proc函数(位于kern/process/proc.c中) 负责分配并返回一个新的str ...

随机推荐

  1. Python逆向(一)—— 前言及Python运行原理

    一.前言 最近在学习Python逆向相关,涉及到python字节码的阅读,编译及反汇编一些问题.经过长时间的学习有了一些眉目,为了方便大家交流,特地将学习过程整理,形成了这篇专题.专题对python逆 ...

  2. 模板 - 数学 - 数论 - Miller-Rabin算法

    使用Fermat小定理(Fermat's little theorem)的原理进行测试,不满足 \(2^{n-1}\;\mod\;n\;=\;1\) 的n一定不是质数:如果满足的话则多半是质数,满足上 ...

  3. QuartzNet 远程管理持久化job 项目, 源码在Github..希望对大家有所帮助

    文章目录 为了方便大家去学习 QuartzNet 与 CrystalQuartz 更多信息请点击链接查看 简介 结构图 为了方便大家去学习 QuartzNet 与 CrystalQuartz 更多信息 ...

  4. Linux 文件与目录的权限

    文件默认权限:umask umask就是指定“目前用户在新建文件或目录时候的权限默认值”.查询umask有以下两种方式: 目录与文件的默认权限是不一样的: - 文件,默认没有可执行(x)权限,只有r. ...

  5. CRMEB中因为重写规则导致的服务器异常和404之解决办法

    问题描述:安装CRMEB后,只能通过https://域名//index.php/admin访问到后台,而不能直接通过https://域名/admin访问到后台,以至于导致进入系统后台出现有的功能界面可 ...

  6. CORS & CSP笔记

    1.CORS & CSP 浏览器跨域相关的安全策略主要存在于两个方面: 浏览器是否发送ajax 浏览器是否加载返回数据 假设从a.com 向b.com发送ajax请求.此时浏览器当前页面为a. ...

  7. ubuntu 如何查看安装了哪些包

    dpkg -l apt-cache search package 搜索包apt-cache show package 获取包的相关信息,如说明.大小.版本等sudo apt-get install p ...

  8. 阿里云ECS服务器环境搭建(1) —— ubuntu 16.04 图形界面的安装

    阿里云ECS服务器环境搭建(1) —— ubuntu 16.04 图形界面的安装1. 背景在我们购买阿里云ECS服务器之后,默认的系统环境是很干净的,我购买的是ubuntu16.04,远程登录进入之后 ...

  9. [转载]IBM公司发布了最新的power7服务器p750 p770 p780

    [转载]IBM公司发布了最新的power7服务器p750 p770 p780 (2015-06-11 12:54:17) 转载▼ http://blog.sina.com.cn/s/blog_6f52 ...

  10. ubuntu设置开机启动后命令行界面

    author:headsen chen date: 2019-09-19  14:23:31 在字符界面(即命令行界面)输入命令: 设置为字符界面的命令:sudo systemctl set-defa ...