Linux0.11源码学习(一)

linux0.11源码学习笔记

参考资料:https://github.com/sunym1993/flash-linux0.11-talk

源码查看:https://elixir.bootlin.com/linux/latest/source

开始

电脑开机后,CPU初始化,固定的BIOS程序运行,将硬盘启动区的512字节的内容,复制到内存中的 0x7c00 的位置,并跳转到该位置,然后CPU就自此位置开始执行指令。



这部分需要存放的是操作系统开始的代码,这样操作系统才能正常运行。

这部分内容对应于源码的bootsect.s文件

/boot/bootsect.s

mov ax,#BOOTSEG ;#BOOTSET已定义,表示立即数 0x07c0,
mov ds,ax

操作:

把 0x07c0 这个值复制到 ax 寄存器里,再将 ax 寄存器里的值复制到 ds 寄存器里。

解释:

寄存器知识回顾:



寄存器的英文全称或许能帮助记忆

general
ax(accumulator)
bx(base address register)
cx(counter)
dx(data register)
si(source index)
di(destination index)
sp(stack pointer)
bp(base pointer)
section
cs(code section)
ds(data section)
es(extern section)
ss(stack section)
ip(instruction pointer)

ds 是 16 位的数据段寄存器,在内存寻址时作为段基址使用。

值得一提,x86 汇编中,某个地址由段基址和偏移地址构成,构成方法为:段基址左移4位+偏移地址。例如:[0x7c0:0x001] = [0x7c01]。通常情况下,段基址可以省略,因为默认是ds。

为什么要给ds赋值0x07c0?

因为上面提到,BIOS程序将硬盘启动区的512字节的内容,复制到内存中的 0x7c00 的位置。这样将基址确定,方便通过该基址访问内存数据。

至于为什么0x7c00到0x7dff有512个字节,我们可以计算一下0x7dff-0x7c00=0x1ff=511,一个地址数实际上对应一个字节(8bit),因此实际上应当是0x7c00到0x7e00才是512字节,因为上面那张图解是大佬的,我们就暂时忽略这个小细节吧。


mov ax,#INITSEG ;#INITSEG已定义,表示立即数 0x9000
mov es,ax
mov cx,#256 ;256为十进制数
sub si,si ;si源变址寄存器清零 等价于si = si - si
sub di,di ;di目的变址寄存器
rep movw

操作:

将内存地址 0x7c00 处开始往后的 512 字节的数据,原封不动复制到 0x90000 处。

解释:

rep 表示重复执行后面的指令,这里表示重复执行movw,即不断重复地复制一个字。

重复执行多少次? 取决于 cx 寄存器中的值,也就是 256 次。

从哪复制到哪? 从 ds:si 处复制到 es:di 处。

一个字多大? 16 位,也就是两个字节。

图解:


jmpi go,0x9000
go:
mov ax,cs
mov ds,ax

操作:

指令运行跳转至特定位置

解释:

jmpi 是一个段间跳转指令,表示跳转到 0x9000:go 处执行。

go 就是一个标签,最终编译成机器码的时候会被翻译成一个值,这个值就是 go 这个标签在文件内的偏移地址。

图解:


go: mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov sp,#0xFF00

含义:

把 cs 寄存器的值分别复制给 ds、es 和 ss 寄存器,然后又把 0xFF00 给了 sp 寄存器。

解释:

cs 寄存器表示代码段寄存器。CPU 当前正在执行的代码在内存中的位置,就是由 cs:ip 这组寄存器配合指向的,其中 cs 是基址,ip 是偏移地址。

执行指令jmpi go,0x9000后,cs 寄存器里的值就是 0x9000,ip 寄存器里的值是 go 这个标签的偏移地址。因此 ds、es 和 ss 寄存器的值为 0x9000 。

ss 为栈段寄存器,后面要配合栈基址寄存器 sp 来表示此时的栈顶地址。而此时 sp 寄存器被赋值为了 0xFF00 了,所以目前的栈顶地址就是 ss:sp 所指向的地址 0x9FF00 处。

栈是向下发展的,这个栈顶地址 0x9FF00 要远远大于此时代码所在的位置 0x90000,所以栈向下发展就很难撞见代码所在的位置,也就比较安全。


load_setup:
mov dx,#0x0000 ! drive 0, head 0
mov cx,#0x0002 ! sector 2, track 0
mov bx,#0x0200 ! address = 512, in INITSEG
mov ax,#0x0200+SETUPLEN ! service 2, nr of sectors, knowned:SETUPLEN=4
int 0x13 ! read it
jnc ok_load_setup ! ok - continue
mov dx,#0x0000
mov ax,#0x0000 ! reset the diskette
int 0x13
j load_setup ok_load_setup:

含义:

调用 0x13 号中断程序 ,0x13 号中断的处理程序是 BIOS 提前给我们写好的,是读取磁盘的相关功能的函数。

具体作用是,将硬盘的第 2 个扇区开始,把数据加载到内存 0x90200 处,共加载 4 个扇区。

解释:

为dx,cx,bx,ax寄存器赋值,作为 0x13 号中断程序的参数;

int 是汇编指令,表示发起中断。

图解:


接上文

ok_load_setup:

! Get disk drive parameters, specifically nr of sectors/track

   mov	dl,#0x00
mov ax,#0x0800 ! AH=8 is get drive parameters
int 0x13
mov ch,#0x00
seg cs
mov sectors,cx
mov ax,#INITSEG !INITSEG = 0x9000
mov es,ax ! Print some inane message mov ah,#0x03 ! read cursor pos
xor bh,bh
int 0x10 mov cx,#24
mov bx,#0x0007 ! page 0, attribute 7 (normal)
mov bp,#msg1 ! msg1 is a sign , defined in the end of the file
mov ax,#0x1301 ! write string, move cursor
int 0x10 ! en,we've written the message, now. we want to load the system (at 0x10000)
! 为啥下面这一段都是注释状态啊,博客园你让强迫症怎么活! mov ax,#SYSSEG ! SYSSEG = 0x1000 system loaded at 0x10000 (65536).
mov es,ax ! segment of 0x010000
call read_it
call kill_motor ! After that we check which root-device to use. If the device is ! defined (!= 0), nothing is done and the given device is used. ! Otherwise, either /dev/PS0 (2,28) or /dev/at0 (2,8), depending ! on the number of sectors that the BIOS reports currently. seg cs
mov ax,root_dev
cmp ax,#0
jne root_defined
seg cs
mov bx,sectors
mov ax,#0x0208 ! /dev/ps0 - 1.2Mb
cmp bx,#15
je root_defined
mov ax,#0x021c ! /dev/PS0 - 1.44Mb
cmp bx,#18
je root_defined
undef_root:
jmp undef_root
root_defined:
seg cs
mov root_dev,ax ! after that (everyting loaded), we jump to ! the setup-routine loaded directly after ! the bootblock: jmpi 0,SETUPSEG ! SETUPSEG = 0x9020 setup starts here

含义:

主要功能是,把从硬盘第 6 个扇区开始往后的 240 个扇区,加载到内存 0x10000 处。

图解:

衔接:

上述程序使用jmpi, 还记得吗,jmpi 是一个段间跳转指令,表示跳转到 0x9020:0 处执行。这里是什么内容呢,实际上是/boot/setup.s文件的第一行代码。为什么呢?

且看图解:



上图表明了源代码经过编译后生成的机器指令在操作系统开始阶段在内存中运行的位置。

我们看到0x90200的位置正好是硬盘第二扇区的开始,即/boot/setup.s的开始内容。

下一篇:

Linux0.11源码学习(二)

Linux0.11源码学习(一)的更多相关文章

  1. linux0.11源码内核——系统调用,int80的实现细节

    linux0.11添加系统调用的步骤 假设添加一个系统调用foo() 1.修改include/linux/sys.h 添加声明 extern int foo(); 同时在sys_call_table数 ...

  2. linux 0.11 源码学习+ IO模型

    http://www.cnblogs.com/Fredric-2013/category/696688.html

  3. linuxlinux0.11源码学习——bootsect.s学习

    由于一直想写一个自己的操作系统,网上推荐了<linux内核完全注释>.自学了一个星期,感觉这本书还是很好的,同时写下关于内核代码的理解,如果有什么不对的对方,欢迎大家一起来交流. 在内核引 ...

  4. Spring 源码学习笔记11——Spring事务

    Spring 源码学习笔记11--Spring事务 Spring事务是基于Spring Aop的扩展 AOP的知识参见<Spring 源码学习笔记10--Spring AOP> 图片参考了 ...

  5. Linux 0.11源码阅读笔记-中断过程

    Linux 0.11源码阅读笔记-中断过程 是什么中断 中断发生时,计算机会停止当前运行的程序,转而执行中断处理程序,然后再返回原被中断的程序继续运行.中断包括硬件中断和软件中断,硬中断是由外设自动产 ...

  6. Java集合专题总结(1):HashMap 和 HashTable 源码学习和面试总结

    2017年的秋招彻底结束了,感觉Java上面的最常见的集合相关的问题就是hash--系列和一些常用并发集合和队列,堆等结合算法一起考察,不完全统计,本人经历:先后百度.唯品会.58同城.新浪微博.趣分 ...

  7. MVC系列——MVC源码学习:打造自己的MVC框架(三:自定义路由规则)

    前言:上篇介绍了下自己的MVC框架前两个版本,经过两天的整理,版本三基本已经完成,今天还是发出来供大家参考和学习.虽然微软的Routing功能已经非常强大,完全没有必要再“重复造轮子”了,但博主还是觉 ...

  8. MVC系列——MVC源码学习:打造自己的MVC框架(二:附源码)

    前言:上篇介绍了下 MVC5 的核心原理,整篇文章比较偏理论,所以相对比较枯燥.今天就来根据上篇的理论一步一步进行实践,通过自己写的一个简易MVC框架逐步理解,相信通过这一篇的实践,你会对MVC有一个 ...

  9. jQuery1.11源码分析(1)-----Sizzle源码概览[原创]

    最近在啃jQuery1.11源码,上来就遇到Sizzle这个jQuery的大核心,虽然已经清楚了Sizzle的用途,先绕过去也没事,但明知山有虎偏向虎山行才是我们要做的. 本文面向的阅读对象:正在学习 ...

  10. 【iScroll源码学习04】分离IScroll核心

    前言 最近几天我们前前后后基本将iScroll源码学的七七八八了,文章中未涉及的各位就要自己去看了 1. [iScroll源码学习03]iScroll事件机制与滚动条的实现 2. [iScroll源码 ...

随机推荐

  1. Python冰墩墩(非原创,搬运工)

    import turtle turtle.title('2022北京冬奥会冰墩墩') turtle.speed(10000) # 速度 # 左手 turtle.penup() turtle.goto( ...

  2. Docker部署网心云-挣点电费

    网心云 是CDN业务的一种,容器魔方 是网心云的容器安装产品,其安装也很简单. 1.启动容器--一行命令 docker run -d --name watchtower --restart alway ...

  3. MVC+EF API 跨域

    MVC+EF API --2 一. MVC+EF 不管是MvcHAIS Ef 都有文件夹Controller 二.Link查询 多表联查 匿名类型 三.Postman使用 四.mvc访问使用API 跨 ...

  4. 求两个自然数之间的最大公约数C++实现

    1 #include "pch.h" 2 #include <iostream> 3 using namespace std; 4 5 int main() 6 { 7 ...

  5. Spectracom 默认口令

    网络空间搜索: FoFa 找到页面: 默认口令 在github上去找 登陆成功 End!!!

  6. kafka消费者3种分配策略

    0.10.2.1 版本的Kafka 有两种分配策略,由消费者测的参数partition.assignment.strategy来控制. RoundRobinAssignor分配策略 RangeAssi ...

  7. std::unique_ptr release的使用

    在c++中,动态内存管理是通过new/delete 运算符来进行的.由于确保在正确的时间释放内存是很困难的,为了避免内存泄漏,更加容易,安全地使用动态内存,C++11标准库提供了两种智能指针类型来管理 ...

  8. docker build提示 error checking context:can't stat xxx

    这个提示基本是权限不够外加目录结构不对,保险的做法直接删除 Dockerfile. 正确做法:(可能还有其他的解决方案吧,这个可以生效) 重新建个目录,给目录授权,然后再dockerfile文件夹中建 ...

  9. antd EditableProTable 组件的简单用法

    首先,antd EditableProTable 组件是在 table组件的基础上又封装了一层,可以实现行更新,删除,增加.只需动动手指,简单配置一下即可. 先下载 EditableProTable ...

  10. 如何修改被编译后DLL文件 (转发)

    我们平时在工作中经常会遇到一些已经被编译后的DLL,而且更加麻烦是没有源代码可以进行修改,只能针对这个DLL的文件进行修改才能得到我们想要的结果:本文将通过一个实例来演示如果完成一个简单的修改;我们将 ...