Linux0.11源码学习(一)

linux0.11源码学习笔记

参考资料:https://github.com/sunym1993/flash-linux0.11-talk

源码查看:https://elixir.bootlin.com/linux/latest/source

开始

电脑开机后,CPU初始化,固定的BIOS程序运行,将硬盘启动区的512字节的内容,复制到内存中的 0x7c00 的位置,并跳转到该位置,然后CPU就自此位置开始执行指令。



这部分需要存放的是操作系统开始的代码,这样操作系统才能正常运行。

这部分内容对应于源码的bootsect.s文件

/boot/bootsect.s

mov ax,#BOOTSEG ;#BOOTSET已定义,表示立即数 0x07c0,
mov ds,ax

操作:

把 0x07c0 这个值复制到 ax 寄存器里,再将 ax 寄存器里的值复制到 ds 寄存器里。

解释:

寄存器知识回顾:



寄存器的英文全称或许能帮助记忆

general
ax(accumulator)
bx(base address register)
cx(counter)
dx(data register)
si(source index)
di(destination index)
sp(stack pointer)
bp(base pointer)
section
cs(code section)
ds(data section)
es(extern section)
ss(stack section)
ip(instruction pointer)

ds 是 16 位的数据段寄存器,在内存寻址时作为段基址使用。

值得一提,x86 汇编中,某个地址由段基址和偏移地址构成,构成方法为:段基址左移4位+偏移地址。例如:[0x7c0:0x001] = [0x7c01]。通常情况下,段基址可以省略,因为默认是ds。

为什么要给ds赋值0x07c0?

因为上面提到,BIOS程序将硬盘启动区的512字节的内容,复制到内存中的 0x7c00 的位置。这样将基址确定,方便通过该基址访问内存数据。

至于为什么0x7c00到0x7dff有512个字节,我们可以计算一下0x7dff-0x7c00=0x1ff=511,一个地址数实际上对应一个字节(8bit),因此实际上应当是0x7c00到0x7e00才是512字节,因为上面那张图解是大佬的,我们就暂时忽略这个小细节吧。


mov ax,#INITSEG ;#INITSEG已定义,表示立即数 0x9000
mov es,ax
mov cx,#256 ;256为十进制数
sub si,si ;si源变址寄存器清零 等价于si = si - si
sub di,di ;di目的变址寄存器
rep movw

操作:

将内存地址 0x7c00 处开始往后的 512 字节的数据,原封不动复制到 0x90000 处。

解释:

rep 表示重复执行后面的指令,这里表示重复执行movw,即不断重复地复制一个字。

重复执行多少次? 取决于 cx 寄存器中的值,也就是 256 次。

从哪复制到哪? 从 ds:si 处复制到 es:di 处。

一个字多大? 16 位,也就是两个字节。

图解:


jmpi go,0x9000
go:
mov ax,cs
mov ds,ax

操作:

指令运行跳转至特定位置

解释:

jmpi 是一个段间跳转指令,表示跳转到 0x9000:go 处执行。

go 就是一个标签,最终编译成机器码的时候会被翻译成一个值,这个值就是 go 这个标签在文件内的偏移地址。

图解:


go: mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov sp,#0xFF00

含义:

把 cs 寄存器的值分别复制给 ds、es 和 ss 寄存器,然后又把 0xFF00 给了 sp 寄存器。

解释:

cs 寄存器表示代码段寄存器。CPU 当前正在执行的代码在内存中的位置,就是由 cs:ip 这组寄存器配合指向的,其中 cs 是基址,ip 是偏移地址。

执行指令jmpi go,0x9000后,cs 寄存器里的值就是 0x9000,ip 寄存器里的值是 go 这个标签的偏移地址。因此 ds、es 和 ss 寄存器的值为 0x9000 。

ss 为栈段寄存器,后面要配合栈基址寄存器 sp 来表示此时的栈顶地址。而此时 sp 寄存器被赋值为了 0xFF00 了,所以目前的栈顶地址就是 ss:sp 所指向的地址 0x9FF00 处。

栈是向下发展的,这个栈顶地址 0x9FF00 要远远大于此时代码所在的位置 0x90000,所以栈向下发展就很难撞见代码所在的位置,也就比较安全。


load_setup:
mov dx,#0x0000 ! drive 0, head 0
mov cx,#0x0002 ! sector 2, track 0
mov bx,#0x0200 ! address = 512, in INITSEG
mov ax,#0x0200+SETUPLEN ! service 2, nr of sectors, knowned:SETUPLEN=4
int 0x13 ! read it
jnc ok_load_setup ! ok - continue
mov dx,#0x0000
mov ax,#0x0000 ! reset the diskette
int 0x13
j load_setup ok_load_setup:

含义:

调用 0x13 号中断程序 ,0x13 号中断的处理程序是 BIOS 提前给我们写好的,是读取磁盘的相关功能的函数。

具体作用是,将硬盘的第 2 个扇区开始,把数据加载到内存 0x90200 处,共加载 4 个扇区。

解释:

为dx,cx,bx,ax寄存器赋值,作为 0x13 号中断程序的参数;

int 是汇编指令,表示发起中断。

图解:


接上文

ok_load_setup:

! Get disk drive parameters, specifically nr of sectors/track

   mov	dl,#0x00
mov ax,#0x0800 ! AH=8 is get drive parameters
int 0x13
mov ch,#0x00
seg cs
mov sectors,cx
mov ax,#INITSEG !INITSEG = 0x9000
mov es,ax ! Print some inane message mov ah,#0x03 ! read cursor pos
xor bh,bh
int 0x10 mov cx,#24
mov bx,#0x0007 ! page 0, attribute 7 (normal)
mov bp,#msg1 ! msg1 is a sign , defined in the end of the file
mov ax,#0x1301 ! write string, move cursor
int 0x10 ! en,we've written the message, now. we want to load the system (at 0x10000)
! 为啥下面这一段都是注释状态啊,博客园你让强迫症怎么活! mov ax,#SYSSEG ! SYSSEG = 0x1000 system loaded at 0x10000 (65536).
mov es,ax ! segment of 0x010000
call read_it
call kill_motor ! After that we check which root-device to use. If the device is ! defined (!= 0), nothing is done and the given device is used. ! Otherwise, either /dev/PS0 (2,28) or /dev/at0 (2,8), depending ! on the number of sectors that the BIOS reports currently. seg cs
mov ax,root_dev
cmp ax,#0
jne root_defined
seg cs
mov bx,sectors
mov ax,#0x0208 ! /dev/ps0 - 1.2Mb
cmp bx,#15
je root_defined
mov ax,#0x021c ! /dev/PS0 - 1.44Mb
cmp bx,#18
je root_defined
undef_root:
jmp undef_root
root_defined:
seg cs
mov root_dev,ax ! after that (everyting loaded), we jump to ! the setup-routine loaded directly after ! the bootblock: jmpi 0,SETUPSEG ! SETUPSEG = 0x9020 setup starts here

含义:

主要功能是,把从硬盘第 6 个扇区开始往后的 240 个扇区,加载到内存 0x10000 处。

图解:

衔接:

上述程序使用jmpi, 还记得吗,jmpi 是一个段间跳转指令,表示跳转到 0x9020:0 处执行。这里是什么内容呢,实际上是/boot/setup.s文件的第一行代码。为什么呢?

且看图解:



上图表明了源代码经过编译后生成的机器指令在操作系统开始阶段在内存中运行的位置。

我们看到0x90200的位置正好是硬盘第二扇区的开始,即/boot/setup.s的开始内容。

下一篇:

Linux0.11源码学习(二)

Linux0.11源码学习(一)的更多相关文章

  1. linux0.11源码内核——系统调用,int80的实现细节

    linux0.11添加系统调用的步骤 假设添加一个系统调用foo() 1.修改include/linux/sys.h 添加声明 extern int foo(); 同时在sys_call_table数 ...

  2. linux 0.11 源码学习+ IO模型

    http://www.cnblogs.com/Fredric-2013/category/696688.html

  3. linuxlinux0.11源码学习——bootsect.s学习

    由于一直想写一个自己的操作系统,网上推荐了<linux内核完全注释>.自学了一个星期,感觉这本书还是很好的,同时写下关于内核代码的理解,如果有什么不对的对方,欢迎大家一起来交流. 在内核引 ...

  4. Spring 源码学习笔记11——Spring事务

    Spring 源码学习笔记11--Spring事务 Spring事务是基于Spring Aop的扩展 AOP的知识参见<Spring 源码学习笔记10--Spring AOP> 图片参考了 ...

  5. Linux 0.11源码阅读笔记-中断过程

    Linux 0.11源码阅读笔记-中断过程 是什么中断 中断发生时,计算机会停止当前运行的程序,转而执行中断处理程序,然后再返回原被中断的程序继续运行.中断包括硬件中断和软件中断,硬中断是由外设自动产 ...

  6. Java集合专题总结(1):HashMap 和 HashTable 源码学习和面试总结

    2017年的秋招彻底结束了,感觉Java上面的最常见的集合相关的问题就是hash--系列和一些常用并发集合和队列,堆等结合算法一起考察,不完全统计,本人经历:先后百度.唯品会.58同城.新浪微博.趣分 ...

  7. MVC系列——MVC源码学习:打造自己的MVC框架(三:自定义路由规则)

    前言:上篇介绍了下自己的MVC框架前两个版本,经过两天的整理,版本三基本已经完成,今天还是发出来供大家参考和学习.虽然微软的Routing功能已经非常强大,完全没有必要再“重复造轮子”了,但博主还是觉 ...

  8. MVC系列——MVC源码学习:打造自己的MVC框架(二:附源码)

    前言:上篇介绍了下 MVC5 的核心原理,整篇文章比较偏理论,所以相对比较枯燥.今天就来根据上篇的理论一步一步进行实践,通过自己写的一个简易MVC框架逐步理解,相信通过这一篇的实践,你会对MVC有一个 ...

  9. jQuery1.11源码分析(1)-----Sizzle源码概览[原创]

    最近在啃jQuery1.11源码,上来就遇到Sizzle这个jQuery的大核心,虽然已经清楚了Sizzle的用途,先绕过去也没事,但明知山有虎偏向虎山行才是我们要做的. 本文面向的阅读对象:正在学习 ...

  10. 【iScroll源码学习04】分离IScroll核心

    前言 最近几天我们前前后后基本将iScroll源码学的七七八八了,文章中未涉及的各位就要自己去看了 1. [iScroll源码学习03]iScroll事件机制与滚动条的实现 2. [iScroll源码 ...

随机推荐

  1. vim 基础

    光标移动(命令模式的上下左右):k,j,h,l 保存/退出 仅保存::w 退出::q(如果有修改要先保存) 保存并退出::wq(x效果一致) 强制退出::q! 模式 命令模式:esc(当前需要处于插入 ...

  2. uniapp使用rich-text内容过长在真机无法滚动

    解决方案:在rich-text标签上加scroll-view解决 <scroll-view scroll-y="true" style="height: 745rp ...

  3. js本地时钟

    js本地时钟,如上图所示,秒是跳动的 1 // 本地时钟 2 function clockon() { 3 var now = new Date(); 4 var year = now.getFull ...

  4. AJAX-动力节点

    AJAX(Asynchronous Javascript And Xml) 传统请求及缺点 传统的请求都有哪些? 直接在浏览器地址栏上输入URL. 点击超链接 提交form表单 使用JS代码发送请求 ...

  5. 杭电OJ--1003题C++实现

    #include<iostream>using namespace std;int a[100000];void solve(int k,int n,int t);int main(){  ...

  6. oracle相关知识

    1. 给表字段添加注释的语法 comment on column 表名.字段名 is '注释信息'; 2. 数据库字段重命名 alter table ORGAN_PARTER_EXT_TWO rena ...

  7. Vue获取DOM的几种方法

    虽然Vue实现了MVVM模型,将数据和表现进行了分离,我们只需要更新数据就能使DOM同步更新,但是某些情况下,还是需要获取DOM元素进行操作(比如引入的某个库要求传入一个根dom元素作为根节点,或者写 ...

  8. 量化交易——MACD是什么,用python来验证交易时把它作为买卖信号到底靠不靠谱

    在我刚开始学习股票的时候,是跟着b站上的视频学习的,当讲到macd的时候,up主反复强调macd是指标之王,股票里面有那么多的指标,但是却只有macd被称为指标之王,当macd出现金叉的时候,预示着股 ...

  9. String 练习题

    题目一:获取指定字符串中,大写字母.小写字母.数字的个数. 题目二:将字符串中,第一个字母转换成大写,其他字母转换成小写,并打印改变后的字符串. 题目三:查询大字符串中,出现指定小字符串的次数.如&q ...

  10. 12.14linux学习第十七天

    今天老刘收了下第13章尾巴,讲了第14章和第15章. 13.6 分离解析技术 现在,喜欢看我们这本<Linux就该这么学>的海外读者越来越多,如果继续把本书配套的网站服务器(https:/ ...