当我们说一个CPU是"16位"或"32"位时,指的是处理器中"算数逻辑单元"(ALU)的宽度.数据总线通常与ALU具有相同的宽度.当Intel决定在16位CPU 8086中采用1M字节的内存空间,地址总线的宽度也就确定了,那就是20位.问题就来了:既然是ALU是16位,也就是说直接加以运算的指针长度是16位,即这个指针所能代表的地址最多有216,不能达到20位地址总线所能寻址的最大空间,于是Intel在8086 CPU中设置了4个"段寄…
http://blog.sina.com.cn/s/blog_6b94d5680101vfqv.html Linux内核源代码情景分析---第五章 文件系统  5.1 概述 构成一个操作系统最重要的就是 进程管理 与 文件系统: 有些操作系统有进程管理而没有文件系统,有些操作系统有文件系统而没有进程管理(MSDOS):两者都没有那就不是操作系统了: 狭义的文件:指磁盘文件,进入指可以是有序地存储在任何介质中(包括内存)的一组信息. 广义的文件:(unix把外部设备也当成文件)凡是可以产生或消耗信…
Intel X86 CPU 系列的寻址方式 数据总线和地址总线要尽量相同,这个是一个地址就是一个指针.…
linux 内核采用页式存储管理.虚拟地址空间划分成固定大小的"页面",由MMU在运行时将虚拟地址映射成某个物理内存页面中的地址.页式内存管理比段式内存管理有很多好处,但是由于Intel是先使用段式管理的,然后才发明了页式管理,为了兼容,i386 CPU 一律对程序中使用的地址先进行段式映射,然后才能进行页式映射,既然CPU的硬件结构是这样,linux内核也只好服从intel的选择.通过一个例子看看linux内核是怎样在i386 CPU 上进行地址映射的. 假设我们写了这么一个程序:…
父进程fork子进程: child = fork() fork经过系统调用.来到了sys_fork.具体过程请參考Linux内核源码情景分析-系统调用. asmlinkage int sys_fork(struct pt_regs regs) { return do_fork(SIGCHLD, regs.esp, &regs, 0); } int do_fork(unsigned long clone_flags, unsigned long stack_start, //stack_start…
386 CPU中的页式存管的基本思路是:通过页面目录和页面表分两个层次实现从线性地址到物理地址的映射.这种映射模式在大多数情况下可以节省页面表所占用的空间.因为大多数进程不会用到整个虚存空间,在虚存空间中通常都留有很大的"空洞".采用两层的方式,只要一个目录项所对应的的那部分空间是个空洞,就可以把该目录项设置为空,从而剩下了与之对应的页面表.当地址的宽度是32时,两层映射机制比较有效也比较合理,但是,当地址的宽度大于32位时就不够有效了. 因此,linux 内核的映射机制设计成3层,在…
linux 内核的主体是以GNU的C语言编写的,GNU为此提供了编译工具gcc.GNU对C语言本身作了不少扩充. 1) gcc 从 C++ 语言中吸收了"inline"和"const".inline 函数的使用与#define 宏定义相似,但更有相对的独立性,也更安全,因为"inline"函数会进行参数的类型检查.使用inline 函数也有利于程序调试.如果编译时不加优化,则这些inline函数就是普通的.独立的函数,更便于调试.调试好了以后,再…
上一节中,我们浏览了一次因越界访问而造成映射失败从而引起进程流产的过程,不过有时候,越界访问时正常的.现在我们就来看看当用户堆栈过小,但是因越界访问而"因祸得福"得以伸展的情景. 假设在进程运行的过程中,已经用尽了为本进程分配的堆栈空间,此时CPU 中的堆栈指针%esp已经指向堆栈区间的起始地址,如下图 假设现在需要调用某个子程序,因此CPU 需将返回地址压入堆栈,也就是要将返回地址写入虚存空间中地址为(%esp-4)的地方,可以在我们这个情景中地址(%esp-4)落入了空洞中,这是尚…
1. 用汇编语言编写部分核心代码的原因: ① 操作系统内核中的底层程序直接与硬件打交道,需要用到一些专用的指令,而这些指令在C语言中并无对应的语言成分: ② CPU中的一些特殊指令也没有对应的C语言成分,如关中断.开中断等等: ③ 内核中的某些函数在运行时会非常频繁的被调用,因此效率就显得很重要,用汇编语言写的程序效率通常要比高级语言编写的高: ④ 在某些特殊场合,一段程序的空间效率也会显得很重要: 2. linux 采用了AT&T的386汇编语言格式,而没有用Intel的,它们之间的差别主要有…
一.中断初始化 1.中断向量表IDT初始化 void __init init_IRQ(void) { int i; #ifndef CONFIG_X86_VISWS_APIC init_ISA_irqs(); #else init_VISWS_APIC_irqs(); #endif /* * Cover the whole vector space, no vector can escape * us. (some of these will be overridden and become *…
页式存储管理机制通过页面目录和页面表将每个线性地址转换成物理地址,当遇到下面几种情况就会使CPU产生一次缺页中断,从而执行预定的页面异常处理程序: ① 相应的页面目录或页表项为空,也就是该线性地址与物理地址的关系还没建立或者已经撤销 ② 相应的物理页面不在内存中 ③ 指令规定的访问方式与页面的权限不符 我们假设一个情景,当我们的用户程序将一个打开的文件通过mmap()映射到内存,然后又通过munmap()撤销映射.在撤销一个映射区间时,常常会在虚存地址空间中留下一个空洞,而相应的地址则不应继续使…
页面目录PGD.中间目录PMD和页面表PT分别是由表项pgd_t.pmd_t和pte_t构成的数组,而这些表项都是数据结构 1 /* 2 * These are used to make use of C type-checking.. 3 */ 4 #if CONFIG_X86_PAE 5 typedef struct { unsigned long pte_low, pte_high; } pte_t; 6 typedef struct { unsigned long long pmd; }…
http://pan.baidu.com/s/1sjIwswP…
可以看出,在页面目录中共有210 = 1024个目录项,每个目录项指向一个页面表,而在每个页面表中又共有1024个页面描述项. 由图看出来,从线性地址到物理地址的映射过程为: 1)从CR3取得页面目录的基地址: 2)以线性地址中的dir位段为下标,在目录中取得相应页面表的基地址: 3)以线性地址中的page位段为下标,在所得到的的页面表中取得相应的页面描述项: 4)将页面描述项中给出的页面基地址与线性地址中的offset位段相加得到物理地址: 目录项结构为: 目录项的直观表示如下图: 页表项的结…
进程可以通过mmap把一个已打开文件映射到用户空间. mmap(void*start,size_t length,int prot,int flags,int fd,off_t offset) start表示用户空间映射的起始地址,offset文件的起始length长度. asmlinkage long sys_mmap2(unsigned long addr, unsigned long len, unsigned long prot, unsigned long flags, unsigne…
Linux内核源代码分析方法   一.内核源代码之我见 Linux内核代码的庞大令不少人"望而生畏",也正由于如此,使得人们对Linux的了解仅处于泛泛的层次.假设想透析Linux,深入操作系统的本质,阅读内核源代码是最有效的途径.我们都知道,想成为优秀的程序猿,须要大量的实践和代码的编写.编程固然重要,可是往往仅仅编程的人非常easy把自己局限在自己的知识领域内.假设要扩展自己知识的广度,我们须要多接触其它人编写的代码,尤其是水平比我们更高的人编写的代码.通过这样的途径,我们能够跳出…
linux内核分析学习笔记 --第四章 系统调用的三层机制 学习重点--系统调用 用户态.内核态和中断 Intel x86 CPU有四种不同的执行级别,分别是0,1,2,3其中数字越小,特权越高. Linux操作系统只采用了其中的0和3两个特权级别,分别对应内核态和用户态. 内核态:对应高执行级别,代码可以执行特权指令,访问任意物理内存,CPU执行级别对应的内核态. 内核态的CS:EIP指向范围是任意地址 用户态:对应底执行级别,代码能够掌控的范围会受到限制. 用户态时,以32位x86机器为例,…
本文是<go调度器源代码情景分析>系列 第一章 预备知识的第1小节. 寄存器是CPU内部的存储单元,用于存放从内存读取而来的数据(包括指令)和CPU运算的中间结果,之所以要使用寄存器来临时存放数据而不是直接操作内存,一是因为CPU的工作原理决定了有些操作运算只能在CPU内部进行,二是因为CPU读写寄存器的速度比读写内存的速度快得多. 为了便于交流和使用汇编语言进行编程,CPU厂商为每个寄存器都取了一个名字,比如AMD64 CPU中的rax, rbx, rcx, rdx等等,这样程序员就可以很方…
第三章 这一章接触内核源代码,对内核源码进行编译和调试跟踪 一.预备知识: 内核:整个操作系统的最底层,它负责了整个硬件的驱动以及提供各种系统所需的内核功能.内核实质上是系统上面的一个文件而已,这个文件包含了驱动主机各项硬件的检测程序与驱动模块.当系统读完BIOS并加载MBR内的引导装载程序后,就能够加载内核到内存当中.然后内核开始检测硬件,挂载根目录并取得内核模块来驱动所有的硬件,之后调用/sbin/init就能依序启动多有系统所需要的服务了. Qemu :以GPL许可证分发源码的模拟处理器,…
课本:第4章 系统调用的三层机制(上) -用户态.内核态和中断 -用户态:在低的执行级别下,代码能够掌控的范围有所限制,只能访问部分内存. -内核态:在高的执行级别下,代码可以执行特权指令,访问任意的物理内存. -中断:从用户态进入内核态的主要方式. -中断类别 - 硬件中断:在用户态进程执行时,硬件中断信号到来,进入内核态,就会执行这个中断对应的中断服务例程. - 软中断:在用户态进程执行过程中,调用了一个系统调用(一种特殊中断),进入内核态. 寄存器上下文切换 当用户态切换到内核态时,就要把…
课本:第3章 MenuOS的构造 内容总结 计算机的"三大法宝" 存储程序计算机 函数调用堆栈 中断 操作系统的"两把宝剑" 中断上下文切换:保存现场和恢复现场 进程上下文切换 在接触linux内核源代码时,linux是基于一个稳定版的内核Linux-3.18.6.其内核源码的目录结构如下: 其中,arch目录是与体系结构相关的子目录列表,里面存放了许多CPU体系结构的相关代码.arch目录中的代码在linux内核代码中占比相当庞大,主要是因为arch目录中的代码可…
视频内容知识学习 一.用户态.内核态和中断 1.内核态:处于高的执行级别下,代码可以执行特权指令,访问任意的物理地址,这时的CPU就对应内核态 2.用户态:处于低的执行级别下,代码只能在级别允许的特定范围内活动.在日常操作下,执行系统调用的方式是通过库函数,库函数封装系统调用,为用户提供接口以便直接使用. 3.Intel x86 CPU有四种不同的执行级别0-3,Linux只使用了其中的0 3级分别表示内核态和用户态.cs寄存器的最低两位表明了当前代码的特权级,00或者11. 4.内核态cs:e…
攥写人:李鹏举 学号:20179203 ( 原创作品转载请注明出处) ( 学习课程:<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ) 一.linux内核源代码 首先来看一下这次实验中用到的Linux内核源代码: http://codelab.shiyanlou.com/xref/linux-3.18.6/ 根据电子课堂的讲述,我从中看到了一些值得注意的几个关键目录 /arch 该目录中包含和硬件体系结构相关的…
本次的实验是使用gdb跟踪调试内核从start_kernel到init进程启动,并分析启动的过程. 1.首先是在实验楼虚拟机上进行调试跟踪的过程. cd LinuxKernel qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img 内核启动后进入menu程序 使用gdb跟踪调试内核: qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img…
第3章  MenuOS的构造 1  Linux内核源代码简介        计算机的“3大法宝”:存储程序计算机.函数调用堆栈和中断. 操作系统的“两把宝剑”:一把是中断上下文的切换——保存现场和恢复现场:另一把是进程上下文的切换. Linux内核源码目录如下图所示:         其中可以把内核源代码目录分为系统最核心组件和系统次核心组件. 系统最核心组件包括:  arch目录:该目录是与体系结构相关的子目录列表,里面存放了许多CPU体系结构的相关代码,比如arm.x86.MIPS.PPC等…
第2章  操作系统是如何工作的 1  计算机的三大法宝      存储程序计算机:冯诺依曼结构 函数调用堆栈机制:记录调用的路径和参数的空间 中断机制:由CPU和内核代码共同实现了保存现场和恢复现场,把ebp,esp,eip寄存器的数据push到内核堆栈中.再把eip指向中断程序的入口,保存现场. EBP(基址指针)寄存器在C语言中用作记录当前函数调用的基址,如果当前函数调用比较深,每一个函数的EBP是不一样的.函数调用堆栈就是由多个逻辑上的堆栈叠起来的框架,利用这样的堆栈框架实现函数的调用和返…
第三章 MenuOs的构造 一.前情回顾 计算机的三大法宝: -存储程序计算机 -函数调用堆栈 -中断 操作系统的两把宝剑: -中断上下文的切换(保存现场和恢复现场) -进程上下文的切换 二.3.1 Linux内核源代码简介 Linux内核的版本号按照A,B,C的方式命名: -A代表大幅度转变的内核 -B代表重大修改的内核 -C指轻微修改的内核(C是内核的真实版本) -D是安全补丁和bug修复 Linux内核源代码的根目录: 三.跟踪分析Linux内核启动过程 实验过程 1.通过以下代码内核启动…
Week4 MenuOS的构造 一.上周复习 计算机的三大法宝: 存储程序计算机: 函数调用堆栈: 中断. 操作系统的两把宝剑: 中断上下文-保存现场和恢复现场 进程上下文 二.Linux内核源代码简介 Linux内核的版本号按照A,B,C的方式命名: A代表大幅度转变的内核 B代表重大修改的内核 C指轻微修改的内核(C是内核的真实版本) D是安全补丁和bug修复 Linux内核源代码的根目录 arch arch目录中的代码在Linux内核代码中占比相当庞大 arch/x86目录下的代码是需要重…
<Linux内核分析> 第三章 MenuOS的构造 3.1 Linux内核源代码简介 操作系统的"两把宝剑" 中断上下文:保存现场和恢复现场 进程上下文 目录结构 arch:与体系结构相关的子目录列表,存放CPU体系结构的相关代码 block:存放Linux存储体系中关于块设备管理的代码 crypto:存放常见的加密算法的C语言代码 Documentation:存放一些文档 drivers:驱动目录,里面分门别类的存放了Linux内核支持的所有硬件设备的驱动源代码 firm…
第五周学习内容 庖丁解牛Linux内核分析第四章:系统调用的三层机制(上) Linux内核分析实验四 学到的一些知识 4.1用户态.内核态.中断 宏观上Linux操作系统的体系架构分为用户态和内核态 Intel x86 CPU有4种不同的执行级别,分别是0.1.2.3,数字越小,特权越高,而Linux只采用了0,3两个特权级别,分别对应内核态和用户态,用户态和内核态很显著的区分方法就是CS:EIP的指向范围,拿32位系统来说,总共有2的32次方地址空间,也就是4GB,内核态可以访问全部地址空间,…