Linux内核启动过程概述

Linux的启动代码真的挺大，从汇编到C，从Makefile到LDS文件，需要理解的东西很多。毕竟Linux内核是由很多人，花费了巨大的时间和精力写出来的。而且直到现在，这个世界上仍然有成千上万的程序员在不断完善Linux内核的代码。今天我们主要讲解的是Linux-2.6.22.6这个内核版本。说句实话，博主也不确定自己能够讲好今天这个题目，因为这个题目太大太难。但是博主有信心，将自己学会的内容清楚地告诉大家，希望大家也能够有所收获。

1.启动文件head.S和head-common.S　

　　首先，我们必须明确“我们为什么要启动Linux内核”。没错，当然是因为我们想要使用Linux系统，要明确我们的最终目的是使用Linux上的应用程序。这些应用程序可以是纯软件的，也可以是硬件相关的。博主是做嵌入式开发的，那么我想要的当然就是用Linux内核来更好的控制我的硬件。无论是做机器人、无人机或者其他智能硬件这都是必然趋势。首先我们来看内核的启动文件head.S。

    .section ".text.head", "ax"

    .type    stext, %function

ENTRY(stext)

    msr    cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode

                        @ and irqs disabled

    mrc    p15, 0, r9, c0, c0        @ get processor id

    bl    __lookup_processor_type        @ r5=procinfo r9=cpuid

    movs    r10, r5                @ invalid processor (r5=0)?

    beq    __error_p            @ yes, error 'p'

    bl    __lookup_machine_type        @ r5=machinfo

    movs    r8, r5                @ invalid machine (r5=0)?

    beq    __error_a            @ yes, error 'a'

    bl    __create_page_tables

    ldr    r13, __switch_data        @ address to jump to after

                        @ mmu has been enabled

    adr    lr, __enable_mmu        @ return (PIC) address

    add    pc, r10, #PROCINFO_INITFUNC

　　首先看这段汇编代码，它主要是用来做一些内核启动前的检测：__lookup_processor_type 检测内核是否支持当前CPU、__lookup_machine_type检测是否支持当前单板，并且__create_page_tables创建页表，__enable_mmu使能MMU。如果在一系列的自检过程后发现不支持，则跳到__error_p或__error_a。这里我们首先打开__lookup_machine_type。

    .type    __lookup_machine_type, %function

__lookup_machine_type:

    adr    r3, 3b

    ldmia    r3, {r4, r5, r6}

    sub    r3, r3, r4            @ get offset between virt&phys

    add    r5, r5, r3            @ convert virt addresses to

    add    r6, r6, r3            @ physical address space

1:    ldr    r3, [r5, #MACHINFO_TYPE]    @ get machine type

    teq    r3, r1                @ matches loader number?

    beq    2f                @ found

    add    r5, r5, #SIZEOF_MACHINE_DESC    @ next machine_desc

    cmp    r5, r6

    blo    1b

    mov    r5, #0                @ unknown machine

2:    mov    pc, lr

3:    .long    .

    .long    __arch_info_begin

    .long    __arch_info_end

　　我们在arch\arm\kernel找到__lookup_machine_type被定义在head-common.S文件中。开始分析代码：首先，读出3b的地址给r3,这里的3b就是下面的那个3：所对应的虚拟地址。然后用ldmia指令将r3存放的虚拟地址分别存入r4,r5,r6。所以现在

r4=. ； r5=__arch_info_begin ； r6=__arch_info_end

然后用r3-r4求出偏移地址，再利用这个偏移地址求出r5和r6的实际物理地址。其中__arch_info_begin和__arch_info_end定义在内核目录arch\arm\kernel下vmlinux.lds文件中，经过起始虚拟地址= (0xc0000000) + 0x00008000逐层叠加得到。

SECTIONS

{

 . = (0xc0000000) + 0x00008000;

 .text.head : {

  _stext = .;

  _sinittext = .;

  *(.text.head)

 }

 .init : { /* Init code and data        */

   *(.init.text)

  _einittext = .;

  __proc_info_begin = .;

   *(.proc.info.init)

  __proc_info_end = .;

  __arch_info_begin = .;

   *(.arch.info.init)

  __arch_info_end = .;

　　这里的__arch_info_begin和__arch_info_end中间存放的是段属性为.arch.info.init的结构体。这里我们可以直接在linux下查询内核中包含.arch.info.init的文件。

Direction:include/asm-arm/arch.h

#define MACHINE_START(_type,_name)            \

static const struct machine_desc __mach_desc_##_type    \

 __used                            \

 __attribute__((__section__(".arch.info.init"))) = {    \       
    .nr        = MACH_TYPE_##_type,        \

    .name        = _name,

#define MACHINE_END                \

};



Direction:arch/arm/mach-s3c2440

MACHINE_START(S3C2440, "SMDK2440")

    /* Maintainer: Ben Dooks <ben@fluff.org> */

    .phys_io    = S3C2410_PA_UART,

    .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,

    .boot_params    = S3C2410_SDRAM_PA + 0x100,

    .init_irq    = s3c24xx_init_irq,

    .map_io        = smdk2440_map_io,

    .init_machine    = smdk2440_machine_init,

    .timer        = &s3c24xx_timer,

MACHINE_END

　　如图所示，在include/asm-arm/arch.h中找到了定义的结构体类型machine_desc，并且在代码中它的段属性被强制定义成了.arch.info.init。这样做的目的是在刚刚我们看到的vmlinux.lds链接脚本文件中，可以将具有.arch.info.init段属性的结构体统一放在__arch_info_begin和__arch_info_end之间。非常便于处理。那么现在我们将这个结构体展开，看看它的内容。也就是将arch/arm/mach-s3c2440中的参数传入。展开后如下：

#define MACHINE_START(_type,_name)            \

static const struct machine_desc __mach_desc_S3C2440    \

 __used                            \

 __attribute__((__section__(".arch.info.init"))) = {    \

    .nr        = MACH_TYPE_S3C2440,        \

    .name        = "SMDK2440",

/* Maintainer: Ben Dooks <ben@fluff.org> */

    .phys_io    = S3C2410_PA_UART,

    .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,

    .boot_params    = S3C2410_SDRAM_PA + 0x100,                    //0x30000100

    .init_irq    = s3c24xx_init_irq,

    .map_io        = smdk2440_map_io,

    .init_machine    = smdk2440_machine_init,

    .timer        = &s3c24xx_timer,

};

　　现在我们看到，定义的结构体类型machine_desc，内容为.nr到.timer。我们可以看出这个结构体大概是存储硬件信息。nr存放机器ID，name存放单板名称，phys_io存放输入输出口，io_pg_offst存放IO的偏移地址，boot_params存放uboot传给内核的启动参数（TAG）,init_irq存放的是中断初始化信息，map_io为IO的映射表，init_machine存放的是单板的初始化信息，timer存放的是单板的定时器信息。

struct machine_desc {

    /*

     * Note! The first four elements are used

     * by assembler code in head-armv.S

     */

    unsigned int        nr;        /* architecture number    */

    unsigned int        phys_io;    /* start of physical io    */

    unsigned int        io_pg_offst;    /* byte offset for io

                         * page tabe entry    */

    const char        *name;        /* architecture name    */

    unsigned long        boot_params;    /* tagged list        */

    unsigned int        video_start;    /* start of video RAM    */

    unsigned int        video_end;    /* end of video RAM    */

    unsigned int        reserve_lp0 :1;    /* never has lp0    */

    unsigned int        reserve_lp1 :1;    /* never has lp1    */

    unsigned int        reserve_lp2 :1;    /* never has lp2    */

    unsigned int        soft_reboot :1;    /* soft reboot        */

    void            (*fixup)(struct machine_desc *,

                     struct tag *, char **,

                     struct meminfo *);

    void            (*map_io)(void);/* IO mapping function    */

    void            (*init_irq)(void);

    struct sys_timer    *timer;        /* system tick timer    */

    void            (*init_machine)(void);

};

　　我们打开arch.h文件，看到对machine_desc结构体的定义确实和我们刚刚所说的一样。再回到head-common.S文件，这里对mmap_switch定义：

    .type    __mmap_switched, %function

__mmap_switched:

    adr    r3, __switch_data + 4

    ldmia    r3!, {r4, r5, r6, r7}

    cmp    r4, r5                @ Copy data segment if needed

1:    cmpne    r5, r6

    ldrne    fp, [r4], #4

    strne    fp, [r5], #4

    bne    1b

    mov    fp, #0                @ Clear BSS (and zero fp)

1:    cmp    r6, r7

    strcc    fp, [r6],#4

    bcc    1b

    ldmia    r3, {r4, r5, r6, sp}

    str    r9, [r4]            @ Save processor ID

    str    r1, [r5]            @ Save machine type

    bic    r4, r0, #CR_A            @ Clear 'A' bit

    stmia    r6, {r0, r4}            @ Save control register values

    b    start_kernel

　　mmap_switch做了很多工作，这里我们看到有复制数据段，清BSS段，保存CPU的ID，保存机器ID，清‘A’位，保存控制寄存器的值，然后就到了C语言段——start_kernel函数。

2.C语言段——start_kernel

asmlinkage void __init start_kernel(void)
{

    local_irq_disable();

    early_boot_irqs_off();

    early_init_irq_lock_class();

/*

 * Interrupts are still disabled. Do necessary setups, then

 * enable them

 */

    lock_kernel();

    tick_init();

    boot_cpu_init();

    page_address_init();

    printk(KERN_NOTICE);

    printk(linux_banner);

    setup_arch(&command_line);

    setup_command_line(command_line);

    printk(KERN_NOTICE "Kernel command line: %s\n", boot_command_line);

    parse_early_param();

    parse_args("Booting kernel", static_command_line, __start___param,

           __stop___param - __start___param,

           &unknown_bootoption);

    init_IRQ();

    profile_init();

    if (!irqs_disabled())

        printk("start_kernel(): bug: interrupts were enabled early\n");

    early_boot_irqs_on();

    local_irq_enable();

    console_init();

    rest_init();

}

　　接下来进入start_kernel启动内核的C函数。上面是start_kernel的部分代码。这部分代码的主要作用是处理uboot传递来的参数，设置与体系结构相关的环境，初始化控制台，最后执行应用程序，实现功能。这里我把start_kernel函数的几个主要功能的子函数逐层写出，帮助大家理解start_kernel的功能结构。

start_kernel

    setup_arch(&command_line);

    setup_command_line(command_line);

    unknown_bootoption

        obsolete_checksetup

    parse_early_param

        do_early_param

    rest_init;

        kernel_init

            prepare_namespace

                mount_root

            init_post

　　这里每一个退格（TAB）都代表此函数被上一个函数调用（例如obsolete_checksetup是unknown_bootoption调用的函数）。setup_arch(&command_line)和setup_command_line(command_line)就是用来处理uboot传递进来的启动参数的（处理TAG）。obsolete_checksetup从__setup_start到 __setup_end，调用用非early标识的函数；do_early_param从__setup_start到 __setup_end，调用用early标识的函数（但因为__setup_param(str, fn, fn, 0)中early赋值为0，所以不在这里调用）,所以我们主要用obsolete_checksetup。这在后面我们会提到。mount_root是挂载根文件系统，因为Linux上的应用程序最终要在根文件系统上运行。最后是init_post中运行应用程序。那么现在就有一个问题，Linux内核是如何接收uboot传来的根文件系统信息的呢？

bootcmd=nand read.jffs2 0x30007FC0 kernel; bootm 0x30007FC0

bootargs=noinitrd root=/dev/mtdblock3 init=/linuxrc console=ttySAC0

　　上面是uboot启动时打印的环境变量。其中我们能够看到根文件系统挂载到第4个分区：root=/dev/mtdblock3 (从0分区开始)。上面我们提到过，setup_arch(&command_line)和setup_command_line(command_line)就是用来处理uboot传递进来的启动参数的（处理TAG）。但这个处理只是简单的复制粘贴而已，这两个函数将TAG保存，但并未进行真正的处理。那么真正告诉内核在哪里挂载的函数是什么呢？我们通过查看prepare_namespace可以看到一个saved_root_name。查找saved_root_name，发现在Do_mounts.c文件中有对它的调用：

static int __init root_dev_setup(char *line)

{

    strlcpy(saved_root_name, line, sizeof(saved_root_name));

    return 1;

}

__setup("root=", root_dev_setup);   //传入一个字符串，一个函数

　　根据我们之前的经验，我们可以猜测这个__setup宏，也是定义了一个结构体。通过查找__setup我们找到了它的宏定义：

Dir:init.h

#define __setup(str, fn)                    \

    __setup_param(str, fn, fn, 0)

#define __setup_param(str, unique_id, fn, early)            \

    static char __setup_str_##unique_id[] __initdata = str;    \

    static struct obs_kernel_param __setup_##unique_id    \

        __attribute_used__                \

        __attribute__((__section__(".init.setup")))    \

        __attribute__((aligned((sizeof(long)))))    \

        = { __setup_str_##unique_id, fn, early }

　　在init.h文件里，定义__setup等于__setup_param。那么在__setup_param的宏定义里，我们可以知道：它先定义了一个字符串，然后定义了一个结构体类型obs_kernel_param __setup。这个结构体的段属性为.init.setup，内容为一个字符串，一个函数，还有early。具备这个属性的结构体被链接脚本文件放到一起，从__setup_start到 __setup_end搜索调用。在vmlinux.lds中
__setup_start = .;
*(.init.setup)
__setup_end = .;

　　但是在Flash里没有分区，只能和uboot一样，将分区在代码里写死。一般在启动Linux的时候，Linux会自动打印出分区的信息。这里我的分区是这样的：

Creating 4 MTD partitions on "NAND 256MiB 3,3V 8-bit":

0x00000000-0x00040000 : "bootloader"

0x00040000-0x00060000 : "params"

0x00060000-0x00260000 : "kernel"

0x00260000-0x10000000 : "root"

　　我们搜索这个分区名 grep "\"bootloader\"" * -nR。在arch/arm/plat-s3c24xx中找到分区代码：

static struct mtd_partition smdk_default_nand_part[] = {

    [0] = {

        .name   = "bootloader",

        .size   = 0x00040000,

        .offset    = 0,

    },

    [1] = {

        .name   = "params",

        .offset = MTDPART_OFS_APPEND,

        .size   = 0x00020000,

    },

    [2] = {

        .name   = "kernel",

        .offset = MTDPART_OFS_APPEND,

        .size   = 0x00200000,

    },

    [3] = {

        .name   = "root",

        .offset = MTDPART_OFS_APPEND,

        .size   = MTDPART_SIZ_FULL,

    }

};

　　就是这样，在处理完uboot传递的参数，进行CPU和单板的校验，挂载根文件系统等一系列操作后，最终内核执行init_post()中的应用程序。内核启动流程讲解完毕^_^

题外话：最近博主在自学Linux kernel和Linux device driver，感觉有难度。但是还是很有意义的，因为能够看到前辈的代码，心里真的很高兴。我就希望自己也能够修改Linux源代码，写出适合自己硬件的Linux系统。不仅如此，我还希望能够将自己的代码开源，分享给更多的人。完善Linux内核，让它变得更快更方便是博主的最终目标。博主会继续学习，然后把知识更好的分享给大家！

Linux内核启动的更多相关文章

Linux内核启动过程概述
版权声明:本文原创,转载需声明作者ID和原文链接地址. Hi!大家好,我是CrazyCatJack.今天给大家带来的是Linux内核启动过程概述.希望能够帮助大家更好的理解Linux内核的启动,并且创 ...
linux内核启动以及文件系统的加载过程
Linux 内核启动及文件系统加载过程当u-boot 开始执行 bootcmd 命令,就进入 Linux 内核启动阶段.普通 Linux 内核的启动过程也可以分为两个阶段.本文以项目中使用的 lin ...
【转载】linux内核启动android文件系统过程分析
主要介绍linux 内核启动过程以及挂载android 根文件系统的过程,以及介绍android 源代码中文件系统部分的浅析. 主要源代码目录介绍Makefile (全局的Makefile)bioni ...
通过从代码层面分析Linux内核启动来探知操作系统的启动过程
通过从代码层面分析Linux内核启动来探知操作系统的启动过程前言说明本篇为网易云课堂Linux内核分析课程的第三周作业,我将围绕Linux 3.18的内核中的start_kernel到init进程 ...
linux内核启动参数
Linux内核启动参数 Console Options 参数说明选项内核配置/文件 console=Options 用于说明输出设备 tt ...
Linux内核启动代码分析二之开发板相关驱动程序加载分析
Linux内核启动代码分析二之开发板相关驱动程序加载分析 1 从linux开始启动的函数start_kernel开始分析,该函数位于linux-2.6.22/init/main.c start_ke ...
Linux内核启动及根文件系统载入过程
上接博文<u-boot之u-boot-2009.11启动过程分析> Linux内核启动及文件系统载入过程当u-boot開始运行bootcmd命令,就进入Linux内核启动阶段.与u-bo ...
linux 内核启动流程
Linux内核启动流程详细分析: http://www.linuxidc.com/Linux/2014-10/108034.htm ARM Linux内核启动过程: http://blog.csdn. ...
Linux内核启动流程分析（一）【转】
转自:http://blog.chinaunix.net/uid-25909619-id-3380535.html 很久以前分析的,一直在电脑的一个角落,今天发现贴出来和大家分享下.由于是word直接 ...

随机推荐

NSInvocation
NSInvocation 基本简介 NSInvocation是一个静态描绘的OC消息,也就是说,它是一个动作,这个动作可以变成一个对象.NSInvocation对象在对象和对象之间和应用程序和应用程序 ...
卸载openfire
首先,确保你已经关掉了openfire打开终端 (在应用程序-->实用工具-->)输入以下命令sudo rm -rf /Library/PreferencePanes/Openfire.p ...
Struts2(十三)国际化-internationalization
一.国际化是什么--I18N 即internationalization 首字母i-结束字母n之间有18个字母特征:在程序不做修改的情况下,可以根据不同的语言环境显示相应内容二.Java内置国际化 ...
UIActionSheet 修改字体颜色
-(void)willPresentActionSheet:(UIActionSheet *)actionSheet { SEL selector = NSSelectorFromString(@&q ...
分分钟学会使用memcached
1.首先要搭建服务端的程序. 下载地址:http://pan.baidu.com/s/1hrJ9jE0 密码:spqc 将对应版本的文件夹,放到D盘,任意位置即可桌面-程序-运行-cmd-打开命令行 ...
zobrist hashing
Zobrist 哈希是一种专门针对棋类游戏而提出来的编码方式,以其发明者 Albert L.Zobrist 的名字命名.Zobrist 哈希通过一种特殊的置换表,也就是对棋盘上每一位置的各个可能状态赋 ...
GDI学习之俄罗斯方块续
当前方块对象 #region 定义砖块int[i,j,y,x] Tricks:i为那块砖,j为状态,y为列,x为行 private int[, , ,] Tricks = {{ { {,,,}, {, ...
Log4j配置与使用
log4j是Java社区事实上的日志标准解决方案.使用起来比较简单. 一. 简单使用 1.下载jar包放到lib文件夹,并加入到build path中: 2.编写log4j.properties文件, ...
JS生成UUID的方法实例
<!DOCTYPE html> <html> <head> <script src="http://libs.baidu.com/jquery/1. ...
"德意志之歌"的历史
1841年8月, 词作家奥古斯特在当时属于英国的黑尔格兰岛上度假时, 创作了"德意志之歌"的歌词.9月, 这首歌首次出版发行, 曲调则借用了海顿的一首君主颂歌 - "皇帝 ...

Linux内核启动

Linux内核启动过程概述

Linux内核启动的更多相关文章

随机推荐

热门专题