《Linux内核分析》 week8作业-Linux加载和启动一个可执行程序

一.ELF文件格式

ELF(Executable and Linking Format)是x86 Linux系统下常用的目标文件格式，有三种主要类型:

适于连接的可重定位文件,可与其他目标文件一起创建可执行文件和共享目标文件。
适于执行的可执行文件,用于提供程序的进程映像，加载的内存执行。
共享目标文件，连接器可将它与其他可重定位文件和共享目标文件连接成其他目标文件。

文件格式

ELF header在文件开始处描述了整个文件的组织，Section提供了目标文件的各项信息，Program header table指出怎样创建进程映像，含有每个program header的入口，section header table包含每个Section的入口，给出名字、大小等信息。

二.ELF文件的加载过程

从编译/链接和运行的角度看，应用程序和库程序的连接有两种方式。一种是固定的、静态的链接，将所需要的库函数的目标代码从程序库中抽取出来，链接进应用软件的目标映像中；另一种是动态链接，库函数的代码不进入应用软件的目标映像，而是将函数库的映像也交给用户，到启动应用软件时才把程序库的映像装入用户空间。

Linux内核既支持静态链接的ELF映像，也支持动态链接的ELF映像，而且装入/启动映像必须由内核完成,而动态链接的实现既可以在内核中完成，也可以在用户空间完成。

内核空间的加载过程

内核中实际执行execve()系统调用的程序do_execve()，这个函数先打开目标文件映像，并从读入目标文件的头部(即ELF头部字段),然后调用另一个函数seach_binary_handler(),在此函数里，它会搜索Linux可支持的可执行文件类型队列，寻找与之匹配的可执行程序的处理程序。如果类型匹配，则调用load_binary函数指针所指向的处理函数来处理目标映像文件。对于ELF文件格式中，处理函数是load_elf_binary函数。

内核对所支持的每种可执行的程序类型都有个struct linux_binfmt的数据结构。定义如下:

struct linux_binfmt{

    struct linux_binfmt* next;

    struct module* module;

    int (*load_binary)(struct linux_binprm*,struct pt_regs* regs);

    int (*load_shlib)(struct file*);

    int (*core_dump)(long signr,struct pt_regs* regs,struct file* file);

    unsigned long min_coredump;

    int hasvdso;

}

其中load_binary函数指针指向的就是一个可执行程序的处理函数。

ELF文件格式的定义如下:

static struct linux_binfmt elf_format = {

         .module      = THIS_MODULE,

         .load_binary = load_elf_binary,

         .load_shlib  = load_elf_library,

         .core_dump   = elf_core_dump,

         .min_coredump  = ELF_EXEC_PAGESIZE,

         .hasvdso     =

};

search_binary_handler寻找文件格式对应的解析模块，如下:

.....

list_for_each_entry(fmt, &formats, lh) {

        if (!try_module_get(fmt->module))

            continue;

        read_unlock(&binfmt_lock);

        bprm->recursion_depth++;

        retval = fmt->load_binary(bprm);

        read_lock(&binfmt_lock);

        put_binfmt(fmt);

        bprm->recursion_depth--;

        if (retval <  && !bprm->mm) {

            /* we got to flush_old_exec() and failed after it */

            read_unlock(&binfmt_lock);

            force_sigsegv(SIGSEGV, current);

            return retval;

        }

        if (retval != -ENOEXEC || !bprm->file) {

            read_unlock(&binfmt_lock);

            return retval;

        }

    }

.....

load_elf_binary函数主要就是对ELF文件的解析过程了.

 elf_ppnt = elf_phdata;

                ……

 for (i = ; i < loc->elf_ex.e_phnum; i++) {

     if (elf_ppnt->p_type == PT_INTERP) {

            ……

         elf_interpreter = kmalloc(elf_ppnt->p_filesz, GFP_KERNEL);

            ……

         retval = kernel_read(bprm->file, elf_ppnt->p_offset,

                          elf_interpreter,

                          elf_ppnt->p_filesz);

            ……

         interpreter = open_exec(elf_interpreter);

            ……

         retval = kernel_read(interpreter, , bprm->buf,

                          BINPRM_BUF_SIZE);

            ……

         /* Get the exec headers */

            ……

         loc->interp_elf_ex = *((struct elfhdr *)bprm->buf);

             break;

     }

     elf_ppnt++;

 }

其中的for循环的目的在于寻找和处理目标映像的"解释器"段。“解释器"段的类型为PT_INTERP，读到后就根据其位置的p_offset和大小p_offsize把整个"解释器"的内容读入缓冲区,解释器的内容只是一个字符串,例如"/lib/ld-linux.so.2"，然后就通过open_exec函数打开这个解释器文件。

814   for(i = , elf_ppnt = elf_phdata;

             i < loc->elf_ex.e_phnum; i++, elf_ppnt++) {

                       ……

                 if (elf_ppnt->p_type != PT_LOAD)

                         continue;

                       ……

                 error = elf_map(bprm->file, load_bias + vaddr, elf_ppnt,

                                 elf_prot, elf_flags);

                       ……

         }

这里确定装入地址，然后通过elf_map()建立用户空间虚拟地址空间与目标映像文件中某个连续区间的映射，其返回值就是实际映射的起始地址。

     if (elf_interpreter) {

                ……

         elf_entry = load_elf_interp(&loc->interp_elf_ex,

                                 interpreter,

                                     &interp_load_addr);

                                ……

     } else {

         elf_entry = loc->elf_ex.e_entry;

                ……

     }

当是动态链接时，需要装入解释器，就通过load_elf_interp装入映像，返回解释器映像的入口地址。而对于静态链接时，则不需要装入解释器，那么这个入口地址就是目标映像本身的入口地址。

        create_elf_tables(bprm, &loc->elf_ex,

                           (interpreter_type == INTERPRETER_AOUT),

                           load_addr, interp_load_addr);

               ……

       start_thread(regs, elf_entry, bprm->p);

在完成装入，启动用户空间的映像运行之前，还需要为目标映像和解释器准备好一些有关的信息，这些信息例如常规的argc、envc等，需要复制到用户空间，使它们进入解释器或目标映像的程序入口时出现在用户空间堆栈上。这就是create_elf_tables的作用。

最后,start_thread()这个宏操作会将eip和esp改成新的地址，就使CPU在返回用户空间时进入新的入口地址。

三.ELF文件加载和链接的实验总结

用户通过shell执行程序，shell通过execve进入系统调用.sys_execve经过一系列过程，并最终通过ELF文件的处理函数load_elf_binary将用户程序和ELF解释器加载进内存，并将控制权交给解释器。ELF解释器进行相关库的加载，并最终把控制权交给用户程序。

《Linux内核分析》 week8作业-Linux加载和启动一个可执行程序的更多相关文章

linux内核裁剪及编译可加载模块
一:linux内核裁剪: 1:编译内核源码: 今天的重点内容是内核驱动的编写,在编写驱动之前首先的了解linux内核源码,linux主要是由五个子系统组成:进程调度,内存管理,文件系统,网络接口以及进 ...
《linux内核分析》作业一：分析汇编代码
通过汇编一个简单的C程序,分析汇编代码理解计算机是如何工作的(王海宁) 姓名:王海宁学号:20135103 课程:<Linux内核分析& ...
Linux内核和根文件系统引导加载程序
续博文<u-boot之u-boot-2009.11启动过程分析> Linux内核启动及文件系统载入过程当u-boot開始运行bootcmd命令.就进入Linux内核启动阶段,与u-boo ...
Linux内核分析第三周学习总结：构造一个简单的Linux系统MenuOS
韩玉琪 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.Linux内 ...
《Linux内核分析》第三周学习小结构造一个简单的Linux系统OS
郝智宇无转载 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 第三周构造一个简单的Linux系统Me ...
从内存中加载并启动一个exe
windows似乎只提供了一种启动进程的方法:即必须从一个可执行文件中加载并启动.而下面这段代码就是提供一种可以直接从内存中启动一个exe的变通办法.用途嘛, 也许可以用来保护你的exe,你可以对要保 ...
linux内核及其模块的查询,加载,卸载 lsusb等
http://blog.sina.com.cn/s/blog_53e81e2a0100zkxi.html 1,/sbin/update-modules文件,他是一个linux通用的模块管理脚本程序. ...
Linux内核分析——第一章 Linux内核简介
第一章 Linux内核简介一.Unix的历史 1.Unix系统成为一个强大.健壮和稳定的操作系统的根本原因: (1)简洁 (2)在Unix中,很多东西都被当做文件对待.这种抽象使对数据和对设备的 ...
Linux内核分析笔记与Linux内核开发理论
http://www.cnblogs.com/hanyan225/category/308793.html

随机推荐

转：php页面静态化之真静态
之前的缓存和现在所说的页面静态化都是为网站提速的,如果是访问量小的小型网站可能不需要但是如果网站规模或访问量很大,那么页面静态化和缓存就会体现出各自的价值了下面先来了解下页面静态化的分类页面静态化的 ...
h.264加权预测
帧间运动是基于视频亮度(luma)不发生改变的一个假设,而在视频序列中经常能遇到亮度变化的场景,比如淡入淡出.镜头光圈调整.整体或局部光源改变等,在这些场景中,简单帧间运动补偿的效果可想而知(实际编码 ...
对WM_NCHITTEST消息的了解+代码实例进行演示（消息产生消息，共24个枚举值）
这个消息比较实用也很关键,它代表非显示区域命中测试.这个消息优先于所有其他的显示区域和非显示区域鼠标消息.其中lParam参数含有鼠标位置的x和y屏幕坐标,wParam 这里没有用. Windows应 ...
BAT之间的区别（学点网页编程，然后开始研究）
A: 阿里不就是靠网页起家的吗? T: 腾讯靠客户端. B: 百度是靠网页背后的算法技术支持- 最近网页技术又发布了很多新功能,而现在网页功能也已经很强大了. 不知道自己是不是老了,总觉得不喜欢网页( ...
android 菜单事件处理
package com.example.wenandroid; import android.app.Activity; import android.os.Bundle; import androi ...
【转】HashMap和HashSet的区别
原文网址:http://www.importnew.com/6931.html HashMap和HashSet的区别是Java面试中最常被问到的问题.如果没有涉及到Collection框架以及多线程的 ...
【宽搜】XMU 1039 Treausure
题目链接: http://acm.xmu.edu.cn/JudgeOnline/problem.php?id=1039 题目大意: 给定n,m(1<=n,m<=1000),一张n*m的地图 ...
您好，想问一下目前哪些营业厅可以办理NFC-SIM卡的更换业务？_百度知道
您好,想问一下目前哪些营业厅可以办理NFC-SIM卡的更换业务?_百度知道您好,想问一下目前哪些营业厅可以办理NFC-SIM卡的更换业务? 2013-06-14 10:39 maxre ...
你不知道的关于计算机大师 Dijkstra 的事情
Dijkstra 的全名叫 Edsger Wybe Dijkstra(艾兹赫尔·韦伯·戴克斯特拉).大部分中国程序员如果能记住这个名字是因为学过计算最短路径的「Dijkstra 算法」,然而大部分人都 ...
aspx,ascx和ashx使用小结
做asp.net开发的对.aspx,.ascx和.ashx都不会陌生.关于它们,网上有很多文章介绍.“纸上得来终觉浅,绝知此事要躬行”,下面自己总结一下做个笔记.1..aspxWeb窗体设计页面.We ...

《Linux内核分析》 week8作业-Linux加载和启动一个可执行程序

《Linux内核分析》 week8作业-Linux加载和启动一个可执行程序的更多相关文章

随机推荐

热门专题