作业七:Linux内核如何装载和启动一个可执行程序

一、编译链接的过程和ELF可执行文件格式

可执行文件的创建——预处理、编译和链接

 在object文件中有三种主要的类型。
一个可重定位(relocatable)文件保存着代码和适当的数据,用来和其他的object文件一起来创建一个可执行文件或者是一个共享文件。
一个可执行(executable)文件保存着一个用来执行的程序;该文件指出了exec(BA_OS)如何来创建程序进程映象。
一个共享object文件保存着代码和合适的数据,用来被下面的两个链接器链接:
-第一个是连接编辑器[请参看ld(SD_CMD)],可以和其他的可重定位和共享object文件来创建其他的object。
-第二个是动态链接器,联合一个可执行文件和其他的共享object文件来创建一个进程映象。 一个object文件被汇编器和联接器创建, 想要在处理机上直接运行的object文件都是以二进制来存放的。
那些需要抽象机制的程序,比如shell脚本,是不被接受的。

  

 Object文件格式

      Linking 视角  						Execution 视角
============ ==============
ELF header ELF header
Program header table (optional) Program header table
Section 1 Segment 1
... Segment 2
Section n ...
Section header table Section header table (optional) 一个ELF头在文件的开始,保存了路线图(road map),描述了该文件的组织情况。
sections保存着object 文件的信息,从连接角度看:包括指令,数据,符号表,重定位信息等。特别sections的描述会出项在以后的第一部分。
第二部分讨论了段和从程序的执行角度看文件。 假如一个程序头表(program header table)存在,那么它告诉系统如何来创建一
个进程的内存映象。被用来建立进程映象(执行一个程序)的文件必须要有一个程
序头表(program header table);可重定位文件不需要这个头表。一个
section头表(section header table)包含了描述文件sections的信息。每个
section在这个表中有一个入口;每个入口给出了该section的名字,大小,
等等信息。在联接过程中的文件必须有一个section头表;其他object文件可要
可不要这个section头表。 注意: 虽然图显示出程序头表立刻出现在一个ELF头后,section头表跟着其他
section部分出现,事实是的文件是可以不同的。此外,sections和段(segments)
没有特别的顺序。只有ELF头(elf header)是在文件的固定位置。 数据表示
object文件格式支持8位、32位不同的处理器。不过,它试图努力的在更大
或更小的体系上运行。因此,object文件描绘一些控制数据需要用与机器
无关的格式,使它尽可能的用一般的方法甄别object文件和描述他们的内容。
在object文件中剩余的数据使用目标处理器的编码方式,不管文件是在哪台
机子上创建的。

 

 

 

二、动态链接分为可执行程序装载时动态链接和运行时动态链接  

三、使用gdb跟踪分析一个execve系统调用内核处理函数sys_execve


实验楼环境图

四、特别关注:

1.新的可执行程序是从哪里开始执行的? 2.为什么execve系统调用返回后新的可执行程序能顺利执行? 3.对于静态链接的可执行程序和动态链接的可执行程序execve系统调用返回时会有什么不同?

.ELF可执行文件会被默认映射到0x804800地址
execve内核态,可执行文件覆盖了原来的,返回时是新的可执行程序,也就是main函数发生的起点,加载新的可执行可执行环境。
需要动态链接的可执行文件先加载链接器ld
命令行参数和环境串都放在用户态堆栈中。
将CPU控制权交给LD来加载依赖库并完成动态链接。然后在初始化新程序堆栈时,拷贝进去,先函数调用参数传递,在系统调用参数传递
shell程序——>execve ——>sys_execve
do_execve----> do_execve_common----->exec_vinprm------>search_binary_handler
execve系统调用返回到用户态
栈底pt_regs start_thread(...,elf_entry,....)
通过修改内核堆栈中EIP的值作为新程序的起点。new ip, new sp.
elf_entry是新的可执行程序的起点。
静态链接:程序开始是从0x8048300或0x8048400,也就是main开始的位置
动态链接:动态链接器的起点。

  

五、总结部分:对“Linux内核装载和启动一个可执行程序”的理解

.ELF可执行文件会被默认映射到0x804800地址

execve内核态,可执行文件覆盖了原来的,返回时是新的可执行程序,也就是main函数发生的起点,加载新的可执行可执行环境。
shell程序——>execve ——>sys_execve
do_execve----> do_execve_common----->exec_vinprm------>search_binary_handler 栈底pt_regs start_thread(...,elf_entry,....)
通过修改内核堆栈中EIP的值作为新程序的起点。new ip, new sp.
elf_entry是新的可执行程序的起点。
静态链接:程序开始是从0x8048300或0x8048400,也就是main开始的位置
动态链接:需要动态链接的可执行文件先加载链接器ld,先从动态链接器开始,链接完成后,然后才返回到main函数起点。 将CPU控制权交给LD来加载依赖库并完成动态链接。然后在初始化新程序堆栈时,拷贝进去,先函数调用参数传递,在系统调用参数传递

  

**注明“郑伟 +

参考资料:

【1】http://www.xfocus.net/articles/200105/174.html
【2】http://mooc.study.163.com/learn/USTC-1000029000?tid=2001214000#/learn/hw?id=2001372010
  • 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ”**

可以结合实验截图、ELF可执行文件格式、用户态的相关代码等; 博客内容中需要仔细分析新可执行程序的执行起点及对应的堆栈状态等。

作业七:Linux内核如何装载和启动一个可执行程序的更多相关文章

  1. Linux内核分析第七周学习笔记——Linux内核如何装载和启动一个可执行程序

    Linux内核分析第七周学习笔记--Linux内核如何装载和启动一个可执行程序 zl + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study. ...

  2. 实验七:Linux内核如何装载和启动一个可执行程序

    原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 题目自拟,内容围绕对Linu ...

  3. linux内核分析 第七周 Linux内核如何装载和启动一个可执行程序

    一.编译链接的过程和ELF可执行文件格式 vi hello.c gcc -E -o hello.cpp hello.c -m32 //预处理.c文件,预处理包括把include的文件包含进来以及宏替换 ...

  4. Linux内核设计第七周学习总结 Linux内核如何装载和启动一个可执行程序

    陈巧然原创作品 转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-100002900 实验目的 使用gdb跟踪s ...

  5. Linux内核如何装载和启动一个可执行程序(转)

    原文:http://www.cnblogs.com/petede/p/5351696.html 实验七:Linux内核如何装载和启动一个可执行程序 姓名:李冬辉 学号:20133201 注: 原创作品 ...

  6. 20135202闫佳歆--week 7 Linux内核如何装载和启动一个可执行程序--实验及总结

    week 7 实验:Linux内核如何装载和启动一个可执行程序 1.环境搭建: rm menu -rf git clone https://github.com/megnning/menu.git c ...

  7. 20135323符运锦----第七周:Linux内核如何装载和启动一个可执行程序

    可执行程序的装载 一.预处理.编译.链接和目标文件的格式 1.可执行程序是怎么得来的 ①编译器预处理 gcc -E -o XX.cpp XX.c (-m32)// 注:把include的文件包含进来, ...

  8. Linux内核分析作业7:Linux内核如何装载和启动一个可执行程序

            1.可执行文件的格式 在 Linux 平台下主要有以下三种可执行文件格式: 1.a.out(assembler and link editor output 汇编器和链接编辑器的输出) ...

  9. 第七周——Linux内核如何装载和启动一个可执行程序

    万子惠 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 part1 实验 ...

随机推荐

  1. 这不是我想要的ABAP开发者

    原文在此: These Aren’t the Developers You’re Looking for 在吃饼干的过程中偶然看到这篇文章,立刻被UC化的标题吸引到了. 全文读完,感觉作者还是有点刻薄 ...

  2. java中的深复制和浅复制

    Java 语言的一个优点就是取消了指针的概念,但也导致了许多程序员在编程中常常忽略了对象与引用的区别,本文会试图澄清这一概念.并且由于Java不能通过简单 的赋值来解决对象复制的问题,在开发过程中,也 ...

  3. Windows安装pip方法

    1.下载pip 地址:https://pypi.python.org/pypi/pip#downloads 注意选择tar.gz压缩包,目前最新版本为9.0.1,这里选择的版本是:pip-9.0.1. ...

  4. UVA10129-Play on Words(欧拉路径)

    Problem UVA10129-Play on Words Accept: 2534  Submit: 19477 Time Limit: 3000 mSec Problem Description ...

  5. java list 排序,建议收藏的排序方法

    每天学习一点点 编程PDF电子书.视频教程免费下载:http://www.shitanlife.com/code public static void main(String[] args) {    ...

  6. MongoDB逻辑操作符$or, $and,$not,$nor

    $or是一个逻辑or操作符操作在一个数据或者多个表达式并且需要选择至少一个满足条件的表达式,$or有至少以下表达式: { $or: [ { <expression1> }, { <e ...

  7. c# 根据当前时间获取,本周,本月,本季度,月初,月末,各个时间段

    DateTime dt = DateTime.Now;  //当前时间   DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss") //24小时制 ...

  8. nodejs-stream部分

    参考: https://blog.csdn.net/eeewwwddd/article/details/81042225 http://nodejs.cn/api/stream.html#stream ...

  9. css学习之样式层级和权重

    第一种情况 当选择器相同的情况下,引入方式的前后,决定页面最后的效果 ---------外部在最后面显示 ---------内部在最后面显示 第二种情况 引入方式相同时候,则是按照权重取最大(取权重最 ...

  10. 深入浅出的webpack构建工具---devTool中SourceMap模式详解(四)

    阅读目录 一:什么是SourceMap? 二:理解webpack中的SourceMap的eval,inline,sourceMap,cheap,module 三:开发环境和线上环境如何选择source ...