1.问题描述

在前面的文章中，学习了在Linux系统之中如何创建一个新进程进行追踪，本文将围绕编译链接的过程和ELF可执行文件格式，对Linux内核装载和启动一个可执行程序。

2.解决过程

2.1 ELF文件

（1）可重定位文件：保存代码和适当数据，用来和其他object文件一起创建可执行文件或者共享文件，即.o文件。

（2）可执行文件：保存用来执行的程序，该文件指出了exec（BA_OS）如何来创建程序进程映像。

（3）共享目标文件：共享库，是指可以被可执行文件或其他库文件使用的目标文件，如标准C的库文件libc.so，只有一堆函数可供其他可执行文件调用。

2.2 ELF文件程序编译

程序经过的四个步骤：

预处理：编译器将C程序的头文件编译进来，还有宏的替换，可以用gcc的参数-E来参看。

gcc -E louhao.c -o louhao.i

编译：这个阶段编译器主要做词法分析、语法分析、语义分析等，在检查无错误后后，把代码翻译成汇编语言。可用gcc的参数-S来参看。

gcc -S louhao.i -o louhao.s

汇编：汇编器as将louhao.s 翻译成机器语言保存在louhao.o 中（二进制文本形式）。

gcc -c louhao.s -o louhao.o

链接：链接器负责处理多个.o文件的并入，结果得到louhao文件，它就是一个可执行的目标文件。

gcc louhao.o -o louhao

2.3 静态链接和动态链接

静态链接：在编译时直接将需要的执行代码复制到最终可执行的文件中，优点是代码的装载速度快，执行速度也比较快，对外部环境依赖度低。编译时会把所有需要的代码都链接进去，应用程序相对比较大。缺点是如果多个应用程序使用同一库函数，会被装载多次，浪费内存。

动态链接：在编译时不直接复制可执行代码，而是通过一系列符号和参数，在程序运行或加载时将这些信息传递给操作系统。操作系统负责将需要的动态库加载到内存中，然后程序在运行到指定的代码时，去共享执行内存中已经加载的动态库去执行代码，最终达到运行时链接的目的。优点是多个程序可以共享同一段代码，而不需要在磁盘上存储多个复制。缺点时在运行时加载，可能会影响程序的前期执行性能，而且对库的依赖度极高。

2.4 装载和启动一个可执行程序

将menu目录删除，利用git命令克隆一个新的menu目录，然后用test_exec.c覆盖test.c：

重新编译rootfs：

可以看到test.c中增加了exec函数，执行exec指令，显示如下：

返回LinuxKernel目录，shift+ctrl+o水平分割，用gdb设置断点：

c执行至start_thread断点暂停：

输入exec:

继续执行：

关闭qume，在menu目录下查看hello可执行文件：

给出对exec函数的分析：

int do_execve(struct filename *filename,

    const char __user *const __user *__argv,

    const char __user *const __user *__envp)

{

    return do_execve_common(filename, argv, envp);

}

static int do_execve_common(struct filename *filename,

                struct user_arg_ptr argv,

                struct user_arg_ptr envp)

{

    // 检查进程的数量限制

    // 选择最小负载的CPU，以执行新程序

    sched_exec();

    // 填充 linux_binprm结构体

    retval = prepare_binprm(bprm);

    // 拷贝文件名、命令行参数、环境变量

    retval = copy_strings_kernel(1, &bprm->filename, bprm);

    retval = copy_strings(bprm->envc, envp, bprm);

    retval = copy_strings(bprm->argc, argv, bprm);

    // 调用里面的 search_binary_handler

    retval = exec_binprm(bprm);

    // exec执行成功

}

static int exec_binprm(struct linux_binprm *bprm)

{

    // 扫描formats链表，根据不同的文本格式，选择不同的load函数

    ret = search_binary_handler(bprm);

    // ...

    return ret;

}

3.总结

本文主要学习了编译链接的过程和ELF可执行文件格式，对Linux内核装载和启动一个可执行程序。可执行文件开始执行的起点在修改调用execve系统调用时压入内核堆栈的EIP寄存器的值，此时标志着当前进程的可执行文件已经被完全替换为新的可执行文件，但实际上开始执行可执行文件中的指令还需要等到执行可执行文件中定义的入口地址的位置。如果是静态链接的可执行文件，那么eip指向该elf文件的文件头e_entry所指的入口地址；如果是动态链接，eip指向动态链接器。

2019-2020-1 20199310《Linux内核原理与分析》第八周作业的更多相关文章

2019-2020-1 20199329《Linux内核原理与分析》第九周作业
<Linux内核原理与分析>第九周作业一.本周内容概述: 阐释linux操作系统的整体构架理解linux系统的一般执行过程和进程调度的时机理解linux系统的中断和进程上下文切换二 ...
2019-2020-1 20199329《Linux内核原理与分析》第二周作业
<Linux内核原理与分析>第二周作业一.上周问题总结: 未能及时整理笔记 Linux还需要多用 markdown格式不熟练发布博客时间超过规定期限二.本周学习内容: <庖丁解 ...
20169212《Linux内核原理与分析》第二周作业
<Linux内核原理与分析>第二周作业这一周学习了MOOCLinux内核分析的第一讲,计算机是如何工作的?由于本科对相关知识的不熟悉,所以感觉有的知识理解起来了有一定的难度,不过多查查资 ...
20169210《Linux内核原理与分析》第二周作业
<Linux内核原理与分析>第二周作业本周作业分为两部分:第一部分为观看学习视频并完成实验楼实验一:第二部分为看<Linux内核设计与实现>1.2.18章并安装配置内核. 第 ...
2018-2019-1 20189221 《Linux内核原理与分析》第九周作业
2018-2019-1 20189221 <Linux内核原理与分析>第九周作业实验八理理解进程调度时机跟踪分析进程调度与进程切换的过程进程调度进度调度时机: 1.中断处理过程(包 ...
2017-2018-1 20179215《Linux内核原理与分析》第二周作业
20179215<Linux内核原理与分析>第二周作业这一周主要了解了计算机是如何工作的,包括现在存储程序计算机的工作模型.X86汇编指令包括几种内存地址的寻址方式和push.pop.c ...
2019-2020-1 20209313《Linux内核原理与分析》第二周作业
2019-2020-1 20209313<Linux内核原理与分析>第二周作业零.总结阐明自己对"计算机是如何工作的"理解. 一.myod 步骤复习c文件处理内容 ...
2018-2019-1 20189221《Linux内核原理与分析》第一周作业
Linux内核原理与分析 - 第一周作业实验1 Linux系统简介 Linux历史 1991 年 10 月,Linus Torvalds想在自己的电脑上运行UNIX,可是 UNIX 的商业版本非常昂 ...
《Linux内核原理与分析》第一周作业 20189210
实验一 Linux系统简介这一节主要学习了Linux的历史,Linux有关的重要人物以及学习Linux的方法,Linux和Windows的区别.其中学到了LInux中的应用程序大都为开源自由的软件, ...
2018-2019-1 20189221《Linux内核原理与分析》第二周作业
读书报告 <庖丁解牛Linux内核分析> 第 1 章计算工作原理 1.1 存储程序计算机工作模型 1.2 x86-32汇编基础 1.3汇编一个简单的C语言程序并分析其汇编指令执行过程因 ...

随机推荐

[洛谷2671]求和<前缀和&模拟>
题目链接:https://www.luogu.org/problemnew/show/P2671 这是noip2015普及组的第三题,谁说的普及组的题就一定水的不行,这道题就比较有意思的这道题的暴力 ...
DEV Chart控件鼠标选中某条曲线
this.Chart.ObjectSelected += new DevExpress.XtraCharts.HotTrackEventHandler(this.Chart_ObjectSelecte ...
别人家的 InfluxDB 实战 + 源码剖析
1. 前几次的分享,我们多次提到了下图中 Metrics 指标监控的 Prometheus.Grafana,而且 get 到了 influxdata 旗下的 InfluxDB 的入门技能. 本次,我们 ...
使用 python 进行身份证号校验
使用 python 代码进行身份证号校验先说,还有很多可以优化的地方. 1.比如加入15位身份证号的校验,嗯哼,15位的好像没有校验,那就只能提取个出生年月日啥的了. 2.比如判断加入地址数据库,增 ...
rest_framework-序列化-1
序列化定义模型类 from django.db import models # Create your models here. class StuModel(models.Model): SEX_ ...
go 反射包
一.什么是反射? 反射是用程序检查其所拥有的结构,尤其是类型的一种能力: 二.Printf Printf 的函数声明为: func Printf(format string, args ... int ...
Linux网络安全篇,配置Yum源（一），本地Yum源
1.创建挂载目录 mkdir /mnt/cdrom 2.挂载软件源cdrom mount /dev/cdrom /mnt/cdrom/ 3.建立本地yum源资源文件夹 mkdir /usr/local ...
C语言实现双向链表
目前我们所学到的链表,无论是动态链表还是静态链表,表中各节点中都只包含一个指针(游标),且都统一指向直接后继节点,通常称这类链表为单向链表(或单链表). 虽然使用单链表能 100% 解决逻辑关系为 & ...
六、路由详细介绍之动态路由RIP（了解一下就行）
动态路由分为距离矢量路由(RIP)和链路状态(OSPF和ISIS) 一.离矢量路由协议-RIP RIP协议现在基本上被淘汰. RIP动态路由协议工作原理,如上图: R12中有192.168.1.0和1 ...
Scala——的并行集合
当出现Kafka单个分区数据量很大,但每个分区的数据量很平均的情况时,我们往往采用下面两种方案增加并行度: l 增加Kafka分区数量 l 对拉取过来的数据执行repartition 但是针对这种 ...

2019-2020-1 20199310《Linux内核原理与分析》第八周作业