简介

用户进程的虚拟地址空间是Linux的一个重要的抽象:它为每个运行进程提供了同样的系统视图,这使得多个进程可以同时运行,而不会干扰到其他进程内存中的内容。

每个应用程序都有自己的线性地址空间,与所有其他应用程序隔开。

进程的虚拟地址空间

各进程虚拟地址空间起始于0,延伸到TASK_SIEZE-1,其上是内核地址空间。

用户程序只能访问整个地址空间的下半部分,不能访问内核部分。如果没有预先达成“协议”,用户进程也不可能操作另外一个进程的地址空间,因为后者的地址空间对前者不可见。

虚拟地址空间由许多不同的段组成,用于不同的目的。

进程地址空间布局

系统中的各个进程都具有一个struct mm_struct的实例,它可以通过 task_struct 访问。这个实例保存了进程的内存管理信息。

<mm_types.h>

struct mm_struct {
...
unsigned long (*get_unmapped_area) (struct file *filp,
unsigned long addr, unsigned long len,
unsigned long pgoff, unsigned long flags);
...
unsigned long mmap_base; /* mmap区域的基地址 */
unsigned long task_size; /* 进程虚拟内存空间的长度 */
...
unsigned long start_code, end_code, start_data, end_data;
unsigned long start_brk, brk, start_stack;
unsigned long arg_start, arg_end, env_start, env_end;
...
}

可执行代码占用的虚拟地址空间,开始和接收分别通过start_code和end_code标记。

初始化数据区域用start_data 和 end_data 标记。

堆的起始地址保存在start_brk, brk表示堆区域当前的结束区域。堆的起始地址在进程生命周期中是不变的,但是堆长度会发生改变,因而brk的值也会变。

参数列表位置arg_start和arg_end, 环境变量 env_start 和 env_end 描述。

mmap_base 表示虚拟地址空间中用于内存映射的起始地址。

task_size 存储了对于进程的地址空间长度。该值通常是TASK_SIZE。

用于内存映射的区域起始于mm_struct->mmap_base,通常设置为TASK_UNMAPPED_BASE。

使用load_elf_binary 载入一个ELF二进制文件时,将创建进程的地址空间。

内存映射的原理

由于所有用户进程中的虚拟地址空间比可用的物理地址内存大得多,因此只有最常用的部分才与物理内存帧关联。

内核必须提供数据结构,以建立虚拟地址空间的区域和相关数据所在位置之间的关联。

内核利用 address_space 数据结构,提供一组方法从后备存储器读取数据。例如,从文件系统读取。因此address_space形成了一个辅助层,将映射的数据表示为连续的线性区域,提供给内存管理子系统。

按需分配和填充页称之为按需调页法(demand paging)。一般步骤:

  1. 进程试图访问用户地址空间中的一个内存地址,但使用页表无法确定物理地址(物理内存中

    没有关联页)。
  2. 处理器接下来触发一个缺页异常,发送到内核。
  3. 内核会检查负责缺页区域的进程地址空间数据结构,找到适当的后备存储器,或者确认该访

    问实际上是不正确的。
  4. 分配物理内存页,并从后备存储器读取所需数据填充。
  5. 借助于页表将物理内存页并入到用户进程的地址空间,应用程序恢复执行

数据结构

前面我们知道,struct mm_struct 很重要,该结构提供了进程在内存布局的所有必要信息。另外,它还包括下列成员,用于管理用户进程在虚拟地址空间中的所有内存区域。

<mm_types.h>

struct mm_struct {
struct vm_area_struct *mmap; /* 虚拟内存区域列表 ,表示虚拟内存*/
struct rb_root mm_rb;
struct vm_area_struct *mmap_cache; /* 上一次find_vma的结果 */
...
}

每个区域都通过一个 vm_area_struct 实例描述,进程的各区域按两种方法排序。

(1) 在一个单链表上(开始于 mm_struct->mmap )。

(2) 在一个红黑树中,根结点位于 mm_rb

红黑树用于扫描特定节点很高效。通过红黑树管理,就可以加快扫描速度。

增加新区域时,内核首先搜索红黑树,找到刚好在新区域之前的区域。因此,内核可以向树和线性表增加新的区域,而无需扫描链表。

地址空间

文件的内存映射可以认为是两个不同的地址空间之间的映射,用来简化系统的工作。一个地址空间是用户进程的虚拟地址空间,另一个就是文件系统所在的地址空间。

内核创建一个映射时,必须建立两个地址空间之间的关联,以支持二者以请求读写的形式通信。

vm_operations_struct 结构用于完成该工作。它提供了一个操作,来读取已经映射到虚拟地址空间,但是其内容尚未进入物理内存的页。

各种不同文件类型(普通文件,设备文件等),以及映射类型和性质相关的信息,还会用到另外一个结构 address_space 。

内存映射

建立映射时内核和应用程序之间的交互,c标准库提供了mmap函数建立映射。

在内核这端,提供了2个系统函数mmap和mmap2。mmap 和 mmap2 之间的差别在于偏移量的语义( off )。在这两个调用中,它都表示映射在文件中开始的位置。对于 mmap ,位置的单位是字节,而 mmap2 使用的单位则是页( PAGE_SIZE )。因此即使文件比可用地址空间大,也可以映射文件的一部分

堆的管理

堆是进程中用于动态分配变量和数据的内存区域。它的实现依赖标准库提供的辅助函数(比如malloc)来分配任意长度内存区域。堆是一个连续的内存区域,在扩展时自下向上增长。前面提到的mm_struct 结构,包含了堆在虚拟地址空间的起始位置和当前结束地址(start_brk和brk)。

<mm_types.h>

struct mm_struct
{
...
unsigned long start_brk, brk, start_stack;
...
};

brk 系统调用只需要一个参数,用于指定堆在虚拟地址空间中新的结束地址(如果堆将要收缩,

当然可以小于当前值)。brk 系统调用实现的入口是 sys_brk 函数。

Linux进程的虚拟内存的更多相关文章

  1. Linux进程的虚拟内存区域划分

    Linux进程的虚拟内存区域分为:代码区.只读常量区.全局区.BSS段.堆区.栈区 代码区:存储功能代码,函数名所在的区域 只读常量区:存放字符串常量,以及const修饰的全局变量 全局区/数据区:存 ...

  2. linux 进程地址空间的一步步探究

    我们知道,在32位机器上linux操作系统中的进程的地址空间大小是4G,其中0-3G是用户空间,3G-4G是内核空间.其实,这个4G的地址空间是不存在的,也就是我们所说的虚拟内存空间. 那虚拟内存空间 ...

  3. linux进程虚拟地址空间

    转载源 在多任务操作系统中,每个进程都运行在属于自己的内存沙盘中.这个沙盘就是虚拟地址空间(Virtual Address Space),在32位模式下它是一个4GB的内存地址块.在Linux系统中, ...

  4. UNIX环境高级编程——Linux进程地址空间和虚拟内存

    一.虚拟内存 分段机制:即分成代码段,数据段,堆栈段.每个内存段都与一个特权级相关联,即0~3,0具有最高特权级(内核),3则是最低特权级(用户),每当程序试图访问(权限又分为可读.可写和可执行)一个 ...

  5. Linux进程地址空间与虚拟内存

    http://blog.csdn.net/xu3737284/article/details/12710217 32位机器上linux操作系统中的进程的地址空间大小是4G,其中0-3G是用户空间,3G ...

  6. Linux进程地址空间和虚拟内存

    一.虚拟内存 先来看一张图(来自<Linux内核完全剖析>),如下: 分段机制:即分成代码段,数据段,堆栈段.每个内存段都与一个特权级相关联,即0~3,0具有最高特权级(内核),3则是最低 ...

  7. Linux进程管理及while循环

    目录 进程的相关概念 进程查看及管理工具的使用 Linux系统作业控制 调整进程优先级 网络客户端工具 bash之while循环 20.1.进程类型 守护进程 daemon,在系统引导过程中启动的进程 ...

  8. Linux进程管理

    一.进程管理简介 进程是正在执行的程序或命令,每一个进程都是一个运行实体,都有自己的地址空间,并占用一定的系统资源. 进程管理的作用: 1.判断服务器的健康状态 2.查看系统中的所有进程 3.杀死进程 ...

  9. 12个Linux进程管理命令介绍(转)

    12个Linux进程管理命令介绍 [日期:2015-06-02] 来源:Linux中国  作者:Linux [字体:大 中 小]   执行中的程序在称作进程.当程序以可执行文件存放在存储中,并且运行的 ...

随机推荐

  1. kotlin函数式编程入门及图片处理

    函数式编程入门: 对于面向对象编程[OOP]和函数式编程[FP] 由于在JAVA8的学习中系统的学习过了,所以这里对其概念就不过多解释了,下面直接用代码来看下在kotlin中函数式编程是如何编写的: ...

  2. hive不分区增量更新

    insert overwrite table ods.zeg_so select *,case when zsm.id is not null then cast(current_timestamp ...

  3. Java8 新特性----函数式接口,以及和Lambda表达式的关系

    这里来讲解一下Java8 新特性中的函数式接口, 以及和Lambda 表达式的关系.看到过很多不少介绍Java8特性的文章,都会介绍到函数式接口和lambda表达式,但是都是分别介绍,没有将两者的关系 ...

  4. Aspect表达式

    任意公共方法的执行:execution(public * *(..))任何一个以“set”开始的方法的执行:execution(* set*(..))AccountService 接口的任意方法的执行 ...

  5. 28. ClustrixDB 分布式架构/评估模型

    本节描述如何在数据库中计算查询.在ClustrixDB中,我们跨节点切片数据,然后将查询发送到数据.这是数据库的基本原则之一,它允许随着添加更多节点而几乎线性地扩展. 有关如何分布数据的概念,请参阅数 ...

  6. CSS 的伪元素是什么?

    CSS伪元素是用来添加一些选择器的特殊效果.用于:向某个选择器中的文字的首行. ㈠语法 ①伪元素的语法: selector:pseudo-element {property:value;} ②CSS类 ...

  7. 计算机网络(八),TCP的滑动窗口

    目录 1.RTT和RTO 2.TCP使用滑动窗口做流量控制与乱序重排 3.滑动窗口的基本原理 八.TCP的滑动窗口 TCP头部中的窗口字段:滑动窗口大小,用来告知发送端接受端的缓存大小,以此控制发送端 ...

  8. [AGC034D]Manhattan Max Matching:费用流

    前置姿势 \(k\)维空间内两点曼哈顿距离中绝对值的处理 戳这里:[CF1093G]Multidimensional Queries 多路增广的费用流 据说这个东西叫做ZKW费用流? 流程其实很简单, ...

  9. AcWing:110. 防晒(贪心)

    有C头奶牛进行日光浴,第i头奶牛需要minSPF[i]到maxSPF[i]单位强度之间的阳光. 每头奶牛在日光浴前必须涂防晒霜,防晒霜有L种,涂上第i种之后,身体接收到的阳光强度就会稳定为SPF[i] ...

  10. A. Transmigration

    A. Transmigration time limit per test 2 seconds memory limit per test 256 megabytes input standard i ...