Unix系统编程()进程内存布局
每个进程所分配的内存由很多部分组成,通常称之为"段(segment)"。
文本段包含了进程运行的程序机器语言指令。文本段具有只读属性,以防止进程通过错误指针意外修改自身指令。
因为多个进程可同时运行同一程序,所以又将文本段设为可共享,这样,一份程序代码的拷贝可以映射到所有这些进程的虚拟地址空间中。
初始化数据段包含显式初始化的全局变量和静态变量。当程序加载到内存时,从可执行文件中读取这些变量的值。
未初始化数据段包括了未进行显式初始化的全局变量和静态变量。
程序启动之前,系统将本段内所有内存初始化为0。
出于历史原因,此段常被称为BSS段,这源于老版本的汇编语言助记符"block started by symbol"。
将经过初始化的全局变量和静态变量与未经初始化的全局变量和静态变量分开存放,其主要原因在于程序在磁盘上存储时,没有必要为未经初始化的变量分配存储空间。
相反,可执行文件只需记录未初始化数据段的位置及所需大小,直到运行时再由程序加载器来分配这一空间。
栈(stack)是一个动态增长和收缩的段,由栈帧(stack frames)组成。
系统会为每个当前调用的函数分配一个栈帧。
栈帧中存储了函数的局部变量(所谓自动变量)、实参和返回值。
堆(heap)是可在运行时(为变量)动态进行内存分配的一块区域。
堆顶端称作program break。
对于初始化和未初始化的数据段而言,不太常用、但表述更清晰的称谓分别是用户初始化数据段(user-initialized data segment)和零初始化数据段(zero-initialized data segment)。
size命令可以显示二进制可执行文件的文本段、初始化数据段、非初始化数据段(bss)的段大小。
这里的的"段"不应该与一些硬件体系架构,比如x86-32中使用的硬件分段(segmentation)相混淆。
相反,这里的段指的是UNIX系统中进程虚拟内存的逻辑划分。有时,会用术语"区"(section)来代替段,因为在风行的可执行文件格式(ELF)规范中,采用的术语与"区"更趋一致。
下面的程序展示了不同类型的C语言变量,并以注释说明了每种变量分属于哪个段。
这些说明正确的前提是假定使用了非优化的编译器,且在应用程序二进制接口(ABI)中,是通过栈来传递所有参数的。实际上,优化编译器会将频繁使用的变量分配于寄存器中,或者索性地彻底将变量删除。
此外,一些ABI需要通过寄存器,而不是栈,来传递函数实参和结果。
但是这个例子只是意在展示C语言变量和进程各段之间的映射关系。
应用程序二进制接口(ABI)是一套规则,规定了二进制可执行文件 在运行时应该如何与某些服务(诸如内核或函数库所提供的服务)交换信息。ABI特别规定了使用哪些寄存器和栈地址来交换信息以及所交换值的含义,一旦针对某个特定的ABI进行了编译,其二进制可执行文件应能在ABI相同的任何系统上运行。与之相反,标准化的API仅能通过编译源代码来保证应用程序的可移植性。
虽然SUSv3没有规定,但在大多数UNIX实现(包括Linux)中C语言编程环境提供了3个全局符号(sysmbol):etext,edata和end,可在程序内使用这些符号以获取相应程序文本段、初始化数据和非初始化数据段结尾处下一字节的地址。
使用这些符号,必须显式声明如下:
extern char etext, edata, end;
下图展示了各种内存段在x86-32体系结构中的布局,该图的顶部标记为argv、environ的空间用来存储程序命令行实参(通过C语言中的main函数的argv参数获得)和进程环境列表(稍后讨论),图中十六进制的地址会因为内核配置和程序链接选项差异而有所不同。
图中标灰的区域表示这些范围在进程虚拟地址空间中不可用,也就是说,没有为这些区域创建页表(page table)。

Unix系统编程()进程内存布局的更多相关文章
- 《Linux/Unix系统编程手册》读书笔记3
<Linux/Unix系统编程手册>读书笔记 目录 第6章 这章讲进程.虚拟内存和环境变量等. 进程是一个可执行程序的实例.一个程序可以创建很多进程. 进程是由内核定义的抽象实体,内核为此 ...
- 《Linux/UNIX系统编程手册》读书笔记
2018-1-30 一.UNIX.C语言以及Linux的历史回顾 1. UNIX简史.C语言的诞生 1969年,贝尔实验室的Ken Thompson首次实现了UNIX系统. 1973年,C语言步入成熟 ...
- Linux系统编程@进程通信(一)
进程间通信概述 需要进程通信的原因: 数据传输 资源共享 通知事件 进程控制 Linux进程间通信(IPC)发展由来 Unix进程间通信 基于System V进程间通信(System V:UNIX系统 ...
- 《Linux/Unix系统编程手册》读书笔记8 (文件I/O缓冲)
<Linux/Unix系统编程手册>读书笔记 目录 第13章 这章主要将了关于文件I/O的缓冲. 系统I/O调用(即内核)和C语言标准库I/O函数(即stdio函数)在对磁盘进行操作的时候 ...
- 《Linux/Unix系统编程手册》读书笔记7 (/proc文件的简介和运用)
<Linux/Unix系统编程手册>读书笔记 目录 第11章 这章主要讲了关于Linux和UNIX的系统资源的限制. 关于限制都存在一个最小值,这些最小值为<limits.h> ...
- 《Linux/Unix系统编程手册》读书笔记5
<Linux/Unix系统编程手册>读书笔记 目录 第8章 本章讲了用户和组,还有记录用户的密码文件/etc/passwd,shadow密码文件/etc/shadow还有组文件/etc/g ...
- 《Linux/Unix系统编程手册》读书笔记1
<Linux/Unix系统编程手册>读书笔记 目录 最近这一个月在看<Linux/Unix系统编程手册>,在学习关于Linux的系统编程.之前学习Linux的时候就打算写关于L ...
- 《Linux/Unix系统编程手册》 时间子系统
Linux下操作系统编程有两本经典APUE即<Advanced Programming in the UNIX Environment>和TLPI<The Linux Program ...
- 《Linux/UNIX系统编程手册》第63章 IO多路复用、信号驱动IO以及epoll
关键词:fasync_helper.kill_async.sigsuspend.sigaction.fcntl.F_SETOWN_EX.F_SETSIG.select().poll().poll_wa ...
随机推荐
- KMP Client README
KMP Client README About KMP is a mod for v0.22 of Kerbal Space Program that adds a multiplayer game ...
- Install Visual Studio Tools for Apache Cordova
Install Visual Studio Tools for Apache Cordova Visual Studio 2013 This article refers to the Visua ...
- es5 - array - pop
/** * 描述:该pop()方法从数组中删除最后一个元素并返回该元素.此方法更改数组的长度. * 语法:arr.pop() * 返回:从数组删除元素,如果为undefined则返回空该,pop方法从 ...
- ReSharper的功能真的很强大主要是针对代码规范和优化,园子里介绍的也不少,如果你没有安装,那我只能表示你们会相见恨晚
二.ReSHarper 代码规范.单元测试.... ReSharper的功能真的很强大,主要是针对代码规范和优化,园子里介绍的也不少,如果你没有安装,那我只能表示你们会相见恨晚! 1.像命名不规范,f ...
- Android调用OCR识别图像中的文字
// CharacterExtractor.java // Copyright (c) 2010 William Whitney // All rights reserved. // This sof ...
- 【Linux】df命令
用途 df命令主要用于检查Linux服务器的文件系统的磁盘空间占用情况 全称 df的全称为:Disk Free 参数 -a :全部文件系统列表 -h :方便阅读显示 -H :等于"-h&qu ...
- 模拟登陆百度 python
from time import sleep from selenium import webdriver driver = webdriver.Firefox() driver.get('http: ...
- 位(bit)与字节(byte)
bit就是位,也叫比特位,是计算机表示数据最小的单位. byte就是字节,1byte=8bit,1byte就是1B: 一个字符=2字节: 1KB=1024B 一个英文字母,无论大写和小写都是一个字符: ...
- Linux平台Boost的编译方法
本博客(http://blog.csdn.net/livelylittlefish)贴出作 者(三二一@小鱼)相关研究.学习内容所做的笔记,欢迎广大朋友指正! Linux平台Boost的编译方法 Bo ...
- MySQL数据库字符集由utf8修改为utf8mb4一例
对于mysql 5.5 而言,如果不设定字符集,mysql默认的字符集是 latin1 拉丁文字符集: 为了统一管理和应用开发的方便,一般都会统一将操作系统,客户端,数据库各方面的字符集都设置为 ut ...