下面介绍一些C语言中常见的特殊的数据存储方式，以及它们在汇编语言中是如何表示的。

数组

数组是一种将标量数据聚集成更大数据类型的方式。实现数组的方式其实十分简单，也非常容易翻译成机器代码。C语言的一个特点是可以产生指向数组元素的指针，然后可以对这些指针进行运算。

数组的基本原则如下：

对于数组的声明：T A[N];，这句语句有两个效果。首先，它在存储器中分配一个 L * N 个字节的连续区域，L 是数据类型 T 单位为字节的大小，用 $ X_A $ 来表示起始位置。其次，它引入标识符 A ，可以用 A 作为指向数组开头的指针，指针的值就是$ X_A $。

汇编代码：假设 E 是一个 int 型数组，我们想计算 E[i]，数组的地址存储在寄存器 %edx 中，下标 i 存放在寄存器 %ecx 中。下列指令会计算地址 $ X_E + 4i $，读取这个存储器的值，然后将结果放到寄存器 %eax 中。

movl    (%edx, %ecx, 4), %eax

指针运算

C语言允许对指针进行运算，计算的过程中，值会根据该指针引用的类型的大小进行伸缩（指针类型的作用）。下面这些例子给出一些关于数组 E 的表达式，以及每个表达式的汇编代码实现。

表达式	结果类型	值	汇编代码
E	int *	$ X_E $	movl %edx, %eax
E[0]	int	$ M[X_E] $	movl (%edx), %eax
E[i]	int	$ M[X_E + 4i] $	movl (%edx, %ecx, 4), %eax
&E[2]	int *	$ X_E + 8 $	leal 8(%edx), %eax
E+i-1	int *	$ X_E + 4i - 4 $	leal -4(%edx, %ecx, 4), %eax
*(E+i-3)	int	$ M[X_E + 4i - 12] $	movl -12(%edx, %ecx, 4), %eax
&E[i]-E	int	i	movl %ecx, %eax

嵌套数组

当我们创建数组的数组时，数组的分配和引用的一般原则也是成立的。例如有声明：

int A[5][3];

则相当于下面的声明：

typedef int row3_t[3];

row3_5 A[5];

A 数组是一个包含 5 个元素的数组，每一个元素是一个含有 3 个整数的数组。也可以看成是一个 5 行 3 列的二维数组。用 A[0][0] 到 A[4][2] 来引用。二维数组是以行优先的顺序来排列的。第 0 行的所有元素，可以写作 A[0]。

对于数组 T[R][C]; 来说，他的元素 T[i][j] 的存储器地址为：$ X_D + L(C * i + j) $

异质的数据结构

C语言提供了两种结合不同的对象来创建数据类型的机制：结构（struct），将多个对象集合到一个单位中；联合（union），允许用几种不同的类型引用一个对象。

结构体

C语言的 struct 创建一种数据类型，将可能不同的数据类型的对象聚合到一个对象中。结构体中各个组成部分由名字来引用。类似于数组的实现，结构体的所有组成部分都存放在存储器中的一段连续的区域内，指向结构体的指针就是结构体第一个字节的地址。编译器维护每个结构类型的信息，指示每个字段（field）的字节偏移。以这些偏移作为存储器引用中指令的位移，从而产生对结构体元素的引用。

假设有下面的结构体声明：

struct rec{

    int i;

    int j;

    int a[3];

    int *p;

};

那么在内存中的排列是：

为了访问字段，编译器产生的代码要将结构体的地址加上适当的偏移。例如指向结构体 rec 的指针变量 r 存放在寄存器 %edx 中，下面的代码将元素 r->i 复制到 r->j

movl    (%edx), %eax        # 将 r->i 放到寄存器中

movl    %eax, 4(%edx)       # 将寄存器的值复制到 r->j 中

可以看到，为了访问字段 j，代码将 r 的地址加上偏移量 4。

联合体

联合体提供了一种方式，能够规避C语言的类型系统，允许以多种类型来引用同一个对象。联合体的语法和结构体一样，但语义差别很大——联合体用不同的字段来引用相同的内存。

考虑下面的声明：

struct S{

    char c;

    int i[2];

    double v;

}

union U{

    char c;

    int i[2];

    double v;

}

在一台 IA32 Linux 机器上编译时，字段的偏移量、数据类型的完整大小如下：

类型	偏移量：c	i	v	大小
S	0	4	12	20
U	0	0	0	8

一个联合体的总的大小总是等于它的最大字段的大小。对于类型结构体 U 的指针 p，p->c、p->i[0]、p->v 都是引用数据结构的起始位置。

在一些上下文中，联合体十分有用，但是它也引起一些讨厌的错误，因为它绕过了C语言类型系统提供的安全措施。

举一个联合体应用的具体例子：现在我们要设计一个特殊的二叉树的数据结构，它有一个特点：每个叶子节点有一个 double 类型的值。每个内部节点有左右儿子的指针，但是没有数据。如果声明如下：

struct Node{

    struct Node * left;

    struct Node * right;

    double data;

};

如果用上述结构体，那么每个节点都需要 16 个字节。然而，叶子结点是没有左右儿子的，内部节点是用不着 double data 的，所以每个类型的节点都要浪费一半的内存。如果我们这样声明：

union Node{

    struct

    {

        union Node *left;

        union Node *right;

    }internal;

    double data;

};

那么每个节点就只需要 8 个字节。如果 n 是一个指向 union Node 的指针，那么可以用 n->data 来表示叶子结点的数据，n->internal.left 和 n->internal.right来表示内部节点的左右儿子。

然而这样表示，我们是没办法确定一个给定的节点到底是叶子节点，还是内部节点。有一个方法，是引入一个枚举类型，定义这个联合中可能的不同选择，再用一个结构体将两者包含起来：

typedef enum {LEAF, INTERNAL} nodetype;

struct Node_T{

    nodetype type;

    union Node{

        struct

        {

            union Node *left;

            union Node *right;

        }internal;

        double data;

    }info;

};

可以发现，这样的联合体只需要12个字节。

相对于编码带来的麻烦问题，其实使用联合体带来的节省是很小的。除非说对于有较多字段的数据结构，结构体带来的节省就会更加吸引人。

数据对齐

struct S{

    char c;

    int i[2];

    double v;

};

类型	偏移量：c	i	v	大小
S	0	4	12	20

为什么 i 的偏移量不是 1 呢？char 类型的大小不是只有 1 个字节吗？

要解答这个问题，我们必须对数据对齐有一定的了解。计算机系统对于基本的数据类型的合法地址做出了一定的限制，要求地址必须是某个值的倍数（例如4、8、16）。这种对齐限制简化了处理器系统和存储器系统之间的接口硬件设计。

对于上面那个结构体，画出来的图是这样的：

它不可能满足对齐要求。假设我们的对齐要求是 4 字节对齐的话，编译器会在字段 c 之后插入一个 3 字节的间隙（用灰色表示），对齐后的结构体如下：

可以看到后面的字段的偏移量发生了改变，整个结构体的大小变成了 20 字节。

另外，编译器结构的末尾可能为了满足对齐要求而需要一些填充。这样，结构体数组的每个元素都能满足对齐要求。例如将上述结构体稍作修改：

struct S{

    int i[2];

    double v;

    char c;

};

那么编译器为了使结构体数组的每个元素都满足对齐要求，不得不在末尾插入多余的 3 个字节。

编译这段代码，可以发现，这个编译器的对齐要求应该是为 8 的倍数。了解到对齐方式之后，我们在写结构体的时候，注意一下元素的排列顺序，可以更有效地利用内存

参考资料

CMU 2017年春季学期 ICS课程网站

【CSAPP笔记】8. 汇编语言——数据存储的更多相关文章

C#图解教程学习笔记——数据类型与数据存储
一.数据类型1. 预定义类型C#提供16种预定义类型,包括13种简单类型和3种非简单类型:(1)简单类型<1>11种数值类型: 不同长度的有符号和无符号整数类型浮点数的float和dou ...
【Java编程思想阅读笔记】Java数据存储位置
Java数据存储位置 P46页有感一.前置知识栈是由系统自动分配的,Java程序员对栈没有直接的操作权限, 堆是所有线程共享的内存区域,栈是每个线程独享的. 堆是由程序员自己申请的,在使用new ...
IOS 学习笔记 2015-04-09 0C-SQLite 数据存储
1 项目导入 libsqlite3.0.dylib 框架 2 在使用数据sqlite的头文件(.h)上导入 #Impourt <sqlite3.h> 3 推荐自己本地电脑下个sqlite ...
OpenCV学习笔记——Mat类型数据存储
CV_[The number of bits per item][Signed or Unsigned][Type Prefix]C[The channel number] 比如 CV_8UC3 表示 ...
Python学习笔记_爬虫数据存储为xlsx格式的方法
import requests from bs4 import BeautifulSoup import openpyxl wb=openpyxl.Workbook() sheet=wb.active ...
Android笔记——Android中数据的存储方式（三）
Android系统集成了一个轻量级的数据库:SQLite,所以Android对数据库的支持很好,每个应用都可以方便的使用它.SQLite作为一个嵌入式的数据库引擎,专门适用于资源有限的设备上适量数据存 ...
Android笔记——Android中数据的存储方式（二）
我们在实际开发中,有的时候需要储存或者备份比较复杂的数据.这些数据的特点是,内容多.结构大,比如短信备份等.我们知道SharedPreferences和Files(文本文件)储存这种数据会非常的没有效 ...
iOS笔记———数据存储
应用沙盒:应用文件系统的根目录,每个应用都有独自的沙盒相互:在xcode中可以用NSHomeDirectory()函数,打印当前应用的沙盒根路径. 应用程序包:包含了所有资源文件和执行文件; * Do ...
Android 学习笔记之数据存储SharePreferenced+File
学习内容: Android的数据存储.... 1.使用SharedPreferences来保存和读取数据... 2.使用File中的I/O来完成对数据的存储和读取... 一个应用程序,经常需要与用 ...

随机推荐

Linux学习笔记(第十二章)
grep进阶 grep:以整行为单位进行截取截取的特殊符号正规表示法特殊字符注意: sed用法格式化打印 awk 用法 diff档案对比: path旧文档升级为新文档
laravel5.5源码笔记（七、数据库初始化）
laravel中的数据库也是以服务提供者进行初始化的名为DatabaseServiceProvider,在config文件的providers数组中有写.路径为vendor\laravel\frame ...
day 81 Vue学习一之vue初识
Vue学习一之vue初识本节目录一 Vue初识二 ES6的基本语法三 Vue的基本用法四 xxx 五 xxx 六 xxx 七 xxx 八 xxx 一 vue初识 vue称为渐进式js ...
Linux入门第一天——环境搭建补充内容（xshell与虚拟机等操作）
一.xShell的安装和使用前往官网下载一个个人版的 xShell :https://www.netsarang.com/products/xsh_overview.html 要更换免费版的putt ...
Ajax第二天——JQuery的Ajax
JQuery中的Ajax jQuery 对 Ajax 操作进行了封装, 在 jQuery 中最底层的方法是 $.ajax(), 第二层是 load(), $.get() 和 $.post(), (常 ...
博弈论简单入门sb总结
博弈论简单入门sb总结下午讲博弈论.没预习,GG. 整个下午都在学. 0 有一堆共n个石子,两个人轮流取石子,每个人一次可以取1到k个,取到最后一个石子的人胜利. 小学生都会的sb题.若k+1|n, ...
异常 java.lang.NullPointerException at org.apache.jsp.index_jsp._jspService(index_jsp.java:124)
这是jsp报的异常 jsp代码: <% String LoginUsername = ""; String LoginPassword = ""; try ...
静态成员变量和静态成员函数(static)
数据成员可以分静态变量.非静态变量两种. 静态成员:静态类中的成员加入static修饰符,即是静态成员.可以直接使用类名+静态成员名访问此静态成员,因为静态成员存在于内存,非静态成员需要实例化才会分配 ...
SSIS 发送邮件
在SSIS中Send Mail的方法主要有三种,使用Send Mail Task,使用Script Task和使用存储过程msdb.dbo.sp_send_dbmail. 一,使用Send Mail ...
128 C语言实现文件复制功能(包括文本文件和二进制文件)
文件的复制是常用的功能,要求写一段代码,让用户输入要复制的文件以及新建的文件,然后对文件进行复制.能够复制的文件包括文本文件和二进制文件,你可以复制1G的电影,也可以复制1Byte的txt文档. 实现 ...

【CSAPP笔记】8. 汇编语言——数据存储

数组