一、x86

总体上遵循两个原则:

  • 整体空间----占用空间最大的成员(的类型)所占字节数的整数倍
  • 对齐原则----内存按结构成员的先后顺序排列,当排到该成员变量时,其前面已摆放的空间大小必须是该成员类型大小的整倍数,如果不够则补齐,以此向后类推
说明:假定结构体是从地址0开始依次存放各个变量的

struct s1
{ 变量占据内存位置 去掉余下变量后结构体所占内存空间
char a; //0 //
double b; //8-15 //
int c; //16-19     //
char d; //20      //
short e; //22-23      //
short f; //24-25      //
} student;

详细解释:sizeof()用法汇总

为什么会有这样的规定呢?

这一定与处理器的字长有关(处理器一次存取数据的宽度)和编译器对结构体变量的处理有关。不幸的是,本人对x86架构不甚熟悉,只能借助与ARM结构来说明这个问题。

二、ARM

总体上遵循两个原则:

  • 整体空间----如果含有>4字节类型的成员,整体空间是4字节数的整数倍;反之,都是<=4字节的成员,占用空间最大的成员类型所占字节数的整数倍
  • 对齐原则----内存按结构成员的先后顺序排列。当排到该成员变量时,倘若该成员>4字节,其前面已摆放的空间大小必须是4的整倍数;倘若该成员<=4字节,其前面已摆放的空间大小必须是该成员类型大小的整倍数,如果不够则补齐。以此向后类推

说明:假定结构体是从地址0开始依次存放各个变量的
struct s1
{ 变量占据内存位置 去掉余下变量后结构体所占内存空间
char a;     //0    //
double b;     //4-11   //
int c;     //12-15   //
char d;     //16    //
short e;     //18-19    //
short f;     //20-21    //
}student;

为什么会有这样的规定呢?

这一定与处理器的字长有关(处理器一次存取数据的宽度),所以必须先将ARM的字长,实际上涉及的内容是load/stort存储方式。ARM字长是32位,4个字节。也就是说,无论如何它都要使用32位数据总线(虽然它也支持字节/半字传送)。

ldr指令

什么意思呢?看程序你就知道了。

int类型变量的存储

    AREA    Init,CODE,READONLY
IMPORT main ENTRY _entry
ldr r0,=0x12345678
ldr r1,=0x1000
str r0,[r1] ldr r2,[r1] ;r2=0x12345678
ldr r2,[r1,#] ;r2=0x123456 不对齐发生旋转
ldr r2,[r1,#2] ;r2=0x1234 bl main
END

试想,倘若我们定义了一个int变量,值为0x12345678,按照小端格式在0x1000、0x1001、0x1002、0x1003,依次存放的数据是0x78、0x56、0x34、0x12,而我们再从这儿(0x1000)取的时候,还是0x12345678。

假设我们按照小端格式存但是没有对齐(4字节对齐),在0x1001、0x1002、0x1003、0x1004,依次存放0x78、0x56、0x34、0x12,再假设0x1000单元存了一个0xab。那么我们再从这儿(0x1001)取的时候,取出来的就是0xab345678,显然读到的不是之前存的数据。

就算是,有一个非常聪明的编译器,知道如果没有对齐存放的话,将来取的时候,要从0x1001、0x1002、0x1003取一部分(一条指令),然后再从0x1004取一部分(一条指令),最后整合(好几条指令),这样的工作实在是麻烦,编译器的效率是极低的。

所以,最好的办法就是一开始存数据的时候,就根据其类型合适的对齐存放。例如int变量,就给它分配到能被4整除的地址上(实际上在它之前的存储空间大小就是4的倍数),而不要将其分配在不能被4整除的位置上。

倘若是double类型的变量,实在无可奈何,存的时候只有分两次存,读的时候分两次读,这也是32位机最快的方法。倘若没有对齐,不知道要在存取时折腾多少次。也就是说,把double类型(其实还有其他>4字节的类型)都是放在以4为倍数的地址上。

char型变量的存储

至于char型变量,是没什么要求的。

   ldr r0,=0x12345678
ldr r1,=0x1000
str r0,[r1] ldrb r2,[r1] ;r2=0x00000078
ldrb r2,[r1,#] ;r2=0x00000056
ldrb r2,[r1,#2] ;r2=0x00000034

ldrb指令,你从哪个地方读,就返回你想要的值,不会发生什么移位旋转的问题。所以,你把一个char型变量,放在任意位置都行,ldrb指令都能准确无误的将其取出。

short变量的存储

还有short变量,这个也是有说唱的。情况也有些复杂,但没有ldr指令那么复杂。

    ldr r0,=0x12345678
ldr r1,=0x1000
str r0,[r1] ldrh r2,[r1] ;r2=0x00005678
ldrh r2,[r1,#] ;r2=0x00005678 不对齐读的还是0x10000的内容
ldrh r2,[r1,#] ;r2=0x00001234

试想,倘若我们定义了一个short变量,值为0x5678,按照小端格式在0x1000、0x1001,依次存放的数据是0x78、0x56,而我们再从这儿(0x1000)取的时候,还是0x00005678。

假设我们按照小端格式存但是没有对齐(2字节对齐),在0x1001、0x1002 ,依次存放0x78、0x56,再假设0x1000单元存了一个0xab。那么我们再从这儿(0x1001)取的时候,取出来的就是0x000078ab,显然读到的不是之前存的数据。

所以在存储short变量时,是存在以2为倍数的地址上。

回到正题

由上可知,我们知道了变量在存储过程中对地址的限制。通常,这些非常底层的东西,程序员是无需知道的。只不过,当用到struct结构体时,会把这个问题翻出来。

结构体变量的成员是按次序在内存中排放,排放时候也需要遵从上边的限制。现在,那两条规则的原因就是这样了。

结论

不同架构的处理器对应着一定的编译器,这些不同的编译器对struct变量的处理是不一样的。

union 与struct的空间计算的更多相关文章

  1. C语言union关键字,union和struct区别

    union 关键字的用法与struct 的用法非常类似. union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间 ...

  2. 用union 和 struct 位域操作

    很久没有用C 语言中的 union 和 struct 位域操作了. 最近用了一下(当然,我承认是从stackoverflow 上抄的) 需求是这样的,已知一个 LPARAM 整数 3866625 ,求 ...

  3. (数据科学学习手札84)基于geopandas的空间数据分析——空间计算篇(上)

    本文示例代码.数据及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在本系列之前的文章中我们主要讨论了g ...

  4. (数据科学学习手札88)基于geopandas的空间数据分析——空间计算篇(下)

    本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在基于geopandas的空间数据分析系列 ...

  5. union 和struct大小计算

    一.字节对齐 现代计算机的内存空间是按照字节(byte)来划分的,字节对齐的意思是在给特定变量类型分配内存空间的时候,变量的内存地址是它本身变量类型大小的整数倍.比如,给int类型的变量a分配地址空间 ...

  6. union和struct的区别之处,在于内存的共享上

    首先看看union,在c++中,union可能没有多大用处,在c语言中,可能我们要借助其完成很多巧妙的设计,下面是其一个完整的定义: union UTest         {             ...

  7. [转]C++中sizeof(struct)怎么计算?

    版权属于原作者,我只是排版. 1. sizeof应用在结构上的情况 请看下面的结构: struct MyStruct{ double dda1; char dda; int type;}; 对结构My ...

  8. C++中sizeof(struct)怎么计算?(转)

    struct为空时,大小为1. 1. sizeof应用在结构上的情况 请看下面的结构: struct MyStruct { double dda1; char dda; int type; }; 对结 ...

  9. union与struct以及大小端

    两者的区别: 1. 共用体和结构体都是由多个不同的数据类型成员组成, 但在任何同一时刻, 共用体只存放了一个被选中的成员, 而结构体的所有成员都存在.   2. 对于共用体的不同成员赋值, 将会对其它 ...

随机推荐

  1. ASP.NET MVC- VIEW Using the TagBuilder Class to Build HTML Helpers Part 3

    The ASP.NET MVC framework includes  a useful utility class named the TagBuilder class that you can u ...

  2. TI-Davinci开发系列之二使用CCS5.2TI Simulator模拟环境调试DSP程序

    上接博文<TI-Davinci开发系列之一CCS5.2的安装及注意事项>. 如何没有实际的开发板或者仿真器,可以使用CCS自带的TISimulator来学习与熟悉CCS开发调试环境.下面是 ...

  3. [TypeScript] Installing TypeScript and Running the TypeScript Compiler (tsc)

    This lesson shows you how to install TypeScript and run the TypeScript compiler against a .ts file f ...

  4. [置顶] String StringBuffer StringBuilder的区别剖析

    这是一道很常见的面试题目,至少我遇到过String/StringBuffer/StringBuilder的区别:String是不可变的对象(final)类型,每一次对String对象的更改均是生成一个 ...

  5. struts2 ajax 实现方式

    在 struts2 中实现ajax,可以使用struts2-json-plugin扩展,但是返回的json字段必须都是Action中的属性,不可以随意的输出文本. 返回任意的文本有两种方式, 方法一: ...

  6. Cracking the coding interview

    写在开头 最近忙于论文的开题等工作,还有阿里的实习笔试,被虐的还行,说还行是因为自己的水平或者说是自己准备的还没有达到他们所需要人才的水平,所以就想找一本面试的书<Cracking the co ...

  7. System Operations on AWS - Lab 1W - Creating EC2 (Windows)

    1. 创建CommandHost实例,登录到CommandHost,通过AWS CLI创建WebServer实例. 1.1 为CommandHost实例创建一个IAM角色 1.2 创建CommandH ...

  8. Js判断对象是否为空,Js判断字符串是否为空

    Js判断对象是否为空,Js判断字符串是否为空,JS检查字符串是否为空字符串 >>>>>>>>>>>>>>>&g ...

  9. Unity3D 获得GameObject组件的方法

    Unity3D 获得GameObject组件的方法有几种,这里进行说明一下: 组件: 要获得这些组件,进行操作的话,绑定一个Movescipt 的C#组件,里面的获取方法为 void Update ( ...

  10. c语言训练题:关于张三李四王五说谎的问题(此处用javascript实现)

    (第一篇博文) 今天在一个交流群里见他们无聊,然后找到之前收藏的一些c语言题目放出去想让他们做,结果反倒是自己不会做,于是花了很多时间去想. 原题:张三说李四在说谎,李四说王五在说谎,王五说张三和李四 ...