union 与struct的空间计算

一、x86

总体上遵循两个原则：

整体空间----占用空间最大的成员（的类型）所占字节数的整数倍
对齐原则----内存按结构成员的先后顺序排列，当排到该成员变量时，其前面已摆放的空间大小必须是该成员类型大小的整倍数，如果不够则补齐，以此向后类推

说明：假定结构体是从地址0开始依次存放各个变量的

struct s1

  {        变量占据内存位置   去掉余下变量后结构体所占内存空间

  char a;       //0               //

  double b;     //8-15            //

  int c;        //16-19    　　　　//

  char d;       //20      　　　　 //

  short e;      //22-23   　　　　 //

  short f;      //24-25   　　　　 //

} student;

详细解释：sizeof()用法汇总

为什么会有这样的规定呢？

这一定与处理器的字长有关（处理器一次存取数据的宽度）和编译器对结构体变量的处理有关。不幸的是，本人对x86架构不甚熟悉，只能借助与ARM结构来说明这个问题。

二、ARM

总体上遵循两个原则：

整体空间----如果含有>4字节类型的成员，整体空间是4字节数的整数倍；反之，都是<=4字节的成员，占用空间最大的成员类型所占字节数的整数倍
对齐原则----内存按结构成员的先后顺序排列。当排到该成员变量时，倘若该成员>4字节，其前面已摆放的空间大小必须是4的整倍数；倘若该成员<=4字节，其前面已摆放的空间大小必须是该成员类型大小的整倍数，如果不够则补齐。以此向后类推

说明：假定结构体是从地址0开始依次存放各个变量的

struct s1

  {          变量占据内存位置    去掉余下变量后结构体所占内存空间

  char a;   　　　 //0          　　 //

  double b; 　　　 //4-11        　　//

  int c;    　　　 //12-15       　　//

  char d;  　　　　//16         　　 //

  short e; 　　　　//18-19      　　 //

  short f; 　　　　//20-21      　　 //

 }student;

为什么会有这样的规定呢？

这一定与处理器的字长有关（处理器一次存取数据的宽度），所以必须先将ARM的字长，实际上涉及的内容是load/stort存储方式。ARM字长是32位，4个字节。也就是说，无论如何它都要使用32位数据总线（虽然它也支持字节/半字传送）。

ldr指令

什么意思呢？看程序你就知道了。

int类型变量的存储

    AREA    Init,CODE,READONLY

    IMPORT main

    ENTRY

_entry

    ldr r0,=0x12345678

    ldr r1,=0x1000

    str r0,[r1]

    ldr     r2,[r1]       ;r2=0x12345678

    ldr     r2,[r1,#]    ;r2=0x123456         不对齐发生旋转

    ldr     r2,[r1,#2]    ;r2=0x1234

    bl main

    END

试想，倘若我们定义了一个int变量，值为0x12345678，按照小端格式在0x1000、0x1001、0x1002、0x1003，依次存放的数据是0x78、0x56、0x34、0x12，而我们再从这儿(0x1000)取的时候，还是0x12345678。

假设我们按照小端格式存但是没有对齐（4字节对齐），在0x1001、0x1002、0x1003、0x1004，依次存放0x78、0x56、0x34、0x12，再假设0x1000单元存了一个0xab。那么我们再从这儿(0x1001)取的时候，取出来的就是0xab345678，显然读到的不是之前存的数据。

就算是，有一个非常聪明的编译器，知道如果没有对齐存放的话，将来取的时候，要从0x1001、0x1002、0x1003取一部分（一条指令），然后再从0x1004取一部分（一条指令），最后整合（好几条指令），这样的工作实在是麻烦，编译器的效率是极低的。

所以，最好的办法就是一开始存数据的时候，就根据其类型合适的对齐存放。例如int变量，就给它分配到能被4整除的地址上（实际上在它之前的存储空间大小就是4的倍数），而不要将其分配在不能被4整除的位置上。

倘若是double类型的变量，实在无可奈何，存的时候只有分两次存，读的时候分两次读，这也是32位机最快的方法。倘若没有对齐，不知道要在存取时折腾多少次。也就是说，把double类型（其实还有其他>4字节的类型）都是放在以4为倍数的地址上。

char型变量的存储

至于char型变量，是没什么要求的。

 　 ldr r0,=0x12345678

    ldr r1,=0x1000

    str r0,[r1]

    ldrb    r2,[r1]       ;r2=0x00000078

    ldrb    r2,[r1,#]    ;r2=0x00000056

    ldrb    r2,[r1,#2]    ;r2=0x00000034

ldrb指令，你从哪个地方读，就返回你想要的值，不会发生什么移位旋转的问题。所以，你把一个char型变量，放在任意位置都行，ldrb指令都能准确无误的将其取出。

short变量的存储

还有short变量，这个也是有说唱的。情况也有些复杂，但没有ldr指令那么复杂。

    ldr r0,=0x12345678

    ldr r1,=0x1000

    str r0,[r1]

    ldrh     r2,[r1]       ;r2=0x00005678

    ldrh     r2,[r1,#]    ;r2=0x00005678             不对齐读的还是0x10000的内容

    ldrh     r2,[r1,#]    ;r2=0x00001234

试想，倘若我们定义了一个short变量，值为0x5678，按照小端格式在0x1000、0x1001，依次存放的数据是0x78、0x56，而我们再从这儿(0x1000)取的时候，还是0x00005678。

假设我们按照小端格式存但是没有对齐(2字节对齐)，在0x1001、0x1002 ，依次存放0x78、0x56，再假设0x1000单元存了一个0xab。那么我们再从这儿(0x1001)取的时候，取出来的就是0x000078ab，显然读到的不是之前存的数据。

所以在存储short变量时，是存在以2为倍数的地址上。

回到正题

由上可知，我们知道了变量在存储过程中对地址的限制。通常，这些非常底层的东西，程序员是无需知道的。只不过，当用到struct结构体时，会把这个问题翻出来。

结构体变量的成员是按次序在内存中排放，排放时候也需要遵从上边的限制。现在，那两条规则的原因就是这样了。

结论

不同架构的处理器对应着一定的编译器，这些不同的编译器对struct变量的处理是不一样的。

union 与struct的空间计算的更多相关文章

C语言union关键字,union和struct区别
union 关键字的用法与struct 的用法非常类似. union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间 ...
用union 和 struct 位域操作
很久没有用C 语言中的 union 和 struct 位域操作了. 最近用了一下(当然,我承认是从stackoverflow 上抄的) 需求是这样的,已知一个 LPARAM 整数 3866625 ,求 ...
（数据科学学习手札84）基于geopandas的空间数据分析——空间计算篇（上）
本文示例代码.数据及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在本系列之前的文章中我们主要讨论了g ...
（数据科学学习手札88）基于geopandas的空间数据分析——空间计算篇（下）
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在基于geopandas的空间数据分析系列 ...
union 和struct大小计算
一.字节对齐现代计算机的内存空间是按照字节(byte)来划分的,字节对齐的意思是在给特定变量类型分配内存空间的时候,变量的内存地址是它本身变量类型大小的整数倍.比如,给int类型的变量a分配地址空间 ...
union和struct的区别之处，在于内存的共享上
首先看看union,在c++中,union可能没有多大用处,在c语言中,可能我们要借助其完成很多巧妙的设计,下面是其一个完整的定义: union UTest { ...
[转]C++中sizeof（struct）怎么计算？
版权属于原作者,我只是排版. 1. sizeof应用在结构上的情况请看下面的结构: struct MyStruct{ double dda1; char dda; int type;}; 对结构My ...
C++中sizeof（struct）怎么计算？（转）
struct为空时,大小为1. 1. sizeof应用在结构上的情况请看下面的结构: struct MyStruct { double dda1; char dda; int type; }; 对结 ...
union与struct以及大小端
两者的区别: 1. 共用体和结构体都是由多个不同的数据类型成员组成, 但在任何同一时刻, 共用体只存放了一个被选中的成员, 而结构体的所有成员都存在. 2. 对于共用体的不同成员赋值, 将会对其它 ...

随机推荐

知名IT企业待遇一览表
115家IT公司待遇一览表作者是西电通院2013届毕业硕士,依据今年找工作的情况以及身边同学的汇总,总结各大公司的待遇例如以下,吐血奉献,公司比較全.下面绝对是各大公司2013届校招的数 ...
LINUX 文件系统JBD ----深入理解Fsync
http://www.cnblogs.com/hustcat/p/3283955.html http://www.cnblogs.com/zengkefu/p/5639200.html http:// ...
ManualResetEvent的使用与介绍
它可以通知一个或多个正在等待的线程已发生事件,允许线程通过发信号互相通信,来控制线程是否可心访问资源当一个线程开始一个活动(此活动必须完成后,其他线程才能开始)时,它调用 Reset 以将 Manu ...
Asp.net Mvc对比Php的4大误解
一:asp.net技术已过时,Php技术更新 Asp.net mvc 5 发布于2014 夏天. 二:php开发者更多,所以更能得到帮助 2者对比犹如下图,会拿电锯的肯定多少会点锯子, 会用锯子的不一 ...
[FTP] FTPOperater--FTP操作帮助类（转载）
点击下载 FTPOperater.zip 这个类是关于FTP的一些操作的1.连接FTP服务器 2.上传3.下载4.删除文件5.获取当前目录下明细(包含文件和文件夹) 6.获取FTP文件列表(包括文件 ...
自定义组合控件，适配器原理-Day31
自定义组合控件,适配器原理-Day31 mobile2.1 主页定义手机上锁功能 1.弹出设置密码框. 手机下载进度自定定义控件控件的属性其实就是控件类一个属性设置属性调用类的set方法方法, ...
SQL语句一之建库
USE master --转到系统表goIF EXISTS(SELECT * FROM sysdatabases WHERE name ='Test') --查询是否存在Test数据库DROP DA ...
hadoop_并行写操作思路_2
如果想实现将 Client端的 File并行写入到各个Datanode中, 首先, 应该修改的是,DistributedFileSystem中的create方法, 在create 内部调用FSNam ...
Struts2单文件上传
第一步:首先写个上传文件的页面(简单的一个form表单) <html> <head> <meta http-equiv="Content-Type" ...
Oralce9 的新方法： Merge into Using
一.语义 MERGE语句是Oracle9i新增的语法,用来合并UPDATE和INSERT语句.通过MERGE语句,根据一张表或子查询的连接条件对另外一张表进行查询,连接条件匹配上的进行UPDATE,无 ...

union 与struct的空间计算

union 与struct的空间计算的更多相关文章

随机推荐

热门专题