cpu要想从内存读取数据,需要通过地址总线,把地址传输给内存,内存准备好数据,输出到数据总线,交给cpu,如果地址总线只有8根,那这个地址就只有8位可以表示[0,255]256个地址,因为表示不了更多的地址,就用不了更大的内存,所以256就是8根地址总线最大的寻址空间,要使用更大的内存,就要有更宽的地址总线,例如32位地址总线就可以寻址4G内存了,每次操作1字节太慢,那就加宽数据总线,要想每次操作4字节,就要至少32位数据总线,8字节就要64位,这里每次擦操作的字节数,就是所谓的机器字长。
0
如果内存就像我们逻辑上认为的那样,一个挨着一个形成这样的大矩阵,我们可以访问任意地址,并把他输出到总线,但是实际上为了实现更高的访问效率,典型的内存布局是这样的,一个内存条的一面是一个rank,黑色是一个chip,一个chip包括8个banks,到bank这里就可以通过选择行选择列来定位一个地址了。
0
这不像是我们逻辑上认为的那样连续的存在,但是他们公用同一个地址,各自选择同一个位置的一个字节,再组合起来作为我们逻辑上认为的连续8个字节,通过这样的并行操作,提高了内存访问效率,但是如果使用这种设计,这里的地址就只能是8的倍数,如果非要错开一个格,由于最后一个字节对应位置与前七个不同,不能在一次操作中被同一个地址选中,所以这样的地址是不能用的。
之所以有些CPU能够支持访问任意地址,是因为它多做了许多处理,比如你想从地址1开始读8字节的数据CPU会分两次读,第一次从0-7,但只取后7字节,第二次从8-15,但只取第1字节,把两次结果拼起来拿到所需数据,但是这必然会影响性能,所以为了保证程序顺利高效的运行,编译器会把各种类型的数据安排到合适的地址并占用合适的长度,这就是内存对齐,每种类型的对齐值就是它的对齐边界,内存对齐要求数据存起始储地址以及占用字节数都要是它对齐边界的倍数,所以这个int32要错开两个字节,从4开始存却不能紧接着从2开始。
0
现在的问题是怎么确定每种类型的对齐边界呢,这和平台有关。
0
go语言支持这些平台,可以看到,指针宽度和寄存器宽度都是4字节,64位平台上都是8字节,而被go语言称为寄存器宽度的这个值,就可以理解位机器字长,也是平台对应的最大对齐边界 。
而数据类型的对齐边界是取数据类型大小和平台对齐边界中较小的那个,不过要注意,同一个类型在不同平台上的大小可能不同,对齐边界也可能不同
 
0
为什么不统一使用平台对齐边界或者统一按数据类型大小来对齐呢?我们来试一下:
假设现在是64位平台,最大对齐边界是8字节,int8只有一个字节,按照1字节对齐的话,它可以放在任何位置,因为总能通过一次读取把它完整拿出来,如果统一对齐到8字节,虽然同样只要读取一次,但是每次读取都要浪费7个字节,所以对齐到1可以节省内存空间。
0
int16占2字节,按照2字节对齐,可以从这些地址开始存,而且能保证只用读取一次
 
0
如果按照1字节对齐就可能存成这样,那就要读取2次(0-7最后一个,8-15第一个)再截取拼接,会影响性能
 
0
如果对齐到8字节,与int8一样,浪费6个内存空间,所以对齐到2
 
0
这是小于最大对齐边界的情况,如果大于最大对齐边界呢?
假设32位平台存储int64类型的数据,(此时我们取的对齐边界是4bytes)
当0和1被占用的情况下,如果类型对齐大小为8,就要从这里开始存
0
如果对齐到4,就可以从这里开始,内存浪费更少
0
所以内存对齐边界会这样选择依然是为了减少浪费,提高性能
最后,来看看怎么确定一个结构体的对齐边界
对结构体而言,首先要确定每个成员的对齐边界,然后取其中最大的,这就是这个结构体类型的对齐边界
0
然后我们来存储这个结构体变量,内存对齐第一个要求,存储这个结构体的起始地址,是对齐边界的倍数,假设从这里开始存
 
0
结构体的每个成员在存储时,都要把这个起始地址当作地址0,然后再用相对地址来决定自己该放在哪儿
来看第一个成员a,他要对齐1字节,而这里是相对地址0,所以直接放在这
 
0
接下来是成员b,他要对齐8字节,但是接下来的相对地址1对8取模并不等于0,所以要往后挪,b放这里
 
0
接下来是c,它要对齐4字节,直接放在这里就行
 
0
最后是d,对齐到2字节,所以放这儿
0
所有成员都放好还不算完,别忘了内存对齐的第二个要求,结构体整体占用字节数需要是类型对齐边界的倍数,不够的话需要往后扩张一下,所以他要扩充到相对地址23这里(24%8=0),最终,这个结构体的类型大小就是24字节。
至于为什么要限制类型大小等于其对齐边界的整数倍,我们可以这样理解
如果这里不扩张到整数倍,则这个结构体的类型大小为22字节,那么要使用一个长度为2的T类型数组按照元素类型大小会占用44字节的内存,问题出现了
0
第二个元素并没有内存对齐(22%8 !=0)
所以,只有结构体的大小是对齐边界的整数倍,才能保证数组中每个元素的内存都是对齐的。
 
注:本文总结自B站UP主幼麟实验室的视频,只为方便复习使用。

go语言结构体内存对齐的更多相关文章

  1. C语言-结构体内存对齐

    C语言结构体对齐也是老生常谈的话题了.基本上是面试题的必考题.内容虽然很基础,但一不小心就会弄错.写出一个struct,然后sizeof,你会不会经常对结果感到奇怪?sizeof的结果往往都比你声明的 ...

  2. 【APUE】Chapter17 Advanced IPC & sign extension & 结构体内存对齐

    17.1 Introduction 这一章主要讲了UNIX Domain Sockets这样的进程间通讯方式,并列举了具体的几个例子. 17.2 UNIX Domain Sockets 这是一种特殊s ...

  3. 关于结构体内存对齐方式的总结(#pragma pack()和alignas())

    最近闲来无事,翻阅msdn,在预编译指令中,翻阅到#pragma pack这个预处理指令,这个预处理指令为结构体内存对齐指令,偶然发现还有另外的内存对齐指令aligns(C++11),__declsp ...

  4. C++ struct结构体内存对齐

    •小试牛刀 我们自定义两个结构体 A 和 B: struct A { char c1; char c2; int i; double d; }; struct B { char c1; int i; ...

  5. C语言结构体内存分配详情

    #include <stdio.h> int main() { /*************************************************** * * 结构体内存 ...

  6. [C/C++] 结构体内存对齐用法

    一.为什么要内存对齐 经过内存对齐之后,CPU的内存访问速度大大提升; 内存空间按照byte划分,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内 ...

  7. [C/C++] 结构体内存对齐:alignas alignof pack

    简述: alignas(x):指定结构体内某个成员的对齐字节数,指定的对齐字节数不能小于它原本的字节数,且为2^n; #pragma pack(x):指定结构体的对齐方式,只能缩小结构体的对齐数,且为 ...

  8. c 结构体内存对齐详解

    0x00简介 首先要知道结构体的对齐规制 1.第一个成员在结构体变量偏移量为0的地址处 2.其他成员变量对齐到某个数字的整数倍的地址处 对齐数=编辑器默认的一个对齐数与该成员大小的较小值 vs中默认的 ...

  9. C语言中结构体内存对齐

    先写一个小程序: #include<stdio.h> struct student  {    int a;   char k;   short m; }; int main() { st ...

随机推荐

  1. 并查集板子+kruskal

    最近在学最小生成树得时候又用到了并查集,一起来整理一下 1.并查集 并查集就是字面意思,将两个单独得集合合并成一个大的集合. 并查集关键在于两个操作:合并和查找 先要完成查找操作(合并操作在查找的基础 ...

  2. foreign key 多对一 多对对 一对一

    使用foreign key 要清除先有哪张表再有哪张表,后表对应前表 例如现有部门再有员工,所以员工对应部门 现有作者后有书,所以书对应作者 现有潜在顾客后有顾客,所以顾客对应潜在顾客 多对多建立3张 ...

  3. 80行代码教你写一个Webpack插件并发布到npm

    1. 前言 最近在学习 Webpack 相关的原理,以前只知道 Webpack 的配置方法,但并不知道其内部流程,经过一轮的学习,感觉获益良多,为了巩固学习的内容,我决定尝试自己动手写一个插件. 这个 ...

  4. java并发编程工具类JUC第一篇:BlockingQueue阻塞队列

    Java BlockingQueue接口java.util.concurrent.BlockingQueue表示一个可以存取元素,并且线程安全的队列.换句话说,当多线程同时从 JavaBlocking ...

  5. 西门子S7200/300/400以太网通讯处理器选型分类

    北京华科远创科技有限研发的远创智控转以太网模块适用于西门子S7-200/S7-300/S7-400.SMART S7-200.西门子数控840D.840DSL.合信.亿维PLC的PPI/MPI/PRO ...

  6. [源码解析] 深度学习分布式训练框架 Horovod (1) --- 基础知识

    [源码解析] 深度学习分布式训练框架 Horovod --- (1) 基础知识 目录 [源码解析] 深度学习分布式训练框架 Horovod --- (1) 基础知识 0x00 摘要 0x01 分布式并 ...

  7. cachecloud生产环境搭建

    步骤 1 机器管理 机器初始化Redis环境 添加机器  执行:  cachecloud-init.sh脚本 2 cachecloud添加机器的时候需要添加一个用户cachecloud-open ad ...

  8. GStreamer 1.18.4稳定的错误修复版本

    GStreamer 1.18.4稳定的错误修复版本GStreamer团队宣布最喜欢的跨平台多媒体框架的稳定的1.18版本系列中的另一个错误修复版本!此版本仅包含错误修复和重要的安全修复程序,并且从1. ...

  9. 稀疏自编码器及TensorFlow实现

    自动编码机更像是一个识别网络,只是简单重构了输入.而重点应是在像素级重构图像,施加的唯一约束是隐藏层单元的数量. 有趣的是,像素级重构并不能保证网络将从数据集中学习抽象特征,但是可以通过添加更多的约束 ...

  10. PyTorch 数据并行处理

    PyTorch 数据并行处理 可选择:数据并行处理(文末有完整代码下载) 本文将学习如何用 DataParallel 来使用多 GPU. 通过 PyTorch 使用多个 GPU 非常简单.可以将模型放 ...