GNU C - 关于8086的内存访问机制以及内存对齐(memory alignment)
一、为什么需要内存对齐?
无论做什么事情,我都习惯性的问自己:为什么我要去做这件事情? 是啊,这可能也是个大家都会去想的问题,
因为我们都不能稀里糊涂的或者。那为什么需要内存对齐呢?这要从cpu的内存访问机制说起.
为了了解清楚cpu的内存访问机制,昨天整晚都在查找资料,但是还是找不到很好的介绍资料.后来只是找到了相关
的一些介绍的博客。 这些博客中大多都是以介绍内存对齐为主要目的,然后顺带着说一下cpu的内存访问机制,所以
找不到权威的资料,后来听说<<汇编语言编程艺术>>这本书里面有关于x86的系统介绍,就下载了一份PDF,但是
也还是没有找到.
所以呢下面的一些关于x86的内存访问方面的只是很多都是来源于一些比较好的博客.在文章的最后我会注明参考的
博客链接,作为扩展阅读.
简单介绍x86的内存访问机制:
1.内存的写入操作: cpu把需要写入的地址放入地址总线, 把需要写入的数据放入数据总线, 把控制总线置为写入操作.
然后内存子系统根据地址总线选定内存单元, 检查控制总线发现是写入操作,则入去数据总线数据, 写入相关内存
单元.
2.内存的读入操作: cpu把需要读入的地址放入地址总线, 把控制总线置为读入操作. 内存子系统根据地址总线选定内存
单元, 检查控制总线发现是读入操作, 则读取内存单元中的数据, 写入数据总线.
16bit数据总线: 每个内存周期,cpu只能读取一个偶单元和一个奇单元,地址总线的地址是偶单元的地址,所以地址总线的地址永远是2对齐的.
每个内存周期,可以读取一个字,也就是16bit.
1.读取一个字,如果是以2对齐的,则只需要一个内存周期即可完成.如果数据不是以2对齐的,则需要2个内存周期.
2.读取双字: 如果是以2对齐的,则只需要2个内存周期即可完成,如果数据不是以2对齐的,则需要3个内存周期完成.
32bit数据总线: 每个内存周期,读取的数据地址都是以4对齐的.一个内存周期可以读取一个双字,也就是32bit.
1.如果读取一个双字,地址是以4对齐的话,则只需要一个内存周期即可完成.如果不是以4对齐,则需要2个内存周期完成.
2.如果读取一个字,地址是对4取模余3的话,那么需要2个内存周期完成对数据的读取.地址如果对4去模不余3的话,则
只需要一个内存周期即可完成数据读取.
3. 对于字节, 任何字节地址读取只需要一个内存周期.
通过上面可以看得出,为什么16bit数据总线cpu是以2对齐的,而32bit数据总线cpu是以4对齐的. 最主要的原因是能够在最小的
内存周期内完成对地址的访问,提高cpu的效率.
二、内存对齐的作用
如果不采用内存对齐机制的话,有些地址的访问需要在多个内存周期内完成,而且还需要多次内存周期读取的高低字节
进行拼凑,然后得到32bit数据. 如果使用内存对齐机制,不仅可以减少对地址访问过程中需要的内存周期,而且还避免了
高低字节的数据拼凑,提高了cpu的工作效率.
三、编译器是如何处理内存对齐的??
struct mem_alignment
{
char a;
int b;
char c;
};
在32位x86机器上面它的大小是12. 另外一个问题,如果结构体中的成员变量顺序不一样会导致该结构在内存中的长度
也不一样,就像上面,如果改成下面这个样子:
struct mem_alignment
{
char a;
char c;
int b;
};
那么它的大小就变成了8.
如果我们使用紧凑的对齐方式 __attribute__((packed)) or __attribute__((aligned (1)))的话,
那么struct mem_alignment的大小应该是6. 或者是使用伪指令#pragma pack (1).
#pragma pack (1)
struct mem_alignment
{
char a;
char c;
int b;
};
#pragma pack ()
上面最后一句的作用是恢复编译器默认的对齐方式.
关于内存对齐方面的知识就总结到这里. 也算是对前面文章的交代了~
GNU C - 关于8086的内存访问机制以及内存对齐(memory alignment)的更多相关文章
- Linux中的Buffer Cache和Page Cache echo 3 > /proc/sys/vm/drop_caches Slab内存管理机制 SLUB内存管理机制
Linux中的Buffer Cache和Page Cache echo 3 > /proc/sys/vm/drop_caches Slab内存管理机制 SLUB内存管理机制 http://w ...
- numactl 修改 非统一内存访问架构 NUMA(Non Uniform Memory Access Architecture)模式
当今数据计算领域的主要应用程序和模型可大致分为三大类: (1)联机事务处理(OLTP). (2)决策支持系统(DSS) (3)企业信息通讯(BusinessCommunications) 上述三类系统 ...
- JVM自动内存管理机制——Java内存区域(下)
一.虚拟机参数配置 在上一篇<Java自动内存管理机制——Java内存区域(上)>中介绍了有关的基础知识,这一篇主要是通过一些示例来了解有关虚拟机参数的配置. 1.Java堆参数设置 a) ...
- JVM自动内存管理机制——Java内存区域(上)
一.JVM运行时数据区域概述 Java相比较于C/C++的一个特点就是,在虚拟机自动内存管理机制的帮助下,我们不需要为每一个操作都写像C/C++一样的delete/free代码,所以也不容易出现内存泄 ...
- 2.1 自动内存管理机制--Java内存区域与内存溢出异常
自动内存管理机制 第二章.Java内存区域与内存溢出异常 [虚拟机中内存如何划分,以及哪部分区域.什么样代码和操作会导致内存溢出.各区域内存溢出的原因] 一.运行时数据区域 Java虚拟机所管理的内存 ...
- Android内存管理机制之一:low memory killer
转载自http://www.miui.com/thread-29268-1-1.html 准备写这个专题之前,心里是有点忐忑的.首先Android内存管理机制相当复杂,想要讲清楚比较困难:其次对于绝大 ...
- JVM内存回收机制——哪些内存需要被回收(JVM学习系列2)
上一篇文章中讨论了Java内存运行时的各个区域,其中程序计数器.虚拟机栈.本地方法栈随线程生灭,且创建时需要多少内存,基本上在译期间就决定的了,所以在内存回收时无需特殊的关注.而堆和方法区则不同,首先 ...
- Java的内存管理机制之内存区域划分
各位,好久不见.先做个预告,由于最近主要在做Java服务端开发,最近一段时间会更新Java服务端开发相关的一些知识,包括但不限于一些读书笔记.框架的学习笔记.和最近一段时间的思考和沉淀.先从Java虚 ...
- 分布式缓存系统 Memcached 内存管理机制
在前面slab数据存储部分分析了Memecached中记录数据的具体存储机制,从中可以看到所采用的内存管理机制——slab内存管理,这也正是linux所采用的内存高效管理机制,对于Memchached ...
随机推荐
- OpenWRT 编译 error GNU libiconv not in use but included iconv.h is from...
OpenWRT 编译 error GNU libiconv not in use but included iconv.h is from... 编译的时候碰到一个常见的错误,但是却在一个陌生的地方爆 ...
- cf486B OR in Matrix
B. OR in Matrix time limit per test 1 second memory limit per test 256 megabytes input standard inpu ...
- 应用程序打包(ipa)
如果想让用户可以安装ipa, 必须在打包程序的时候说清楚哪一个应用程序(appid)可以安装到哪一台设备上.(UDID). 原理: 要想打包, 告诉苹果, 哪一台电脑可以进行打包 步骤: 让电脑端具备 ...
- UVa12096.The SetStack Computer
题目链接:http://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem& ...
- SQLServer 循环1百万插入测试数据
1,首先创建student表 create table student ( sno int primary key , sname VARCHAR(200) ) 2,--向数据库中插入100万条随机姓 ...
- Java单元测试:@BeforeClass,@Before,@Test,@After,@AfterClass中的问题详解
在Junit4中还有的测试注解有: @BeforeClass ,@Before,@Test,@After,@AfterClass 1.其中:@BeforeClass,@AfterClass是Juni ...
- java 面向过程实现万年历
public class Test { /** * @param args */ public static void main(String[] args) { // TODO Auto-gener ...
- 解决angular 与django的冲突
{% block main %} <script type="text/javascript" src="http://cdnjs.cloudflare.com/a ...
- OCR怎么能离开扫描仪呢?
说起OCR,说来说去就是和各种各样的图片打交道. 所以图片的质量很的关键. 说起图片的质量,不得不提的就是图片的採集. 眼下最靠谱的图像採集来源就是扫描仪. 扫描仪的话就大有说法,最靠谱的扫描仪,扫描 ...
- [置顶] 正则表达式应用:匹配IP地址
都知道iP地址有四个数值,三个点号组成.三个数值的具体范围为0到255,为了使用正则表达式匹配就必须分析IP地址的组成 1先分析数值,2再组合数值和点号 1先分析数值 IP地址的数字范围从0到255, ...