[转]数据对齐对CPU的影响

【[转]数据对齐对CPU的影响】的更多相关文章

[转]数据对齐对CPU的影响

[转]http://www.cnblogs.com/wuzhenbo/archive/2012/06/05/2537465.html 1.前言在IBM开发社区上发现一篇叫'Data alignment: Straighten up and fly right'的文章,下面的很多内容都是来自那篇文章的. 内存可以看成一个byte数组,我们通过编程语言提供的工具对这个'大数组'中的每个元素进行读写,比如在C中我们可以用指针一次读写一个或者更多个字节,这是我们一般程序员眼中的内存样子.但是从机器角…

CSAPP阅读笔记-struct, union, 数据对齐-来自第三章3.9的笔记-P183-P191

1.数据对齐为什么要对齐:通俗点解释就是CPU对数据访问时,每次都是取固定数量的字节数,假如一次取4个字节,若有个int存在0x01-0x04,则一次就能取出,若存在0x03-0x06,则需要分两次才能取到(第一次0x01-0x04,第二次0x05-0x08),这样会降低CPU效率,更何况还有像short,char之类的不是4个字节的数据.因此,编译器会对数据进行强制对齐. 对齐规则: 1.任何K字节的基本对象的地址必须是K的倍数 2.在结构末尾根据需要会做一些填充,使其一旦被拓展为数组时可以…

C/C++数据对齐汇总

C/C++数据对齐汇总这里用两句话总结数据对齐的原则: (1)对于n字节的元素(n=2,4,8,...),它的首地址能被n整除,才干获得最好的性能: (2)如果len为结构体中长度最长的变量,size为CPU(处理器)的位数,对齐规则: 若len < size,则以len为单位对齐若len >= size,则以size为单位对齐这里不考虑指定对齐方式的情况. 測试 struct B{ bool i; int j; bool k; }; struct A{ int j; bool…

data structure alignment（数据对齐）

概述: 数据对齐指数据在计算机内存中排放和获取的方式.包含三个方面:数据对齐(data alignment).数据结构填充(data alignment).打包(packing) 如果数据是自然对齐的话,CPU读写会更高效.自然对齐指数据地址是数据大小的倍数.为保证自然对齐,可能会在结构的开头或结尾进行一些填充定义: 内存地址对齐:一个内存地址a被称为n-byte对齐,如果a是n的倍数,其中n是2的幂.因此n对齐的地址的低log2(n)位是0 n-bit对齐 = n/8-byte对齐内存读取…

【C/C++开发】内存对齐(内存中的数据对齐)、大端模式及小端模式

数据对齐,是指数据所在的内存地址必须是该数据长度的整数倍.DWORD数据的内存起始地址能被4除尽,WORD数据的内存起始地址能被2除尽.X86 CPU能直接访问对齐的数据,当它试图访问一个未对齐的数据时,会在内部进行一系列的调整.这些调整对于程序员来说是透明的,但是会降低运行速度,所以编译器在编译程序时会尽量保证数据对齐. 不同的编译器内存对齐的方式不同. 一个小例子:在32位的机器上,数据是以4字节为对齐单位,这两个类的输出结果为什么不同?(VS2008) #include <iostream…

gcc数据对齐之: howto 2.

原文链接:http://www.catb.org/esr/structure-packing/ 谁应阅读本文本文探讨如何通过手工重新打包C结构体声明,来减小内存空间占用.你需要掌握基本的C语言知识,以理解本文所讲述的内容. 如果你在内存容量受限的嵌入式系统中写程序,或者编写操作系统内核代码,就有必要了解这项技术.如果数据集巨大,应用时常逼近内存极限,这项技术会有所帮助.倘若你非常非常关心如何最大限度地减少处理器缓存段(cache-line)未命中情况的发生,这项技术也有所裨益. 最后,理解这项…

谈谈C++中的数据对齐

对于C/C++程序员来说,掌握数据对齐是很有必要的,因为只有了解了这个概念,才能知道编译器在什么时候会偷偷的塞入一些字节(padding)到我们的结构体(struct/class),也唯有这样我们才能更好的理解.优化结构体和内存. 几个栗子看看几个简单的Struct,能猜出他们的SIZE吗?(运行于64Bit win10 vs2017) struct A { char c1; }; struct B { int i1; }; struct C { char c1; int i1; }; str…

C++中数据对齐

大体看了看数据对齐,不知道是否正确,总结如下: struct A { char name; double dHeight; int age; }; sizeof(A) = (1+7+8+4+4) = 24; 这是编译器默认下的对齐方式,struct和class一致. 如果人工添加代码设置对齐方式,如下 #pargma pack (4) struct A { char name; double dHeight; int age; }; sizeof(A) = 1+3+8+4 = 16 首先#pa…

STM32使用串口1配合DMA接收不定长数据，减轻CPU载荷

STM32使用串口1配合DMA接收不定长数据,减轻CPU载荷 http://www.openedv.com/thread-63849-1-1.html 实现思路:采用STM32F103的串口1,并配置成空闲中断模式且使能DMA接收,并同时设置接收缓冲区和初始化DMA.那么初始化完成之后,当外部给单片机发送数据的时候,假设这帧数据长度是100个字节,那么在单片机接收到一个字节的时候并不会产生串口中断,而是DMA在后台把数据默默地搬运到你指定的缓冲区里面.当整帧数据发送完毕之后串口才会产生一次…

gpu显存（全局内存）在使用时数据对齐的问题

全局存储器,即普通的显存,整个网格中的随意线程都能读写全局存储器的任何位置. 存取延时为400-600 clock cycles 很easy成为性能瓶颈. 訪问显存时,读取和存储必须对齐,宽度为4Byte.假设没有正确的对齐,读写将被编译器拆分为多次操作,减少訪存性能. 多个warp的读写操作假设可以满足合并訪问,则多次訪存操作会被合并成一次完毕.合并訪问的条件,1.0和1.1的设备要求较严格,1.2及更高能力的设备上放宽了合并訪问的条件. 1.2及其更高能力的设备支持对8 bit.16 bi…