关于C++字节对齐问题

关于C/C++的字节对齐

这两天写解析SWF文件的程序,在结构体指针和从文件里读出来的进行转换的时候遇到一些问题,就是有一个struct A,比如:

struct A

{

char flag;

int length;

int id;

....

};

然后一个飘逸的 struct A *a = (struct A*)buffer;   // 世界一下清静咯

可惜在输出a中的成员的时候却发现老是不对,百思不得起解。今晚一想,可能是因为C++的字节对齐问题,所以直接就百度了一些

C++的字节对齐。看到以下这篇文章说的挺清晰的,就转了过来。

________________________________________________________________________________________________________

关于C/C++的字节对齐

近期研究C++的数据类型和数据大小时发现,字节对齐实际上是一个C/C++程序猿无法忽视的一个问题.所以进行了初步的研究.

1.为什么会出现内存对齐问题-从x86 CPU架构说起

相信绝大多数计算机系和软件学院的学生都学过计算机组成原理这门基础课程,所以不作入门引导了,没有相关背景的能够补补相关课程资料.常有人问我,既然是按字节寻址方式,为何会出现字节对齐问题呢?难道是内存不是连续的吗?

这个问题实际上和CPU与内存的连接方式有关,我们知道CPU会通过地址总线Address BUS与CPU连接用于寻址,用Data Bus数据总线连接用于获取数据,而内存一般是RAM构成的复杂阵列。



对于这个RAM阵列(实际内存可能更复杂,可是原理类似), 前16个内存地址排列相应内存单元关系例如以下:





对比上图,是不是发现,对于每一个内存操作周期,每一个地址实际上能够读取4个bytes的数据呢,那么如果你有一个int型的数据存储在地址1或者2或者 3,那么,是不是一个CPU内存时钟周期不够取出这个数据呢?这样是不是效率会非常低下?这也就是为什么我们须要内存对齐了,尽管现代CPU和编译器已经对 此做了非常多优化,可是C/C++因为特殊性,程序猿必须了解这个细节.

2.C/C++内存对齐的方式

C/C++中的结构/类的成员变量在对齐在内存中的排列是与它们摆放的先后顺序相关的,先看看以下的结构

1 struct malign_a

2 {

3    char a;

4    short b;

5    char c;

6    int d;

7 };

这个结构的sizeof(malign_a)是多少呢?1+2+1+4 =8?吗?这个实际上不正确,那么,怎样对齐的呢?

因为char是1个byte,所以无论他在什么位置,都能够用一个内存周期读出数据,short是半个字也就是2 bytes,这个时候假如它的地址是某个边界位置上,那么,也须要两个内存周期来读取,以此类推.所以,内存对齐就是增加填充padding无意义的数据 来保证某个数据位于一个能够通过最少内存周期的位置,比方double型仅仅有地址位于%4等于0的位置,才干保证2个周期读出.

同一时候对于每一个详细平台,不同的编译器有不同的指定的对齐模式,比方C/C++能够通过

1 #pragma pack(n) //n为1,2,4,8,16等

来指定对齐.当然,一般x86 32位机器下,都是默认4字节对齐的.这个n也称为对齐模数.

对齐策略例如以下:

1.结构体成员对齐:按某成员数据本身大小以及指定大小中较小者对齐

2.结构体总体对齐:按全部成员中最大者和对齐模数中较小者对齐

所以上述结构体按默认对齐方式例如以下:

1.a是char类型,能够在任何位置,位于位置0

2.b是short类型,2比默认的4小,所以按2字节对齐,所以在a后面填充1个字节,b必须位于位置2,占两个字节

3.c是char类型,位于位置4

4.d是int类型,4<=4,所以按4字节对齐,须要在c后面填充3个字节,位置为8

5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为12



再把原来的结构体成员位置修改一下:

1 struct malign_b

2 {

3    char a;

4    char c;

5    short b;

6    int d;

7 };

这个结构的大小为8,对齐步骤例如以下:

1.a是char类型,能够在任何位置,位于位置0

2.c是char类型,位于位置1

3.b是short类型,2比默认的4小,所以按2字节对齐,这时候恰好位于位置2

4.d是int类型,4 5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为8



最后为了加深理解,我们来看看以下这个结构按对齐模数2对齐时候的memory layout

01 #pragma pack(push)

02 #pragma pack(2)

03 struct malign_b

04 {

05    char a;

06    int d;

07    char c;

08    short b;

09 };

10 #pragma pack(pop)

它的大小为10,当指定为对齐模数2时候

1.因为a是char,1<2,位于位置0

2.因为d是int,4>2,所以按2字节对齐,所以必须在a后面填充一个字节,位于位置2,

3.c是char,位置为6

4.b是short,所以必须在c后面填充一个字节,位置为8

5.最大的是4,所以按2对齐,上述结果事实上已经总体是按2对齐,所以总数为10

我相信通过以上样例,应该能够熟悉字节对齐过程了,假设有不妥之处,敬请留言指出,谢谢.

原文链接:http://www.cnblogs.com/shihao/archive/2012/01/18/2325580.html

C++字节对齐问题的更多相关文章

  1. C语言:内存字节对齐详解[转载]

    一.什么是对齐,以及为什么要对齐: 1. 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问, ...

  2. 字节对齐导致的iOS EXC_ARM_DA_ALIGN崩溃

    本文原链接: http://www.cnblogs.com/zouzf/p/4455167.html 先看一下这个链接:http://www.cnblogs.com/ren54/archive/201 ...

  3. ACE的CDR中的字节对齐问题

    大家应该都知道计算机中间都有字节对齐问题.CPU访问内存的时候,如果从特定的地址开始访问一般可以加快速度,比如在32位机器上,如果一个32位的整数被放在能被32模除等于0的地址上,只需要访问一次,而如 ...

  4. ARM字节对齐问题详解

    一.什么是字节对齐,为什么要对齐? 现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这 ...

  5. C语言之字节对齐

    在C语言编程中,有时为了达到减少运行的时间的目的,需要浪费一些空间:而有时为了节省空间,使它的运行时间增长.而字节对齐则是为了访问效率,用空间换取时间. 要掌握字节对齐,首先得明确一下四个概念: 1. ...

  6. C ~ C语言字节对齐

    1. 什么是对齐? 现代计算机中内存空间都是按照字节(byte)划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型 ...

  7. C语言的struct/union字节对齐

    C语言的一大优势就是对内存空间的控制,当然,一般情况下对于开发人员来说都是透明的.看一个始终困扰初学者的问题:字节对齐! 先看四个重要的基本概念:1.数据类型自身的对齐值:对于char型数据,其自身对 ...

  8. C语言深入学习系列 - 字节对齐&内存管理

    用C语言写程序时需要知道是大端模式还是小端模式. 所谓的大端模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中:所谓的小端模式,是指数据的低位保存在内存的低地址中,而数据的高 ...

  9. c++内存中字节对齐问题详解

    一.什么是字节对齐,为什么要对齐?    现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址 ...

随机推荐

  1. 嵌入式 fork与vfork的区别

    fork()与vfock()都是创建一个进程,那他们有什么区别呢?总结有以下三点区别: 1.  fork  ():子进程拷贝父进程的数据段,代码段     vfork ( ):子进程与父进程共享数据段 ...

  2. XSS 前端防火墙(1):内联事件拦截

    关于 XSS 怎样形成.如何注入.能做什么.如何防范,前人已有无数的探讨,这里就不再累述了.本文介绍的则是另一种预防思路. 几乎每篇谈论 XSS 的文章,结尾多少都会提到如何防止,然而大多万变不离其宗 ...

  3. SQL语句构建器类

    问题 Java程序员面对的最痛苦的事情之一就是在Java代码中嵌入SQL语句.这么来做通常是由于SQL语句需要动态来生成-否则可以将它们放到外部文件或者存储过程中.正如你已经看到的那样,MyBatis ...

  4. openGl从零开始之添加颜色

    OpenGL 支持两种颜色模式:一种是 RGBA模式,一种是 颜色索引模式.无论哪种颜色模式,计算机都必须为每一个像素保存一些数据,即通过每一个像素的颜色,来改变整体图形的颜色.不同的是, RGBA ...

  5. C语言实现strlen

    strlen: #ifndef STRLEN_H #define STRLEN_H #include <stdio.h> // 参考微软的写法 int cat_strlen(const c ...

  6. 初识---Qt解析XML文件(QDomDocument)

    关于XML及其使用场景不在此多做介绍,今天主要介绍Qt中对于XML的解析.QtXml模块提供了一个读写XML文件的流,解析方法包含DOM和SAX,两者的区别是什么呢?  DOM(Document Ob ...

  7. ps闪闪发光的字 教程+自我练习

    本教程的文字效果非常经典.不仅是效果出色,创作思路及制作手法都堪称完美.作者并没有直接使用纹理素材,纹理部分都是用滤镜来完成.这需要很强的综合能力,非常值得学习和借鉴.最终效果 我的: 1.创建一个新 ...

  8. struts2传递List对象(复合对象)

    1.前台jsp界面: <%@ page language="java" contentType="text/html; charset=utf-8" pa ...

  9. Debian openvpn 配置

    1.安装openvpn 和 iptables -- Debain 可以使用命令行`apt-get install openvpn iptables` 2.配置服务器 -- ```shell cp -R ...

  10. 基于Linux2.6内核的加密容器法保护文件方法

            本文出自 "李晨光原创技术博客" 博客,谢绝转载!