转自:http://blog.csdn.net/huqinwei987/article/details/23597091

有些基础知识快淡忘了,所以有必要复习一遍,在不借助课本死知识的前提下做些推理判断,温故知新。

1.联合体union的基本特性——和struct的同与不同

union,中文名“联合体、共用体”,在某种程度上类似结构体struct的一种数据结构,共用体(union)和结构体(struct)同样可以包含很多种数据类型和变量。

不过区别也挺明显:

结构体(struct)中所有变量是“共存”的——优点是“有容乃大”,全面;缺点是struct内存空间的分配是粗放的,不管用不用,全分配。

而联合体(union)中是各变量是“互斥”的——缺点就是不够“包容”;但优点是内存使用更为精细灵活,也节省了内存空间。

2.双刃剑——多种访问内存途径共存

一个例子了然:

  1. //example
  2. #include<stdio.h>
  3. union var{
  4. long int l;
  5. int i;
  6. };
  7. main(){
  8. union var v;
  9. v.l = 5;
  10. printf("v.l is %d\n",v.i);
  11. v.i = 6;
  12. printf("now v.l is %ld! the address is %p\n",v.l,&v.l);
  13. printf("now v.i is %d! the address is %p\n",v.i,&v.i);
  14. }
  15. 结果:
  16. v.l is 5
  17. now v.l is 6! the address is 0xbfad1e2c
  18. now v.i is 6! the address is 0xbfad1e2c

所以说,管union的叫共用体还真是贴切——完全就是共用一个内存首地址,并且各种变量名都可以同时使用,操作也是共同生效。如此多的access内存手段,确实好用,不过这些“手段”之间却没法互相屏蔽——就好像数组+下标和指针+偏移一样。

上例中我改了v.i的值,结果v.l也能读取,那么也许我还以为v.l是我想要的值呢,因为上边提到了union的内存首地址肯定是相同的,那么还有一种情况和上边类似:

一个int数组变量a,一个long int(32位机中,long int占4字节,与int相同)变量b,我即使没给int变量b赋值,因为数据类型相同,我使用int变量b也完全会拿出int数组a中的a[0]来,一些时候一不小心用上,还以为用的就是变量b呢~

这种逻辑上的错误是很难找出来的(只有当数据类型相去甚远的时候稍好,出个乱码什么的很容易发现错误)。

PS:感谢热心网友的提醒“在union定义结束时加分号”,其实是可以不加的,因为他不在主函数内,不是执行的语句,如果是主函数内声明的union就必须加分号了,在主函数内不加分号就涉及到基础常识了——没有分号隔开怎能叫一句。

3.联合体union和大小端(big-endian、little-endian):

  1. #include<stdio.h>
  2. union var{
  3. char c[4];
  4. int i;
  5. };
  6. int main(){
  7. union var data;
  8. data.c[0] = 0x04;//因为是char类型,数字不要太大,算算ascii的范围~
  9. data.c[1] = 0x03;//写成16进制为了方便直接打印内存中的值对比
  10. data.c[2] = 0x02;
  11. data.c[3] = 0x11;
  12. //数组中下标低的,地址也低,按地址从低到高,内存内容依次为:04,03,02,11。总共四字节!
  13. //而把四个字节作为一个整体(不分类型,直接打印十六进制),应该从内存高地址到低地址看,0x11020304,低位04放在低地址上。
  14. printf("%x\n",data.i);
  15. }

结果:
11020304
证明我的32位linux是小端(little-endian)

4.联合体union所占内存空间大小:

前边说了,首先,union的首地址是固定的,那么,union到底总共有多大?根据一些小常识,做个不严谨不高深的基础版验证吧。

根据:分配栈空间的时候内存地址基本上是连续的,至少同类型能保证在一起,连续就说明,我如果弄三个结构体出来,他们三个地址应该连着,看一下三个地址的间隔就知道了。

  1. #include<stdio.h>
  2. union sizeTest{
  3. int a;
  4. double b;
  5. };
  6. main(){
  7. union sizeTest unionA;
  8. union sizeTest unionB;
  9. union sizeTest unionC;
  10. printf("the initial address of unionA is %p\n",&unionA);
  11. printf("the initial address of unionB is %p\n",&unionB);
  12. printf("the initial address of unionC is %p\n",&unionC);
  13. }

打印,可以看到结果:

the initial address of unionA is 0xbf9b8df8
the initial address of unionB is 0xbf9b8e00
the initial address of unionC is 0xbf9b8e08

很容易看出,8,0,8,这间隔是8字节,按double走的。

怕不保险,再改一下,把int改成数组,其他不变:

  1. union sizeTest{
  2. int a[10];
  3. double b;
  4. };

打印

the initial address of unionA is 0xbfbb7738
the initial address of unionB is 0xbfbb7760
the initial address of unionC is 0xbfbb7788

88-60=28
60-38=28
算错了?我说的可是16进制0x。那么0x28就是40个字节,正好是数组a的大小。

似乎忘了一个功能——sizeof()

用sizeof直接看,就知道union的大小了

  1. printf("the sizeof   of unionA is %d\n",sizeof(unionA));
  2. printf("the sizeof   of unionB is %d\n",sizeof(unionB));
  3. printf("the sizeof   of unionC is %d\n",sizeof(unionC));
  4. printf("the sizeof   of union is %d\n",sizeof(union sizeTest));

5.联合体union适用场合:

有了前边那个验证,基本可以确认,union的内存是照着里边占地儿最大的那个变量分的。

也就可以大胆的推测一下,这种union的使用场合,是各数据类型各变量占用空间差不多并且对各变量同时使用要求不高的场合(单从内存使用上,我觉得没错)。

像上边做的第二个测试,一个数组(或者更大的数组int a[100]),和一个或者几个小变量写在一个union里,实在没什么必要,节省的空间太有限了,还增加了一些风险(最少有前边提到的逻辑上的风险)。所以,从内存占用分析,这种情况不如直接struct。

不过话说回来,某些情况下虽然不是很节约内存空间,但是union的复用性优势依然存在啊,比如方便多命名,这种“二义性”,从某些方面也可能是优势。这种方法还有个好处,就是某些寄存器或通道大小有限制的情况下,可以分多次搬运。

6.本质&进阶:

根据union固定首地址union按最大需求开辟一段内存空间两个特征,可以发现,所有表面的定义都是虚的,所谓联合体union,就是在内存给你划了一个足够用的空间,至于你怎么玩~它不管~!(何止是union和struct,C不就是玩地址么,所以使用C灵活,也容易犯错)

没错,union的成员变量是相当于开辟了几个接口(即union包含的变量)!但是,没开辟就不能用了?当然也能用!

写个小测试:

  1. #include<stdio.h>
  2. union u{
  3. int i;
  4. double d;//这个union有8字节大小
  5. };
  6. main(){
  7. union u uu;
  8. uu.i = 10;
  9. printf("%d\n",uu.i);
  10. char * c;
  11. c = (char *)&uu;//把union的首地址赋值、强转成char类型
  12. c[0] = 'a';
  13. c[1] = 'b';
  14. c[2] = 'c';
  15. c[3] = '\0';
  16. c[4] = 'd';
  17. c[5] = 'e';
  18. //最多能到c[7]
  19. printf("%s\n",c);//利用结束符'\0'打印字符串"abc"
  20. printf("%c %c %c %c %c %c\n",c[0],c[1],c[2],c[3],c[4],c[5]);
  21. }

一个例子了然,我的结构体只定义了int和double“接口”,只要我获得地址,往里边扔什么数据谁管得到?这就是C语言的强大,这就是union的本质——只管开辟一段空间。

有些东西,熟悉编译原理和编译器工作过程的话,解决会更容易点,虽然我现在这方面技能不太强,不过一般问题也足够分析了。

====================================================================================================================================

补充:

 

补充1:

解决一下捧场网友的困惑。

关于“有名”与“无名”联合体在结构体内所占空间的问题,其实这和是不是结构体无关,只和“有名”、“无名”有关,而且有名无名也是表象,其实是声明类型与定义变量的区别,看例子,直接打印,

 

  1. #include <stdio.h>
  2. struct s1{
  3. union u{
  4. int i;
  5. };
  6. struct ss1{
  7. int i;
  8. };
  9. };
  10. struct s2{
  11. union{
  12. int i;
  13. };
  14. struct{
  15. int i;
  16. };
  17. };
  18. struct s3{//the same to s2
  19. union su3{
  20. int i;
  21. }su33;
  22. struct ss3{
  23. int i;
  24. }ss33;
  25. };
  26. union su4{
  27. int i;
  28. };
  29. struct ss4{
  30. int i;
  31. };
  32. struct s4{//the same to s3
  33. union su4 su44;
  34. struct ss4 ss44;
  35. };
  36. struct s5{//the same to s1
  37. union su4;
  38. struct ss4;
  39. };
  40. struct s6{//the same to s1
  41. union{
  42. int;
  43. };
  44. struct{
  45. int;
  46. };
  47. };
  48. main(){
  49. struct s1 sVal1;
  50. struct s2 sVal2;
  51. struct s3 sVal3;
  52. struct s4 sVal4;
  53. struct s5 sVal5;
  54. struct s6 sVal6;
  55. printf("sVal1's size:%d\n",sizeof(sVal1));
  56. printf("sVal1:%p\t%d\n",&sVal1);
  57. printf("sVal2's size:%d\n",sizeof(sVal2));
  58. printf("sVal2:%p\t%d\n",&sVal2);
  59. printf("sVal3's size:%d\n",sizeof(sVal3));
  60. printf("sVal3:%p\t%d\n",&sVal3);
  61. printf("sVal4's size:%d\n",sizeof(sVal4));
  62. printf("sVal4:%p\t%d\n",&sVal4);
  63. printf("sVal5's size:%d\n",sizeof(sVal5));
  64. printf("sVal5:%p\t%d\n",&sVal5);
  65. printf("sVal5's size:%d\n",sizeof(sVal5));
  66. printf("sVal5:%p\t%d\n",&sVal5);
  67. }

地址供参考,主要看size,分别为:

0,8,8,8,0,0

s1只有类型,没有变量,没有变量自然就没有空间(s5同)。

类型就是类型,和是不是结构体、联合体无关的,你的“int i;”中i不就是个变量吗?如果换成int;结果相同(这就是s6)。

 

s4和s5的做法能帮助排除干扰,将子结构体与联合体声明在外,内部直接引用,4是定义了变量,5什么都没做。

 

另外,这种做法编译的时候GCC会给你在相应的行做出提示“union_with_name.c:49: 警告:没有声明任何东西”

========================================================================================================================================================================================================================================================================

以上仅属于个人心得和推测,重点在于学习思维和推理验证过程,不保证正确性与权威性。有兴趣讨论或者有发现错误的,欢迎留言交流指正。

觉得好的,欢迎转载并注明出处。

http://blog.csdn.net/huqinwei987/article/details/23597091

本人博客会根据个人经验升级情况随时补充修改。

联合体(union)的使用方法及其本质的更多相关文章

  1. C语言联合体(union)的使用方法及其本质-union

    转载自:https://blog.csdn.net/si_zhou_qun_84342712/article/details/53187106 1.联合体union的基本特性——和struct的同与不 ...

  2. 联合体union用在何处?

    程序设计刚開始学习的人在学习时,总想问:"这个东东有什么用?"于是,在建设有关的教学资源时,也便总从这个角度,试图给出一些案例,这是一个将刚開始学习的人作为教学目标人群的人该干的事 ...

  3. 联合体union和大小端(big-endian、little-endian)

    1.联合体union的基本特性——和struct的同与不同 union,中文名“联合体.共用体”,在某种程度上类似结构体struct的一种数据结构,共用体(union)和结构体(struct)同样可以 ...

  4. C#扫盲之:带你掌握C#的扩展方法、以及探讨扩展方法的本质、注意事项

    1.为什么需要扩展方法 .NET3.5给我们提供了扩展方法的概念,它的功能是在不修改要添加类型的原有结构时,允许你为类或结构添加新方法. 思考:那么究竟为什么需要扩展方法呢,为什么不直接修改原有类型呢 ...

  5. Linq中Union与Contact方法用法对比

    文章一开始,我们来看看下面这个简单的实例. 代码片段1: int[] ints1 = { 2, 4, 9, 3, 0, 5, 1, 7 }; int[] ints2 = { 1, 3, 6, 4, 4 ...

  6. 网络工程 POST与GET请求方法的本质区别

    POST与GET请求方法的本质区别: 第一:GET用于信息获取,它是安全的(这里安全的含义是指非修改信息),而POST是用于修改服务器上资源的请求 第二:GET请求的数据会附在URL之后,而POST把 ...

  7. 结构体struct、联合体union、枚举类型enum

    1.c语言中的类型 1)内置类型——char,short,int,float,double: 2)用户自定义类型(UDT)——struct结构体,union联合体,enum枚举类型 2.内存对齐 2. ...

  8. 联合体union的详解

    1.概述 联合体union的定义方式与结构体一样,但是二者有根本区别. 在结构中各成员有各自的内存空间,一个结构变量的总长度是各成员长度之和.而在“联合”中,各成员共享一段内存空间,一个联合变量的长度 ...

  9. C语言中的联合体union所占内存方式

     当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union).在C Programming Language 一书中对于联合体是这么描述的:      1)联合体是一个结构:    ...

随机推荐

  1. 配置OWASP的ModSecurity规则

    1.下载OWASP的ModSecurity规则 cd /etc/httpd git clone https://github.com/SpiderLabs/owasp-modsecurity-crs. ...

  2. Extjs 知识体系1-dom操作

    操作dom 主要是Ext.element,主要是简单的操作 Ext.dom.CompositeElement // 操作dom集合 ps:Extjs 使用字面量{} 形式,不支持链式操作 一.获取元素 ...

  3. 如何合并多个PPT

    事情的起因大概是这样的: 于是我接收了文件 15个ppt,手动合并,我脑子有病吗,作为一个程序员,最基本的修养之一就是:超过三分钟的工作全部给电脑. 于是乎找到了pptjoin(一听名字就知道干嘛的) ...

  4. <<< 入侵网站思路

    思路: 以下是入侵网站常用方法: 1.上传漏洞 如果看到:选择你要上传的文件 [重新上传]或者出现“请登陆后使用”,80%就有漏洞了! 有时上传不一定会成功,这是因为Cookies不一样.我们就要用W ...

  5. XmlSerializer 对象的Xml序列化和反序列化

    http://www.cnblogs.com/yukaizhao/archive/2011/07/22/xml-serialization.html 这篇随笔对应的.Net命名空间是System.Xm ...

  6. ppt2013技术整理

    1. 显示选择窗格 便于选择该页的所有元素.分组.隐藏与显示等. 位于:开始-编辑-选择-选择窗格 2. 显示动画窗格 便于调节页面中元素的动画状态. 位于:动画-高级动画-动画窗格 3. 绑定动画触 ...

  7. 面试题目——《CC150》Java

    package cc150.java; import java.util.Iterator; public class CircularArray { public static void main( ...

  8. ecshop 实现购物车退出不清空

    ecshop模板在使用过程中会遇到会员退出再登陆时购物车里面的商品会被清空掉的,通过ecshop开发中心的技术,整理的文档,对程序做简单修改即可实现会员退出不清空购物车 ECShop版本:V2.7.3 ...

  9. javascript parseJSON

    解析json: 前台和后台做ajax交互,后台返回的json字符串,我之前都是通过eval来解析,后来慢慢的知道eval这货是魔鬼,eval要尽量避免,是出于安全考虑,因为eval过于强大,他可以把s ...

  10. Java总结篇系列:Java多线程(一)

    多线程作为Java中很重要的一个知识点,在此还是有必要总结一下的. 一.线程的生命周期及五种基本状态 关于Java中线程的生命周期,首先看一下下面这张较为经典的图: 上图中基本上囊括了Java中多线程 ...