C语言中可变参数函数实现原理

C函数调用的栈结构

可变参数函数的实现与函数调用的栈结构密切相关，正常情况下C的函数参数入栈规则为__stdcall, 它是从右到左的，即函数中的最右边的参数最先入栈。例如，对于函数：

  void fun(int a, int b, int c)

  {

        int d;

        ...

  }

其栈结构为

0x1ffc-->d

0x2000-->a

0x2004-->b

0x2008-->c

对于在32位系统的多数编译器，每个栈单元的大小都是sizeof(int), 而函数的每个参数都至少要占一个栈单元大小，如函数 void fun1(char a, int b, double c, short d) 对一个32的系统其栈的结构就是

0x1ffc-->a (4字节)（为了字对齐）

0x2000-->b (4字节)

0x2004-->c (8字节)

0x200c-->d (4字节)

因此，函数的所有参数是存储在线性连续的栈空间中的，基于这种存储结构，这样就可以从可变参数函数中必须有的第一个普通参数来寻址后续的所有可变参数的类型及其值。

先看看固定参数列表函数：

void fixed_args_func(int a, double b, char *c)

{

        printf("a = 0x%p\n", &a);

        printf("b = 0x%p\n", &b);

        printf("c = 0x%p\n", &c);

}

对于固定参数列表的函数，每个参数的名称、类型都是直接可见的，他们的地址也都是可以直接得到的，比如：通过&a我们可以得到a的地址，并通过函数原型声明了解到a是int类型的。

但是对于变长参数的函数，我们就没有这么顺利了。还好，按照C标准的说明，支持变长参数的函数在原型声明中，必须有至少一个最左固定参数(这一点与传统C有区别，传统C允许不带任何固定参数的纯变长参数函数)，这样我们可以得到其中固定参数的地址，但是依然无法从声明中得到其他变长参数的地址，比如：

void var_args_func(const char * fmt, ...)

{

    ... ...

}

这里我们只能得到fmt这固定参数的地址，仅从函数原型我们是无法确定"..."中有几个参数、参数都是什么类型的。回想一下函数传参的过程，无论"..."中有多少个参数、每个参数是什么类型的，它们都和固定参数的传参过程是一样的，简单来讲都是栈操作，而栈这个东西对我们是开放的。这样一来，一旦我们知道某函数帧的栈上的一个固定参数的位置，我们完全有可能推导出其他变长参数的位置。

我们先用上面的那个fixed_args_func函数确定一下入栈顺序。

int main()

{

    fixed_args_func(, 5.40, "hello world");

    return ;

}

a = 0x0022FF50

b = 0x0022FF54

c = 0x0022FF5C

从这个结果来看，显然参数是从右到左，逐一压入栈中的(栈的延伸方向是从高地址到低地址，栈底的占领着最高内存地址，先入栈的参数，其地理位置也就最高了)。

我们基本可以得出这样一个结论：

 c.addr = b.addr + x_sizeof(b);  /*注意:  x_sizeof !=sizeof */

 b.addr = a.addr + x_sizeof(a);

有了以上的"等式"，我们似乎可以推导出 void var_args_func(const char * fmt, ... ) 函数中，可变参数的位置了。起码第一个可变参数的位置应该是：first_vararg.addr = fmt.addr + x_sizeof(fmt); 根据这一结论我们试着实现一个支持可变参数的函数：

#include <stdarg.h>
#include <stdio.h>

void var_args_func(const char * fmt, ...)

{

    char    *ap;

    ap = ((char*)&fmt) + sizeof(fmt);

    printf("%d\n", *(int*)ap);  

    ap =  ap + sizeof(int);

    printf("%d\n", *(int*)ap);

    ap =  ap + sizeof(int);

    printf("%s\n", *((char**)ap));

}

int main()

{

    var_args_func("%d %d %s\n", , , "hello world");
　　 return 0;
}

期待输出结果:
4
5
hello world

先来解释一下这个程序。我们用ap获取第一个变参的地址，我们知道第一个变参是4，一个int 型，所以我们用(int*)ap以告诉编译器，以ap为首地址的那块内存我们要将之视为一个整型来使用，*(int*)ap获得该参数的值；接下来的变参是5，又一个int型，其地址是ap + sizeof(第一个变参)，也就是ap + sizeof(int)，同样我们使用*(int*)ap获得该参数的值；最后的一个参数是一个字符串，也就是char*，与前两个int型参数不同的是，经过ap + sizeof(int)后，ap指向栈上一个char*类型的内存块(我们暂且称之tmp_ptr, char *tmp_ptr)的首地址，即ap -> &tmp_ptr，而我们要输出的不是printf("%s\n", ap)，而是printf("%s\n", tmp_ptr); printf("%s\n", ap)是意图将ap所指的内存块作为字符串输出了，但是ap -> &tmp_ptr，tmp_ptr所占据的4个字节显然不是字符串，而是一个地址。如何让&tmp_ptr是char **类型的，我们将ap进行强制转换(char**)ap <=> &tmp_ptr，这样我们访问tmp_ptr只需要在(char**)ap前面加上一个*即可，即printf("%s\n", *(char**)ap);

一切似乎很完美，编译也很顺利通过，但运行上面的代码后，不但得不到预期的结果，反而整个编译器会强行关闭（大家可以尝试着运行一下），原来是ap指针在后来并没有按照预期的要求指向第二个变参数，即并没有指向5所在的首地址，而是指向了未知内存区域，所以编译器会强行关闭。其实错误开始于：ap = ap + sizeof(int);由于内存对齐，编译器在栈上压入参数时，不是一个紧挨着另一个的，编译器会根据变参的类型将其放到满足类型对齐的地址上的，这样栈上参数之间实际上可能会是有空隙的。（C语言内存对齐详解（1） C语言内存对齐详解（2） C语言内存对齐详解（3））所以此时的ap计算应该改为：ap = (char *)ap +sizeof(int) + __va_rounded_size(int);

改正后的代码如下：

#include<stdio.h>

#define __va_rounded_size(TYPE)  \

  (((sizeof (TYPE) + sizeof (int) - ) / sizeof (int)) * sizeof (int))

void var_args_func(const char * fmt, ...)

{

    char *ap;

    ap = ((char*)&fmt) + sizeof(fmt);

    printf("%d\n", *(int*)ap);  

    ap = (char *)ap + sizeof(int) + __va_rounded_size(int);

    printf("%d\n", *(int*)ap);

    ap = ap + sizeof(int) + __va_rounded_size(int);

    printf("%s\n", *((char**)ap));

}

int main()

{

    var_args_func("%d %d %s\n", , , "hello world");　

    return ;

}

var_args_func只是为了演示，并未根据fmt消息中的格式字符串来判断变参的个数和类型，而是直接在实现中写死了。

为了满足代码的可移植性，C标准库在stdarg.h中提供了诸多便利以供实现变长长度参数时使用。这里也列出一个简单的例子，看看利用标准库是如何支持变长参数的：

 #include <stdarg.h>#include <stdio.h>

 void std_vararg_func(const char *fmt, ...) {

         va_list ap;

         va_start(ap, fmt);

         printf("%d\n", va_arg(ap, int));

         printf("%f\n", va_arg(ap, double));

         printf("%s\n", va_arg(ap, char*));

         va_end(ap);

 }

 int main() {

         std_vararg_func("%d %f %s\n", , 5.4, "hello world");        return ;}

对比一下 std_vararg_func和var_args_func的实现，va_list似乎就是char*， va_start似乎就是 ((char*)&fmt) + sizeof(fmt)，va_arg似乎就是得到下一个参数的首地址。没错，多数平台下stdarg.h中va_list, va_start和var_arg的实现就是类似这样的。一般stdarg.h会包含很多宏，看起来比较复杂。

下面我们来探讨如何写一个简单的可变参数的C 函数.

使用可变参数应该有以下步骤:
1)首先在函数里定义一个va_list型的变量,这里是arg_ptr,这个变量是指向参数的指针.
2)然后用va_start宏初始化变量arg_ptr,这个宏的第二个参数是第一个可变参数的前一个参数,是一个固定的参数.
3)然后用va_arg返回可变的参数,并赋值给整数j. va_arg的第二个参数是你要返回的参数的类型,这里是int型.
4)最后用va_end宏结束可变参数的获取.然后你就可以在函数里使用第二个参数了.如果函数有多个可变参数的,依次调用va_arg获取各个参数.

在《C程序设计语言》中，Ritchie提供了一个简易版printf函数：

 #include<stdarg.h>

 void minprintf(char *fmt, ...)

 {

     va_list ap;

     char *p, *sval;

     int ival;

     double dval;

     va_start(ap, fmt);

     for (p = fmt; *p; p++) {

         if(*p != '%') {

             putchar(*p);

             continue;

         }

         switch(*++p) {

         case 'd':

             ival = va_arg(ap, int);

             printf("%d", ival);

             break;

         case 'f':

             dval = va_arg(ap, double);

             printf("%f", dval);

             break;

         case 's':

             for (sval = va_arg(ap, char *); *sval; sval++)

                 putchar(*sval);

             break;

         default:

             putchar(*p);

             break;

         }

     }

     va_end(ap);

 }

C语言中可变参数函数实现原理的更多相关文章

C语言可变参数函数实现原理
一.可变参数函数实现原理 C函数调用的栈结构: 可变参数函数的实现与函数调用的栈结构密切相关,正常情况下C的函数参数入栈规则为__stdcall, 它是从右到左的,即函数中的最右边的参数最先入栈. 本 ...
C语言中可变参数的函数（三个点，“...”）
C语言中可变参数的函数(三个点,“...”) 本文主要介绍va_start和va_end的使用及原理. 在以前的一篇帖子Format MessageBox 详解中曾使用到va_start和va_end ...
[11 Go语言基础-可变参数函数]
[11 Go语言基础-可变参数函数] 可变参数函数什么是可变参数函数可变参数函数是一种参数个数可变的函数. 语法如果函数最后一个参数被记作 ...T ,这时函数可以接受任意个 T 类型参数作为最 ...
【转】C/C++中可变参数函数的实现
转自:http://www.cnblogs.com/cylee025/archive/2011/05/23/2054792.html 在C语言的stdarg.h头文件中提供了三个函数va_start, ...
C/C++中可变参数函数的实现
在C语言的stdarg.h头文件中提供了三个函数va_start, va_end,va_arg和一个类型va_list.利用它们,我们可以很容易实现一个可变参数的函数.首先简单介绍一下这三个函数. 假 ...
C语言中可变参数的原理——printf()函数
函数原型: int printf(const char *format[,argument]...) 返回值: 成功则返回实际输出的字符数,失败返回-1. 函数说明: 使用过C语言的人所再熟悉不过 ...
C语言中可变参数的用法
原文地址: http://blog.csdn.net/wooin/archive/2006/04/29/697106.aspx 我们在C语言编程中会遇到一些参数个数可变的函数,例如printf() ...
C语言中可变参数的使用
在C语言程序编写中我们使用最多的函数一定包括printf以及很多类似的变形体.这个函数包含在C库函数中,定义为 int printf( const char* format, ...); 除了一个格式 ...
c 中可变参数的实现
我们在C语言编程中有时会遇到一些参数个数可变的函数,例如printf()函数,其函数原型为: 例一: int printf( const char* format, ... ...

随机推荐

【百度百科】对焦Focus
词语解释 duìjiāo [focusing] 指使用照相机时调整好焦点距离对焦也叫对光.聚焦.通过照相机对焦机构变动物距和相距的位置,使被拍物成像清晰的过程就是对焦. 自动对焦传统相机,采取一种 ...
JAVA内存机制
Java程序运行时,数据会分区存放,JavaStack(Java栈). heap(堆).method(方法区). 一.JVM内存模型 1.Java栈Java栈的区域很小,只有1M,特点是存取速度很快, ...
JavaWeb---总结(四)Tomcat服务器学习和使用(二)
一.打包JavaWeb应用在Java中,使用"jar"命令来对将JavaWeb应用打包成一个War包,jar命令的用法如下: 范例:将JavaWebDemoProject这个Ja ...
GMap.NET使用一
https://greatmaps.codeplex.com/releases/view/20235 从上面网站下载需要的组件dll,也可以下载源码研究,解压后有两个文件夹,如图1所示,根据不同的fr ...
在浏览器输入 URL 后会发生什么？超级详细介绍
一个古老的面试问题:当你在浏览器中输入whosmall.com并且按下回车之后发生了什么? 不过我们不再局限于平常的回答,而是想办法回答地尽可能具体,不遗漏任何细节. 这将是一个协作的过程,所以深入挖 ...
磁盘里的B,MB,GB,TB储存单位是怎么换算大小的?
磁盘里的B,MB,GB,TB是怎么换算大小的? 1TB=1024GB1GB=1024MB1MB=1024KB1KB=1024Byte 注:Byte就是B也就是字节KB是千字节MB是兆GB是吉字节即千 ...
运算符++，--的使用及 while循环测试的用处
前++与后++的区别: b=3+(++a);//a=a+1;b=3+a; b=3+(a++);//b=3+a;a=a+1; while (true)( 循环语句,可以实现程序的多次测试) { Cons ...
非阻塞socket学习，select基本用法
server #include <stdio.h> #include <winsock2.h> #include <iostream> #pragma commen ...
第一章基础设施，1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的(作者：蔡华)
1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的前言在今年的双11中,双11天猫狂欢夜的直播成为一大亮点. 根据官方披露数据,直播总观看人数超4257万,同时观看人数峰值达5 ...
Yoshua Bengio 2016年5月11日在Twitter Boston的演讲PPT
Yoshua Bengio最新演讲:Attention 让深度学习取得巨大成功(46ppt) Yoshua Bengio,电脑科学家,毕业于麦吉尔大学,在MIT和AT&T贝尔实验室做过博士后研 ...

C语言中可变参数函数实现原理

C语言中可变参数函数实现原理的更多相关文章

随机推荐

热门专题