• 事情的经过是这种,博主在用C写一个简单的业务时使用递归,因为粗心而忘了写return。结果发现返回的结果依旧是正确的。经过半小时的反汇编调试。证明了我的猜想,如今在博客里分享。也是对C语言编译原理的一次加深理解。
  • 引子:
  • 首先我想以一道题目引例,比較能体现出问题。
例1:
#include <stdio.h>
/**
函数功能:用递归实现位运算加法
*/
int Add_Recursion(int a,int b)
{
int carry_num = 0, add_num = 0;
if (b == 0)
{
return a;
}
else
{
add_num = a^b;
carry_num = (a&b)<<1;
Add_Recursion(add_num, carry_num); }
}
int main()
{ int num = Add_Recursion(1, 1); printf("%d\n",num);
getchar();
}
  • 问题是。运行如上的程序,打印出来的数值是多少?
  • 大家可能会觉得这个非常的弱智,即使作为小公司的笔试题来说都登不上大雅之堂。



    ——————————–图1 例题1的运行结果———————

  • 答案是2,毫无疑问,仅仅是一个简单的递归而已。

    可是假设我把题目改一下

例2:
#include <stdio.h>
int changestack()
{
return 3;
}
/**
函数功能:用递归实现位运算加法
*/ int Add_Recursion(int a,int b)
{
int carry_num = 0, add_num = 0;
if (b == 0)
{
return a;
}
else
{
add_num = a^b;
carry_num = (a&b)<<1;
Add_Recursion(add_num, carry_num);
changestack(); }
} int main()
{
int num = Add_Recursion(1, 1);
printf("%d\n",num);
getchar();
}
  • 大家看看上边的程序。运行结果会是多少?

    可能有非常多朋友细心已经发现了猫腻。

    可能也有部分朋友会有些困惑,这个程序仅仅是在递归的实现函数后中加了一个无关紧要的函数调用,为什么会影响函数返回的结果呢。

    其实printf打印出来的结果不对。运行结果是3



    —————————-图2 例题2的运行结果————————-

  • 为什么会出现这个问题呢。实际上正常情况下的递归。

    在else语句里进行递归调用时。应当加上return。

    因为return的缺失,导致了函数返回值被changestack()函数篡改。从而在main函数中读到了错误的返回值。

else
{
add_num = a^b;
carry_num = (a&b)<<1;
return Add_Recursion(add_num, carry_num);
changestack(); }
  • 假设将上文的代码改正如上,那不会出现不论什么问题。

    (当然不会出错,此时有了return,return后边的changestack根本就不会有不论什么机会运行)

    如今来一步一步来分析发生错误的本质。

  • ——————–图三 例二函数的递归分析—————————

  • 我们分析上边代码的运行过程。首先在main函数中调用Add_Recursion(1,1),本意就是计算1+1的值,而且将函数返回值传递给printf打印出来。

    在递归调用Add_Recursion函数(简称add)计算1+1时,前两次递归调用因为不满足递归出口条件(进位加数carry_num为0)。会跳入else分支进行递归调用。

    直到第三次递归调用时因为carry_num为0。这时返回了累加结果。

  • 问题是仅仅有第三次的add递归调用进行了return,第一次和第二次在函数返回时,都没有return,而是在返回子层次递归后调用changestack()函数后返回调用自己的函数层级。

    在第一层递归调用返回给main的时候,add_recursion并没有return,而是在运行完changestack直接返回main函数,而此时main函数的printf在解析返回值时,实际上错误的解析了changestack的返回值。

    因此才出现1+1=3的错误

  • 综上分析发生这一切的原因,就是:

    函数运行结束返回时。会将返回值压栈(理论上如此,实际上编译器会优化,将返回值给eax寄存器过渡。VC就是使用的eax临时保存)。VC编译器解析函数返回值(整型)时,直接将eax的值读出当做返回值。



    ———————-图四 反汇编分析VC编译器对return的处理———-

  • 依据反汇编分析能够看到,VC编译器对changestack()中的return 3汇编的结果,也就是 mov eax,3。实际上就是把返回值赋予eax,由eax寄存器过渡给此函数的调用函数使用。

  • 我们在下图中能够看到main函数中将changestack()的返回值给num赋值的详细过程,也就是将eax的值返回给num的所在的内存地址。



    ——————————图五 函数返回值的“弹栈”细则——————————-

  • 这样一切就有了解释。

——————-图六 例题一为什么会碰巧正确的递归分析—————

  • 尽管第一题的结果尽管正确,printf在读取Add_Recursion返回值时。读取的不是第一次递归调用的结果,而是第三次递归调用return b的结果(第三次递归返回时,暂存在eax寄存器中)。而在之后的递归返回中,凑巧eax都没有被改变。

    因此这样使用递归(尽管没有在须要return的地方return)是能够得到正确结果。

    实际上我们能够用一条内联汇编代码验证我们的猜想是否正确。

    我们在递归调用的后边,使用内联汇编加上一条汇编代码改变eax的值。

——————————-图七 用内联汇编解读C语言的return本质—————————–

  • 我们在递归函数Add_Recursion的后边加了一条汇编代码,让函数结束时改变eax的值。能够看到。主函数中,将函数返回值误觉得了我们在汇编语言中设定的3.打印出了1+1=3这种谬论。

  • 实际上,我们在编译例题中的程序在编译时C编译器会提出警告

    warning C4715: “Add_Recursion”: 不是全部的控件路径都返回值

    有返回值的函数,不是全部的支路都会进行返回值,假设大家把博客中的程序在更加严格的C++编译器上编译会报错。

  • 这仅仅是一个非常easy的案例。或许我们会运气好实现函数的功能,可是在进行复杂情况的树状甚至图状递归中,假设不确定自己是否一定能得到终于结果,请务必将每一种情况都return返回值,这样来避免程序意外出错。

    C语言的灵活性应该给我们造福,而不应该给我们的程序提供不稳定的因素。

C语言中递归什么时候能够省略return引发的思考:通过内联汇编解读C语言函数return的本质的更多相关文章

  1. 在Visual C++中使用内联汇编

    一.内联汇编的优缺点 因为在Visual C++中使用内联汇编不需要额外的编译器和联接器,且可以处理Visual C++中不能处理的一些事情,而且可以使用在C/C++中的变量,所以非常方便.内联汇编主 ...

  2. 通过调用C语言的库函数与在C代码中使用内联汇编两种方式来使用同一个系统调用来分析系统调用的工作机制

    通过调用C语言的库函数与在C代码中使用内联汇编两种方式来使用同一个系统调用来分析系统调用的工作机制 前言说明 本篇为网易云课堂Linux内核分析课程的第四周作业,我将通过调用C语言的库函数与在C代码中 ...

  3. C语言的本质(32)——C语言与汇编之C语言内联汇编

    用C写程序比直接用汇编写程序更简洁,可读性更好,但效率可能不如汇编程序,因为C程序毕竟要经由编译器生成汇编代码,尽管现代编译器的优化已经做得很好了,但还是不如手写的汇编代码.另外,有些平台相关的指令必 ...

  4. Linux C中内联汇编的语法格式及使用方法(Inline Assembly in Linux C)【转】

    转自:http://www.linuxidc.com/Linux/2013-06/85221p3.htm 阅读Linux内核源码或对代码做性能优化时,经常会有在C语言中嵌入一段汇编代码的需求,这种嵌入 ...

  5. ARM嵌入式开发中的GCC内联汇编__asm__

    在针对ARM体系结构的编程中,一般很难直接使用C语言产生操作协处理器的相关代码,因此使用汇编语言来实现就成为了唯一的选择.但如果完全通过汇编代码实现,又会过于复杂.难以调试.因此,C语言内嵌汇编的方式 ...

  6. Linux 中 x86 的内联汇编

    工程中需要用到内联汇编,找到一篇不错的文章,趁机学习下. 原文地址:http://www.ibm.com/developerworks/cn/linux/sdk/assemble/inline/ 如果 ...

  7. 内联汇编中的asm和__asm__

    基本的内联汇编代码: asm格式: asm("assembly code"):   使用替换的关键字: 如果必须的话,可以改变用于标识内联汇编代码段的关键字asm.ANSI C规范 ...

  8. 【Linux学习笔记】Linux C中内联汇编的语法格式及使用方法(Inline Assembly in Linux C)

    http://blog.csdn.net/slvher/article/details/8864996 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm. ...

  9. VC内联汇编,引用程序中的变量

    int a=5; //变量a _asm { mov eax,a;       //将变量a的值放入寄存器eax add eax,eax;   //相当于a=a+a mov a,eax;      // ...

随机推荐

  1. HDU 4183

    给出一个有向图,以及src和dst.判断是否存在从src到dst的两条路径,使得除了src和dst外,没有其它点同时属于两条路径. 给每个点一个为1的点容量(src和dst为2),边的容量也是1,然后 ...

  2. 使用sklearn进行交叉验证

    模型评估方法 假如我们有一个带标签的数据集D,我们如何选择最优的模型? 衡量模型好坏的标准是看这个模型在新的数据集上面表现的如何,也就是看它的泛化误差.因为实际的数据没有标签,所以泛化误差是不可能直接 ...

  3. Linux知识(4)----文件系统结构

    Ubantu 14.04的文件系统结构如下图所示: 参考资料: 1.http://www.cnblogs.com/wen858636827/archive/2012/12/26/2834373.htm ...

  4. 在VIEW引入CSS、JS文件

    外联 CSS: <?= Html::cssFile('@web/css/ie5.css', ['condition' => 'IE 5']) ?> generates <!-- ...

  5. MySQL之char、varchar和text的设计

    最近有表结构设计中出现了varchar(10000)的设计引起了大家的讨论,我们下面就来分析分析. 首先我们先普及一下常识: 1.char(n)和varchar(n)中括号中n代表字符的个数,并不代表 ...

  6. jdbcTemplate异常:like模糊查询报错(Parameter index out of range (1 > number of parameters)

    http://cuisuqiang.iteye.com/blog/1480525   模糊查询like要这样写 注意Object参数和like语法   public static void main( ...

  7. 仿LOL项目开发第六天

    仿LOL项目开发第六天 by草帽 OK,因为更新模块已经处理好了,接着开始登陆的编写.那么我们就需要状态机的管理. 所谓状态机就是在哪个状态执行那个状态的代码逻辑: 那么我们开始编写GameState ...

  8. Jni本地多线程回调Java函数,env->findClass()失败。

    遇到的问题,Native层本地多线程回调Java函数时env->findClass()失败. 前面的代码是这样的在 JNI_OnLoad记录全局变量g_vm static JavaVM* g_v ...

  9. 进程控制块(PCB)结构

    一.进程控制块(PCB)结构 进程控制块(PCB)是系统为了管理进程设置的一个专门的数据结构.系统用它来记录进程的外部特征,描述进程的运动变化过程.同时,系统可以利用PCB来控制和管理进程,所以说,P ...

  10. delegate和event的区别 (zz)

    一. delegate C#代理实际上类似于C++中的函数指针,因为C#中不存在指针,所以用代理可以完成一些原来在C++中用函数指针完成的操作,例如传递一个类A的方法m给另一个类B的对象,使得类B的对 ...