C/C++中手动获取调用堆栈【转】
转自:http://blog.csdn.net/kevinlynx/article/details/39269507
版权声明:本文为博主原创文章,未经博主允许不得转载。
当我们的程序core掉之后,如果能获取到core时的函数调用堆栈将非常有利于定位问题。在Windows下可以使用SEH机制;在Linux下通过gdb使用coredump文件即可。
但有时候由于某些错误导致堆栈被破坏,发生拿不到调用堆栈的情况。
一些基础预备知识本文不再详述,可以参考以下文章:
需要知道的信息:
- 函数调用对应的
call指令本质上是先压入下一条指令的地址到堆栈,然后跳转到目标函数地址 - 函数返回指令
ret则是从堆栈取出一个地址,然后跳转到该地址 - EBP寄存器始终指向当前执行函数相关信息(局部变量)所在栈中的位置,ESP则始终指向栈顶
- 每一个函数入口都会保存调用者的EBP值,在出口处都会重设EBP值,从而实现函数调用的现场保存及现场恢复
- 64位机器增加了不少寄存器,从而使得函数调用的参数大部分时候可以通过寄存器传递;同时寄存器名字发生改变,例如EBP变为RBP
在函数调用中堆栈的情况可用下图说明:

将代码对应起来:
- void g() {
- int *p = 0;
- long a = 0x1234;
- printf("%p %x\n", &a, a);
- printf("%p %x\n", &p, p);
- f();
- *p = 1;
- }
- void b(int argc, char **argv) {
- printf("%p %p\n", &argc, &argv);
- g();
- }
- int main(int argc, char **argv) {
- b(argc, argv);
- return 0;
- }
在函数g()中断点,看看堆栈中的内容(64位机器):
- (gdb) p $rbp
- $2 = (void *) 0x7fffffffe370
- (gdb) p &p
- $3 = (int **) 0x7fffffffe368
- (gdb) p $rsp
- $4 = (void *) 0x7fffffffe360
- (gdb) x/8ag $rbp-16
- 0x7fffffffe360: 0x1234 0x0
- 0x7fffffffe370: 0x7fffffffe390 0x400631 <b(int, char**)+43>
- 0x7fffffffe380: 0x7fffffffe498 0x1a561cbc0
- 0x7fffffffe390: 0x7fffffffe3b0 0x40064f <main(int, char**)+27>
对应的堆栈图:

可以看看例子中0x400631 <b(int, char**)+43>和0x40064f <main(int, char**)+27>中的代码:
- (gdb) disassemble 0x400631
- ...
- 0x0000000000400627 <b(int, char**)+33>: callq 0x400468 <printf@plt>
- 0x000000000040062c <b(int, char**)+38>: callq 0x4005ae <g()>
- 0x0000000000400631 <b(int, char**)+43>: leaveq # call的下一条指令
- ...
- (gdb) disassemble 0x40064f
- ...
- 0x000000000040063f <main(int, char**)+11>: mov %rsi,-0x10(%rbp)
- 0x0000000000400643 <main(int, char**)+15>: mov -0x10(%rbp),%rsi
- 0x0000000000400647 <main(int, char**)+19>: mov -0x4(%rbp),%edi
- 0x000000000040064a <main(int, char**)+22>: callq 0x400606 <b(int, char**)>
- 0x000000000040064f <main(int, char**)+27>: mov $0x0,%eax # call的下一条指令
- ...
顺带一提,每个函数入口和出口,对应的设置RBP代码为:
- (gdb) disassemble g
- ...
- 0x00000000004005ae <g()+0>: push %rbp # 保存调用者的RBP到堆栈
- 0x00000000004005af <g()+1>: mov %rsp,%rbp # 设置自己的RBP
- ...
- 0x0000000000400603 <g()+85>: leaveq # 等同于:movq %rbp, %rsp
- # popq %rbp
- 0x0000000000400604 <g()+86>: retq
由以上可见,通过当前的RSP或RBP就可以找到调用堆栈中所有函数的RBP;找到了RBP就可以找到函数地址。因为,任何时候的RBP指向的堆栈位置就是上一个函数的RBP;而任何时候RBP所在堆栈中的前一个位置就是函数返回地址。
由此我们可以自己构建一个导致gdb无法取得调用堆栈的例子:
- void f() {
- long *p = 0;
- p = (long*) (&p + 1); // 取得g()的RBP
- *p = 0; // 破坏g()的RBP
- }
- void g() {
- int *p = 0;
- long a = 0x1234;
- printf("%p %x\n", &a, a);
- printf("%p %x\n", &p, p);
- f();
- *p = 1; // 写0地址导致一次core
- }
- void b(int argc, char **argv) {
- printf("%p %p\n", &argc, &argv);
- g();
- }
- int main(int argc, char **argv) {
- b(argc, argv);
- return 0;
- }
使用gdb运行该程序:
- Program received signal SIGSEGV, Segmentation fault.
- g () at ebp.c:37
- 37 *p = 1;
- (gdb) bt
- Cannot access memory at address 0x8
- (gdb) p $rbp
- $1 = (void *) 0x0
bt无法获取堆栈,在函数g()中RBP被改写为0,gdb从0偏移一个地址长度即0x8,尝试从0x8内存位置获取函数地址,然后提示Cannot access memory at address 0x8。
RBP出现了问题,我们就可以通过RSP来手动获取调用堆栈。因为RSP是不会被破坏的,要通过RSP获取调用堆栈则需要偏移一些局部变量所占的空间:
- (gdb) p $rsp
- $2 = (void *) 0x7fffffffe360
- (gdb) x/8ag $rsp+16 # g()中局部变量占16字节
- 0x7fffffffe370: 0x7fffffffe390 0x400631 <b(int, char**)+43>
- 0x7fffffffe380: 0x7fffffffe498 0x1a561cbc0
- 0x7fffffffe390: 0x7fffffffe3b0 0x40064f <main(int, char**)+27>
- 0x7fffffffe3a0: 0x7fffffffe498 0x100000000
基于以上就可以手工找到调用堆栈:
- g()
- 0x400631 <b(int, char**)+43>
- 0x40064f <main(int, char**)+27>
上面的例子本质上也是破坏堆栈,并且仅仅破坏了保存了的RBP。在实际情况中,堆栈可能会被破坏得更多,则可能导致手动定位也较困难。
堆栈被破坏还可能导致更多的问题,例如覆盖了函数返回地址,则会导致RIP错误;例如堆栈的不平衡。导致堆栈被破坏的原因也有很多,例如局部数组越界;delete/free栈上对象等。
omit-frame-pointer
使用RBP获取调用堆栈相对比较容易。但现在编译器都可以设置不使用RBP(gcc使用-fomit-frame-pointer,msvc使用/Oy),对于函数而言不设置其RBP意味着可以节省若干条指令。在函数内部则完全使用RSP的偏移来定位局部变量,包括嵌套作用域里的局部变量,即使程序实际运行时不会进入这个作用域。
例如:
- void f2() {
- int a = 0x1234;
- if (a > 0) {
- int b = 0xff;
- b = a;
- }
- }
gcc中使用-fomit-frame-pointer生成的代码为:
- (gdb) disassemble f2
- Dump of assembler code for function f2:
- 0x00000000004004a5 <f2+0>: movl $0x1234,-0x8(%rsp) # int a = 0x1234
- 0x00000000004004ad <f2+8>: cmpl $0x0,-0x8(%rsp)
- 0x00000000004004b2 <f2+13>: jle 0x4004c4 <f2+31>
- 0x00000000004004b4 <f2+15>: movl $0xff,-0x4(%rsp) # int b = 0xff
- 0x00000000004004bc <f2+23>: mov -0x8(%rsp),%eax
- 0x00000000004004c0 <f2+27>: mov %eax,-0x4(%rsp)
- 0x00000000004004c4 <f2+31>: retq
可以发现f2()没有操作RBP之类的指令了。
原文地址: http://codemacro.com/2014/09/02/stack-frame/
written by Kevin Lynx posted at
http://codemacro.com
C/C++中手动获取调用堆栈【转】的更多相关文章
- delphi中获取调用堆栈信息
异常堆栈有利于分析程序的错误,Delphi的Exception有StackTrace属性,但是值为空,因为StackTrace的信息收集Delphi委托给了第三方组件来完成,真是脑子有毛病! 借助于m ...
- C++从LPEXCEPTION_POINTERS获取调用堆栈
#pragma once #include <map> #include <vector> struct FunctionCall { DWORD64 Address; std ...
- VC++ 崩溃处理以及打印调用堆栈
title: VC++ 崩溃处理以及打印调用堆栈 tags: [VC++, 结构化异常处理, 崩溃日志记录] date: 2018-08-28 20:59:54 categories: windows ...
- 在 Visual Studio 中调试时映射调用堆栈上的方法
本文转自:https://msdn.microsoft.com/zh-cn/library/dn194476.aspx 1.创建代码图,以便在调试时对调用堆栈进行可视化跟踪. 你可以在图中进行标注以跟 ...
- .NET 中获取调用方法名
在写记录日志功能时,需要记录日志调用方所在的模块名.命名空间名.类名以及方法名,想到使用的是反射(涉及到反射请注意性能),但具体是哪一块儿还不了解,于是搜索,整理如下: 需要添加相应的命名空间: us ...
- Linux下手动获取当前调用栈
被问到如何手动获取当前的调用栈,之前碰到过一时没记起来,现在回头整理一下. 其原理是:使用backtrace()从栈中获取当前调用各层函数调用的返回地址,backtrace_symbols()将对应地 ...
- 如何手动获取Spring容器中的bean(ApplicationContextAware 接口)
ApplicationContextAware 接口的作用 先来看下Spring API 中对于 ApplicationContextAware 这个接口的描述: 即是说,当一个类实现了这个接口之 ...
- 程序中打印当前进程的调用堆栈(backtrace)
为了方便调式程序,产品中需要在程序崩溃或遇到问题时打印出当前的调用堆栈.由于是基于Linux的ARM嵌入式系统,没有足够的空间来存放coredump文件. 实现方法,首先用__builtin_fram ...
- C#获取当前堆栈的各调用方法列表
在使用.NET编写的代码在debug时很容易进行排查和定位问题,一旦项目上线并出现问题的话那么只能依靠系统日志来进行问题排查和定位,但当项目复杂时,即各种方法间相互调用将导致要获取具体的出错方法或调用 ...
随机推荐
- C# 中常用的索引器
使用 C# 中的索引器和 JavaScript 中访问对象的属性是很相似. 之前了解过索引器,当时还把索引器和属性给记混了, 以为索引器就是属性,下面写下索引器和属性的区别,以及怎么使用索引器 先说明 ...
- Bootstrap 栅格系统初识
以下理论内容copy自bootstrap中文网(一个不错的bootstrap学习网站). 栅格系统 Bootstrap 提供了一套响应式.移动设备优先的流式栅格系统,随着屏幕或视口(viewport) ...
- Android UI设计的基本元素有哪些
在android app开发如火如荼的今天,如何让自己的App受人欢迎.如何增加app的下载量和使用量....成为很多android应用开发前,必须讨论的问题.而ui设计则是提升客户视觉体验度.提升下 ...
- python函数调用关系图(python call graph)
由于要重构项目的部分代码,要整理好主要的函数调用关系,不想自己看代码慢慢画出结构,想找出一种通用的,节省人力的方法得出函数间的调用关系图,于是发现以下几个工具.(内网没装好graphviz,还没真正用 ...
- FTP-Server
1.目录: 2. ftp_client.py import socket,os,json client=socket.socket() client.connect(('localhost',9999 ...
- 转:浅谈深度学习(Deep Learning)的基本思想和方法
浅谈深度学习(Deep Learning)的基本思想和方法 参考:http://blog.csdn.net/xianlingmao/article/details/8478562 深度学习(Deep ...
- URAL.1033 Labyrinth (DFS)
URAL.1033 Labyrinth (DFS) 题意分析 WA了好几发,其实是个简单地DFS.意外发现这个俄国OJ,然后发现ACRUSH把这个OJ刷穿了. 代码总览 #include <io ...
- 算法学习 拓扑排序(TopSort)
拓扑排序 一.基本概念 在一个有向无环图(Directed Acyclic Graph, DAG)中,规定< u,v > 表示一条由u指向v的的有向边.要求对所有的节点排序,使得每一条有向 ...
- HDOJ(HDU).1059 Dividing(DP 多重背包+二进制优化)
HDOJ(HDU).1059 Dividing(DP 多重背包+二进制优化) 题意分析 给出一系列的石头的数量,然后问石头能否被平分成为价值相等的2份.首先可以确定的是如果石头的价值总和为奇数的话,那 ...
- HDOJ.2094 产生冠军(map)
产生冠军 点我挑战题目 点我一起学习STL-MAP 题意分析 给出n组数据,代表a打败了b,让判断根据这n组数据是否能判断出来产生了冠军.一开始以为这道题很难,其实用map可以应付. 大原则,赢了的人 ...