首先需要介绍一下,阅读此文需要有基本的汇编知识。
1、rbp(基址寄存器),rsp(堆栈寄存器),rip(指令寄存器).
2、程序执行时,没有遇到函数调用时,IP自增长,遇到函数调用时,
需要保存bp,ip寄存器到栈上,函数调用结束时,恢复。(这个过程的细节需要很清楚)
(注:因此需要简单描述一下,函数调用时的步骤。
第一,将函数执行完成后的下一条指令的地址存放进当前rsp的位置,(即结束时,ret命令利用此信息恢复rip)
第二,进入函数后,保存当前rsp到rbp寄存器中,原因是rsp需要随时变化(结束时,需要将堆栈位置还原) )
 
两年前,有XX专家,来讲述了一下关于无堆栈信息core文件的定位方法。
没有留下任何文档,也没有讲述原理。
告知了可以使用如下方法来进行排查:
根据寄存器rbp里的地址,对临近区域的内存进行排查,查询出最近的内容为0x004xxxxx的指令,
在gdb中用x/i 0x004xxxxx来查询为何指令(函数)。该函数可能为越界出现问题的地方,可以走查代码来排查。
之后,我也根据此线索推导出了原理,但一直没有形成总结。今天,详细说明此中原委。
 
软件平台:
No LSB modules are available.
Distributor ID:Ubuntu
Description:Ubuntu 12.04.3 LTS
Release:12.04
Codename:precise
 
简单程序如下:
#include <iostream>
using namespace std;
 
void test(int n)
{
    cout << n << endl;
    //rbp
    *(int*)(&n + 1) = 3;
    *(int*)(&n + 2) = 4;
    //rip
    *(int*)(&n + 3) = 4;
 
}
 
void caller()
{
    test(20);
    cout << "caller" << endl;
}
 
int main()
{
    caller();
    cout << "main" << endl;
    return 0;
}
 
----------------------------------------------
(gdb) x/32ux $rbp
0x7fffffffe510:0xffffe520 0x00007fff 0x00400865 0x00000000
0x7fffffffe520:0xffffe530 0x00007fff 0x0040088c 0x00000000
0x7fffffffe530:0x00000000 0x00000000 0xf773876d 0x00007fff
 ----------------------------------------------
(gdb) disas caller
Dump of assembler code for function caller():
   0x0000000000400857 <+0>:push   %rbp
   0x0000000000400858 <+1>:mov    %rsp,%rbp
   0x000000000040085b <+4>:mov    $0x14,%edi
   0x0000000000400860 <+9>:callq  0x400804 <test(int)>
   0x0000000000400865 <+14>:mov    $0x4009fc,%esi
   0x000000000040086a <+19>:mov    $0x601060,%edi
   0x000000000040086f <+24>:callq  0x4006f0 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
   0x0000000000400874 <+29>:mov    $0x400710,%esi
   0x0000000000400879 <+34>:mov    %rax,%rdi
   0x000000000040087c <+37>:callq  0x400700 <_ZNSolsEPFRSoS_E@plt>
   0x0000000000400881 <+42>:pop    %rbp
   0x0000000000400882 <+43>:retq 
(gdb) disas main
Dump of assembler code for function main():
   0x0000000000400883 <+0>: push   %rbp
   0x0000000000400884 <+1>: mov    %rsp,%rbp
   0x0000000000400887 <+4>: callq  0x400857 <caller()>
   0x000000000040088c <+9>: mov    $0x400a03,%esi
   0x0000000000400891 <+14>: mov    $0x601060,%edi
   0x0000000000400896 <+19>: callq  0x4006f0 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
   0x000000000040089b <+24>: mov    $0x400710,%esi
   0x00000000004008a0 <+29>: mov    %rax,%rdi
   0x00000000004008a3 <+32>: callq  0x400700 <_ZNSolsEPFRSoS_E@plt>
   0x00000000004008a8 <+37>: mov    $0x0,%eax
   0x00000000004008ad <+42>: pop    %rbp
   0x00000000004008ae <+43>: retq
 
根据$rbp表明,当前实际应该是执行到了 main()函数的0x000000000040088c <+9>: mov    $0x400a03,%esi的上一条指令(caller()函数)
的0x0000000000400865 <+14>:mov    $0x4009fc,%esi的上一条0x0000000000400860 <+9>:callq  0x400804 <test(int)>中。
 
在coredump以后。
------------------------------------------------------
(gdb) info register
rax            0x7fffffffe518 140737488348440
rbx            0x0 0
rcx            0x7ffff77fd910 140737345739024
rdx            0x0 0
rsi            0x7ffff7ad1ab0 140737348704944
rdi            0x7ffff7ad0260 140737348698720
rbp            0x400000003 0x400000003
rsp            0x7fffffffe520 0x7fffffffe520
r8             0x7ffff7202740 140737339467584
r9             0x7ffff7202740 140737339467584
r10            0x7fffffffe280 140737488347776
r11            0x7ffff7785c90 140737345248400
r12            0x400720 4196128
r13            0x7fffffffe610 140737488348688
r14            0x0 0
r15            0x0 0
rip            0x4 0x4
eflags         0x216 [ PF AF IF ]
cs             0x33 51
ss             0x2b 43
ds             0x0 0
es             0x0 0
fs             0x0 0
gs             0x0 0
------------------------------------------------------
根据core文件的寄存器信息,可知,bp及ip均已写飞。只能利用sp指针来查询。
------------------------------------------------------
(gdb) x/32ux $rsp
0x7fffffffe520: 0xffffe530 0x00007fff 0x0040088c 0x00000000
(gdb) x/i 0x0040088c
   0x40088c <main()+9>: mov    $0x400a03,%esi
(gdb) disas main
Dump of assembler code for function main():
   0x0000000000400883 <+0>: push   %rbp
   0x0000000000400884 <+1>: mov    %rsp,%rbp
   0x0000000000400887 <+4>: callq  0x400857 <caller()>
   0x000000000040088c <+9>: mov    $0x400a03,%esi
------------------------------------------------------
由此,可以查出是core在了main函数中。
 
例子使用的最简单的,实际测试时,会有多层调用,但是原理不变。
 
限制:如果越界的长度超过了函数调用堆栈的长度,本方法则不再可用。
 
以后补个图。今天就到这里了
 
 

core文件无堆栈信息定位的思路的更多相关文章

  1. GDB调试之core文件(如何定位到Segment fault)

    core dump又叫核心转储,当程序运行过程中发生异常,程序异常退出时,由操作系统把程序当前的内存状况存储在一个core文件中,叫core dump.(内部实现是:linux系统中内存越界会收到SI ...

  2. Core文件作用、设置及用法

    http://blog.csdn.net/lanmolei814/article/details/45201693 ====================================== 1.C ...

  3. 如何设置、查看以及调试core文件

    http://blog.csdn.net/xiaoxiaoniaoer1/article/details/7740820 1.core文件的生成开关和大小限制--------------------- ...

  4. Linux上调试core文件(Good)

    coredump文件 什么是coredump? 通常情况下coredmp包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息等.可以理解为把程序工作的当前状态存储成一个文件.许多程序和操作系统出 ...

  5. GDB调试core文件(2)

    使用gdb和core dump迅速定位段错误 关键字:gdb.段错误.core dump 一.什么是core dump core:内存.核心的意思: dump:抛出,扔出: core dump:前提: ...

  6. GDB Core,gdb 调试大全,core文件调试

    编译: gcc -g -o hello hello.c gdb 调试: 基本 gdb 命令. 命 令 描 述 小结:常用的gdb命令 backtrace 显示程序中的当前位置和表示如何到达当前位置的栈 ...

  7. Linux 如何使用gdb 查看core堆栈信息

    转载:http://blog.csdn.net/mergerly/article/details/41994207 core dump 一般是在segmentation fault(段错误)的情况下产 ...

  8. 如何在没有core文件的情况下用dmesg+addr2line定位段错误

    前言 在现网环境下,程序奔溃后不一定会留下core文件,原因有很多,比如存储空间不足就是其中一个常见的原因.此时我们只能依据linux记录的错误日志来定位问题. 涉及linux命令 本文涉及以下几条命 ...

  9. Java内存泄漏分析系列之一:使用jstack定位线程堆栈信息

    原文地址:http://www.javatang.com 前一段时间上线的系统升级之后,出现了严重的高CPU的问题,于是开始了一系列的优化处理之中,现在将这个过程做成一个系列的文章. 基本概念 在对J ...

随机推荐

  1. django查询

    阅读目录 大于.大于等于 小于.小于等于 在...范围内 模糊查询 是否为空 不等于/不包含于 大于.大于等于 1 2 3 4 5 __gt 大于 __gte 大于等于   User.objects. ...

  2. Very Good!——C语言初学者百题大战之二

    #include<stdio.h> int main() { printf("***************\n\n Very Good!\n\n***************& ...

  3. 【OpenJudge9270】【Pku2440】【递推】DNA

    DNA [描述] A kind of virus has attacked the X planet, and many lives are infected. After weeks of stud ...

  4. Mac下的MySQL修改默认连接字符集

    进入命令行执行以下命令: sudo vim /etc/my.cnf [client] default-character-set=utf8 [mysqld] character-set-server= ...

  5. js阻止浏览器、元素的默认事件与js阻止事件冒泡、阻止事件流

    嵌套的div元素,如果父级和子元素都绑定了一些事件,那么在点击最内层子元素时可能会触发父级元素的事件,下面介绍一下js阻止默认事件与js阻止事件冒泡示例,大家参考使用吧   1. event.prev ...

  6. android 检查能否上网

    文章一: 首先在,AndroidManifest.xml 中增加访问权限: <uses-permission android:name="android.permission.ACCE ...

  7. [Linux] Linux软连接和硬链接

    转载自:http://www.cnblogs.com/itech/archive/2009/04/10/1433052.html 1.Linux链接概念Linux链接分两种,一种被称为硬链接(Hard ...

  8. CDK安装

    1.下载cdk https://developers.redhat.com/products/cdk/download/ 2.在mac OS上更名并加入目录 $ mkdir -p ~/bin $ cp ...

  9. 通过logstash收集mysql慢查询日志转换为json

    input { file { type => "mysql-slow" path => "/var/log/slow_mysqld.log" sta ...

  10. 二十四种设计模式:桥接模式(Bridge Pattern)

    桥接模式(Bridge Pattern) 介绍将抽象部分与它的实现部分分离,使它们都可以独立地变化. 示例有一个Message实体类,对它的操作有Insert()和Get()方法,现在使这些操作的抽象 ...