pstack:

pstack命令可显示每个进程的栈跟踪。

pstack 命令必须由相应进程的属主或 root 运行。

可以使用 pstack 来确定进程挂起的位置。

此命令允许使用的唯一选项是要检查的进程的 PID。

pstack 看活动的进程内的堆栈

用法:

root# pstack PID

gstack:

gstack -打印正在运行的进程的堆栈跟踪

使用方法:

gstack PID

描述

gstack连接到命令行中pid的活动进程

打印执行堆栈跟踪。如果ELF符号存在于二进制(usu -)中

如果你没有运行条带(1),那么这个例子就会被打印出来

同样如此。

如果进程是线程组的一部分,那么gstack将打印出一个堆栈

对组中的每个线程进行跟踪。

https://blog.csdn.net/O4dC8OjO7ZL6/article/details/78954755
---------------------

思路分析
我们知道gdb的bt(backtrace)可以打印函数调用栈,但需要手动敲命令执行,不能批量多次运行,似乎不太方便。有没有更好的工具和方法搞定这个需求呢?有的,gstack就是一款用于方便查看函数调用栈的工具。gstack的用途是“print a stack trace of a running process”,即打印一个正在运行的进程的函数调用栈。下面以一个正在运行的redis-server进程为例,执行gstack `pidof redis-server`即可看到该进程当前正在运行的3个线程各自的函数调用栈。这其实与gdb bt看到的差不多,而且我们的目标是只需要函数名,而不需要地址信息,那么gstack有没有什么参数可以去掉每行的地址,以精简打印呢?

如下所示,gstack竟然没有帮助,这不像是一个正常的程序啊。用file `which gstack`查看,果然,它只是一个脚本,并不是一个正常的程序。

查看/usr/bin/gstack脚本源代码,发现它其实只是包装了gdb bt,并用sed对gdb bt的输出结果做了过滤而已。如下给出gstack脚本源代码的解读,该脚本分为五部分:

第一部分:检查是否提供一个入参,如果入参数量不是1,则打印用法提示,并退出脚本。

第二部分:检查入参必须是一个当前正在运行的程序的PID,如果不是,则退出脚本。

第三部分:判断内核是否支持gdb打印所有线程函数栈,如果不支持,则后续会将“bt”命令输入gdb中;如果支持,则后续会将“thread apply all bt”命令输入gdb中。

第四部分:执行gdb,通过“gdb [options] [executable-file] [process-id]”方式附着到指定PID的进程上,通过<<EOF方式为gdb传入多个命令,并将执行输出的结果通过管道“|”传给后续的sed命令。

第五部分:用sed去掉gdb输出的无效行,只提取含有线程信息、函数信息的行。

通过上述对gstack脚本源代码的分析可知,gstack只是gdb bt的简单封装,与我们的目标还有一定差距。看来需要自己编写一些扩展脚本或程序,才能进一步达成目标。

首先,需要编写一个脚本,重复运行多次gstack,采集目标程序足够多次函数调用栈;其次,需要进一步净化数据,比如函数地址信息就需要过滤掉;还有,需要归并出不同的函数调用栈,找到不同的函数调用链,因为gstack输出的函数栈是用Thread行分隔的,可以编写一个程序来解析Thread行,将每个Thread块(多行)放到哈希桶中排重(即,排除重复项),从而得到唯一不同的函数调用链。

三.扩展编程
 首先,编写一个makefile脚本,用shell for循环不断调用gstack,将输出结果追加到临时文本文件中。

仍以redis-server为例,执行 make gstack_log PID=`pidof redis-server` NN=5,即可对redis-server连续运行5次gstack,并将结果保存到一个临时文件tmp_gstack_1353.txt中。在正式采集时,可以将NN设置为很大,比如NN=2000次,以采集到足够多的不同的函数调用栈信息。

然后,查看一下输出的临时文件的内容,即多次gstack输出结果的罗列。下一步需要将每个Thread行所分隔的块(多行),如块1、块2、块3、块4、、、进行净化和排重。

编写一个Node.js小程序gstack_data_format.js,用于对gstack输出结果净化并排重。程序读入gstack结果文件(如:tmp_gstack_1353.txt),一行一行地读入并累加到一个字符串变量中,遇到Thread行则停止累加,并将该字符串作为KEY添加到一个HASH桶中,因为HASH KEY天然不会重复,利用这个特点进行排重;遇到Thread行后,清空该字符串变量,重新开始累加;依次往复,直到读完整个文件。程序基本流程如下,具体源代码请见本文附录。

如下给出gstack_data_format.js的运行效果。该gstack结果文件为1186行,采集到237个函数栈,进行净化、排重后,得到2个唯一不同的函数调用栈。

LINUX 编程定位工具gstack,pstack的更多相关文章

  1. Linux问题定位工具大放送

    我们在程序定位问题时,经常不知所错,但是在linux有很多强大的工具,只要我们合理利用,一定见奇效. 主要会遇到以下问题: 1 mem高 2 cpu高 3 io高 4 网络延迟高 vargrind:h ...

  2. linux编程学习

    linux编程学习 工具篇 “公欲善其事,必先利其器”.编程是一门实践性很强的工作,在你以后的学习或工作中,你将常常会与以下工具打交道, 下面列出学习 C 语言编程常常用到的软件和工具. (一)操作系 ...

  3. 【目录】linux 编程

    随笔分类 - linux 编程 Linux编程 24 shell编程(结构化 if [ condition ] 数值比较,字符串比较) 摘要: 一.概述 接着上篇讲的结构化命令,最后讲到了test命令 ...

  4. 牛人整理分享的面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结 转载

    基础篇:操作系统.计算机网络.设计模式 一:操作系统 1. 进程的有哪几种状态,状态转换图,及导致转换的事件. 2. 进程与线程的区别. 3. 进程通信的几种方式. 4. 线程同步几种方式.(一定要会 ...

  5. 【转】牛人整理分享的面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结

    基础篇:操作系统.计算机网络.设计模式 一:操作系统 1. 进程的有哪几种状态,状态转换图,及导致转换的事件. 2. 进程与线程的区别. 3. 进程通信的几种方式. 4. 线程同步几种方式.(一定要会 ...

  6. 面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结

    基础篇:操作系统.计算机网络.设计模式 一:操作系统 1. 进程的有哪几种状态,状态转换图,及导致转换的事件. 2. 进程与线程的区别. 3. 进程通信的几种方式. 4. 线程同步几种方式.(一定要会 ...

  7. 77个常用Linux命令和工具

    77个常用Linux命令和工具 Linux管理员不能单靠GUI图形界面吃饭.这就是我们编辑这篇最实用Linux命令手册的原因.这个指南是特别为Linux管理员和系统管理员 设计的,汇集了最有用的一些工 ...

  8. linux 编程技术

    linux 编程技术No.1前期准备工作 GCC的编译过程分为预处理.生成汇编代码.生成目标代码和链接成可执行文件等4个步骤. 使用vim编写C 文件 : [lining@localhost prog ...

  9. Linux编程之给你的程序开后门

    这里说的"后门"并不是教你做坏事,而是让你做好事,搭建自己的调试工具更好地进行调试开发.我们都知道,当程序发生异常错误时,我们需要定位到错误,有时我们还想,我们在不修改程序的前提下 ...

随机推荐

  1. __x__(37)0909第五天__背景图按钮

    link,hover,active三种按键状态,存放三张图片 缺点: 资源只有在被使用时,才会被加载. 页面第一次加载时,会出现短暂的延迟闪烁,造成一次不佳的用户体验. 图片整合技术 CSS-Spri ...

  2. 前端性能优化 —— reflow(回流)和repaint(重绘)

    简要:整个在浏览器的渲染过程中(页面初始化,用户行为改变界面样式,动画改变界面样式等)reflow(回流)和repaint(重绘) 会大大影响web性能,尤其是手机页面.因此我们在页面设计的时候要尽量 ...

  3. 华大单片机开发板HC32L13X上手入门

    HC32L136开发板(如下图所示)分为板载调试模块(左半部分)和MCU开发电路(右半部分).二者中间通过邮票孔相连,如果将板子从中间掰开,板载调试模块就可以当一个CMSIS-DAP的仿真器来使用.此 ...

  4. C#获取项目程序及运行路径的方

    1.asp.net webform用“Request.PhysicalApplicationPath获取站点所在虚拟目录的物理路径,最后包含“\”:   2.c# winform用 A:“Applic ...

  5. 开启windows的 admin+开启tel+电源+远程功能

    1.控制面板   小图标   程序功能   打开关闭windows功能     开启Telnet 的服务两个都选         2. 启动tel服务   控制面板  小图标 管理工具 服务 找到 t ...

  6. JVM内存模型与垃圾回收

    内存模型 1,程序计数器(Program Counter Register):程序计数器是一个比较小的内存区域,用于指示当前线程所执行的字节码执行到了第几行,可以理解为是当前线程的行号指示器.字节码解 ...

  7. c#4.8-4.11学习总结

    4.8讲的是static 关键字.它用于修饰类 ,字段 ,属性,方法和构造方法等.被它修饰的类称为静态类,成员称为静态成员.  先说静态字段,它是普通字段前面加个static,它不属于任何对象,只属于 ...

  8. 可扩展的Web架构和分布式系统

    原文链接:http://www.aosabook.org/en/distsys.html 开源软件已经成为一些大型网站的基石.随着这些网站的发展,围绕其架构的最佳实践和指导原则应运而生.本章旨在讨论设 ...

  9. Redis持久化介绍

    所有的数据都存在内存中,从内存当中同步到硬盘上,这个过程叫做持久化过程. 持久化操作,两种方式:rdb方式.aof方式,可以单独使用或者结合使用. 使用方法: rdb持久化方法:在指定的时间间隔写入硬 ...

  10. 如何优雅的写一个Vue 的弹框

    写Vue或者是react 都会遇见弹框的问题.也尝试了多种办法来写弹框,一直都不太满意,今天特地看了一下 Element UI 的源码,模仿着写了一个简易版. 大概有一下几个问题: 1.弹框的层级问题 ...