linux下强大的文件分析工具 -- nm

什么是nm

nm命令是linux下自带的特定文件分析工具,一般用来检查分析二进制文件、库文件、可执行文件中的符号表,返回二进制文件中各段的信息。

目标文件、库文件、可执行文件

首先,提到这三种文件,我们不得不提的就是gcc的编译流程:预编译,编译,汇编,链接。

  • 目标文件 :常说的目标文件是我们的程序文件(.c/.cpp,.h)经过预编译,编译,汇编过程生成的二进制文件,不经过链接过程,编译生成指令为:

    gcc(g++) -c file.c(file.cpp)

    将生成对应的file.o文件,file.o即为二进制文件

  • 库文件: 分为静态库和动态库,这里不做过多介绍,库文件是由多个二进制文件打包而成,生成的.a文件,示例:

    ar -rsc liba.a test1.o test2.o test3.o

    将test1.o test2.o test3.o三个文件打包成liba.a库文件

  • 可执行文件:可执行文件是由多个二进制文件或者库文件(由上所得,库文件其实是二进制文件的集合)经过链接过程生成的一个可执行文件,对应windows下的.exe文件,可执行文件中有且仅有一个main()函数(用户程序入口,一般由bootloader指定,当然也可以改),一般情况下,二进制文件和库文件中是不包含main()函数的,但是在linux下用户有绝对的自由,做一个包含main函数的库文件也是可以使用的,但这不属于常规操作,不作讨论。

上述三种文件的格式都是二进制文件。

为什么要用到nm

在上述提到的三种文件中,用编辑器是无法查看其内容的(乱码),所以当我们有这个需求(例如debug,查看内存分布的时候)去查看一个二进制文件里包含了哪些内容时,这时候就将用到一些特殊工具,linux下的nm命令就可以完全胜任(同时还有objdump和readelf工具,这里暂不作讨论)。

怎么使用nm

如果你对linux下的各种概念还算了解的话,就该知道一般linux下的命令都会自带一些命令参数来满足各种应用需求,了解这些参数的使用是使用命令的开始。

man

那么,如何去了解一个命令呢,最好的方法就是linux下的man命令,linux是一个宝库,而man指令就相当于这个宝库的说明书。

用法:

  1. man nm

这里面介绍了nm的各种参数以及详细用法,如果你有比较不错的英文水平和理解能力,可以直接参考man page中的内容。

nm的常用命令参数

-A 或-o或 --print-file-name:打印出每个符号属于的文件

-a或--debug-syms:打印出所有符号,包括debug符号

-B:BSD码显示

-C或--demangle[=style]:对低级符号名称进行解码,C++文件需要添加

--no-demangle:不对低级符号名称进行解码,默认参数

-D 或--dynamic:显示动态符号而不显示普通符号,一般用于动态库

-f format或--format=format:显示的形式,默认为bsd,可选为sysv和posix

-g或--extern-only:仅显示外部符号

-h或--help:国际惯例,显示命令的帮助信息

-n或-v或--numeric-sort:显示的符号以地址排序,而不是名称排序

-p或--no-sort:不对显示内容进行排序

-P或--portability:使用POSIX.2标准

-V或--version:国际管理,查看版本

--defined-only:仅显示定义的符号,这个从英文翻译过来可能会有偏差,故贴上原文:

  1. Display only defined symbols for each object file

好了,上述就是常用的命令参数,光说不练假把式,下面将给出一个示例来进一步理解nm用法:

示例代码:

```

#include

#include

  1. using namespace std;
  2. const char *str="downey";
  3. int g_uninit;
  4. int g_val=10;
  5. void func1()
  6. {
  7. int *val=new int;
  8. static int val_static=1;
  9. cout<<"downey"<<endl;
  10. }
  11. void func1(char* str)
  12. {
  13. cout<<str<<endl;
  14. }
  15. ```

编译指令:

  1. g++ -c test.cpp
  2. 在当前目录下生成test.o目标文件,然后使用nm命令解析:
  3. nm -n -C test.o
  4. 由于是C++源文件,故添加-C 选项,为了方便查看,添加-n选项

输出信息:

  1. ```
  2. U __cxa_atexit
  3. U __dso_handle
  4. U std::ostream::operator<<(std::ostream& (*)(std::ostream&))
  5. U std::ios_base::Init::Init()
  6. U std::ios_base::Init::~Init()
  7. U operator new(unsigned long)
  8. U std::cout
  9. U std::basic_ostream<char, std::char_traits<char> >& std::endl<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&)
  10. U std::basic_ostream<char, std::char_traits<char> >& std::operator<< <std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*)
  11. 0000000000000000 B g_uninit
  12. 0000000000000000 D str
  13. 0000000000000000 T func1()
  14. 0000000000000004 b std::__ioinit
  15. 0000000000000008 D g_val
  16. 000000000000000c d func1()::val_static
  17. 0000000000000035 T func1(char*)
  18. 0000000000000062 t __static_initialization_and_destruction_0(int, int)
  19. 00000000000000a0 t _GLOBAL__sub_I_str
  20. ```

下面我们再来解析输出信息中各部分所代表的意思吧

  • 首先,前面那一串数字,指的就是地址

  • 然后,我们发现,每一个条目前面还有一个字母,类似'U','B','D等等,其实这些符号代表的就是当前条目所对应的内存所在部分

  • 最右边的就是对应的符号内容了

首要的需要讲解的就是第二点中字符所对应的含义:

同样在还是在linux命令行下man nm指令可以得到:

  1. A :符号的值是绝对值,不会被更改
  2. Bb :未被初始化的全局数据,放在.bss
  3. Dd :已经初始化的全局数据
  4. Gg :指被初始化的数据,特指small objects
  5. I :另一个符号的间接参考
  6. N debugging 符号
  7. p :位于堆栈展开部分
  8. Rr :属于只读存储区
  9. Ss :指为初始化的全局数据,特指small objects
  10. Tt :代码段的数据,.test
  11. U :符号未定义
  12. Ww :符号为弱符号,当系统有定义符号时,使用定义符号,当系统未定义符号且定义了弱符号时,使用弱符号。
  13. unknown符号

根据以上的规则,我们就可以来分析上述的nm显示结果:

  • 首先,输出的上半部分对应的符号全是U,跟我们常有思路不一致的是,这里的符号未定义并不代表这个符号是无法解析的,而是用来告诉链接器,这个符号对应的内容在我这个文件只有声明,没有具体实现,如std::cout,std::string类,在链接的过程中,链接器需要到其他的文件中去找到它的实现,如果找不到实现,链接器就会报常见的错误:undefined reference。

  • 在接下来的三行中

    0000000000000000 B g_uninit

    0000000000000000 D str

    0000000000000000 T func1()

    令人疑惑的是,为什么他们的地址都是0,难道说mcu的0地址同时可以存三种数据?其实不是这样的,按照上面的符号表规则,g_uninit属于.bss段,str属于全局数据区,而func1()属于代码段,这个地址其实是相对于不同数据区的起始地址,即g_uninit在.bss段中的地址是0,以此类推,而.bss段具体被映射到哪一段地址,这属于平台相关,并不能完全确定。

    在目标文件中指定的地址都是逻辑地址,符号真正的地址需要到链接阶段时进行相应的重定位以确定最终的地址。

  • 在接下来的四行中

    0000000000000004 b std::__ioinit

    0000000000000008 D g_val

    000000000000000c d func1()::val_static

    0000000000000035 T func1(char*)

    b在全局数据段中的4地址,因为上述g_uninit占用了四字节,所以std::__ioinit的地址为0+4=4.

    而g_val存在于全局数据段(D)中,起始地址为8,在程序定义中,因为在0地址处存放的是str指针,而我的电脑系统为64位,所以指针长度为8,则g_val的地址为0+8=8

    而静态变量val_static则是放在全局数据段8+sizeof(g_val)=12处

    函数func1(char*)则放在代码段func1()后面

讲到这里,有些细心的朋友就会疑惑了,在全局数据区(D)中存放了str指针,那str指针指向的字符串放到哪里去了?其实这些字符串内容放在常量区,常量区属于代码区(t)(X86平台,不同平台可能有不同策略),对应nm显示文件的这一部分:

  1. 00000000000000a0 t _GLOBAL__sub_I_str

如果你对此有一些疑惑,你可以尝试将str字符串放大,甚至是改成上千个字节的字符串,就会看到代码段(t)的变化。

好了,关于linux下nm命令的解析就到此为止啦,如果朋友们对于这个有什么疑问或者发现有文章中有什么错误,欢迎留言

原创博客,转载请注明出处!

祝各位早日实现项目丛中过,bug不沾身.

(完)

linux下nm命令的使用的更多相关文章

  1. 怎么查看二进制文件内容?linux下nm命令告诉你!

    linux下强大的文件分析工具 -- nm 什么是nm nm命令是linux下自带的特定文件分析工具,一般用来检查分析二进制文件.库文件.可执行文件中的符号表,返回二进制文件中各段的信息. 目标文件. ...

  2. Linux下ps命令详解 Linux下ps命令的详细使用方法

    http://www.jb51.net/LINUXjishu/56578.html Linux下的ps命令比较常用 Linux下ps命令详解Linux上进程有5种状态:1. 运行(正在运行或在运行队列 ...

  3. 例解 Linux 下 Make 命令

    Linux 下 make 命令是系统管理员和程序员用的最频繁的命令之一.管理员用它通过命令行来编译和安装很多开源的工具,程序员用它来管理他们大型复杂的项目编译问题.本文我们将用一些实例来讨论 make ...

  4. Linux下who命令之C语言实现

    Linux下who命令之C语言实现 Step1:前期准备 首先要有一个清楚的认识:linux中一切皆文件 实现who命令,who命令也是Linux中的一个文件,那我们怎么找到它呢?我们可以" ...

  5. linux下history命令显示历史指令记录的使用方法

    Linux系统当你在shell(控制台)中输入并执行命令时,shell会自动把你的命令记录到历史列表中,一般保存在用户目录下的.bash_history文件中.默认保存1000条,你也可以更改这个值 ...

  6. linux下svn命令使用大全

    最近经常使用svn进行代码管理,这些命令老是记不住,得经常上网查,终于找了一个linux下svn命令使用大全:1.将文件checkout到本地目录 svn checkout path(path是服务器 ...

  7. Linux下rz命令使用的实例详解

    Linux中rz命令和sz命令都可用于文件传输,而rz命令主要用于文件的上传,下面将通过几个实例来给大家详细介绍下Linux下rz命令的用法,一起来学习下吧. rz命令可以批量上传文件,当然也可上传单 ...

  8. Linux下rar命令详解

    Linux下rar命令详解 用法: rar <命令> -<选项1> ….-<选项N> < 操作文档> <文件…> <@文件列表…> ...

  9. linux下tar命令详解

     linux下tar命令详解    tar是Linux环境下最常用的备份工具之一.tar(tap archive)原意为操作磁带文件,但基于Linux的文件操作机制,同样也可适用于普通的磁盘文件.ta ...

随机推荐

  1. vue-cli3项目关闭烦人的代码检测

    参考博客:https://blog.csdn.net/e1172090224/article/details/99636767 vue.config.js module.exports = { lin ...

  2. [转]Gnome桌面的录屏插件easyscreencast

    原文地址:https://www.linuxprobe.com/gnome-easyscreencast.html

  3. Kubernetes 使用 Weave Scope 监控集群(十七)

    目录 一.安装 二.使用 Scope 2.1.拓扑结构 2.2.在线操作 2.3.强大的搜索功能 创建 Kubernetes 集群并部署容器化应用只是第一步.一旦集群运行起来,我们需要确保一起正常,所 ...

  4. Linux 就该这么学 CH04 VIM编辑器和Shell命令脚本

    0 概述 1 Vim编辑器 在linux 中一切都是文件,而配置一个服务就是修改其配置文件的参数. vim 编辑器有三种模式:命令模式,末行模式和编辑模式. 命令模式:控制光标移动,对文件进行操作. ...

  5. nginx配置优化提高并发量

    1 nginx配置优化提高并发量 worker_processes 2; 这个按照CPU的核数来决定 2 worker_connections 65535; 这个一般设置65535即可 每个进程允许的 ...

  6. 【转帖】Infor转型十年启示录:ERP套件厂商为什么要做云平台?

    Infor转型十年启示录:ERP套件厂商为什么要做云平台? https://www.tmtpost.com/4199274.html 好像浪潮国际 就是用的infor的ERP软件. 秦聪慧• 2019 ...

  7. css3响应式布局教程—css3响应式

    响应式布局 一个网站能够兼容多个终端,并且在各个终端都可以很好展示体验. 媒体类型 在何种设备或者软件上将页面打开 123456789 all:所有媒体braille:盲文触觉设备embossed:盲 ...

  8. 搭建wildfly domain集群

    两台机器为参考,wildfly版本为wildfly-9.0.1.Final,10版本用本方法有点问题. master:192.168.0.1 slave :192.168.0.2 master: cd ...

  9. GoLang基础数据类型---字典

    Map 是 Go 中的内置类型,它将键与值绑定到一起.可以通过键获取相应的值. 如何创建 map? 可以通过将键和值的类型传递给内置函数 make 来创建一个 map.语法为:make(map[Key ...

  10. An Illustrated Proof of the CAP Theorem

    An Illustrated Proof of the CAP Theorem The CAP Theorem is a fundamental theorem in distributed syst ...