转自：https://www.cnblogs.com/arnoldlu/p/7152488.html

1. 内核中通过lookup_symbol_name获取函数名称

内核中很多结构体成员是函数，有时可能比较复杂不知道具体使用哪一个函数。这是可以通过lookup_symbol_name来获取符号表名称。

int lookup_symbol_name(unsigned long addr, char *symname)

{

    symname[0] = '\0';

    symname[KSYM_NAME_LEN - 1] = '\0';

    if (is_ksym_addr(addr)) {----------------------------------------地址有效性检查

        unsigned long pos;

        pos = get_symbol_pos(addr, NULL, NULL);

        /* Grab name */

        kallsyms_expand_symbol(get_symbol_offset(pos), symname);-----获取不好名称到symname

        return 0;

    }

    /* See if it's in a module. */

    return lookup_module_symbol_name(addr, symname);------------------从module符号表中查找

}

在timer_list.c和timer_stats.c中有使用，如下：

static void print_name_offset(struct seq_file *m, unsigned long addr)

{

    char symname[KSYM_NAME_LEN];

    if (lookup_symbol_name(addr, symname) < 0)

        seq_printf(m, "<%p>", (void *)addr);

    else

        seq_printf(m, "%s", symname);

}

2. 通过__builtin_return_address获取调用者函数地址

2.1 背景介绍：__builtin_return_address是GCC提供的一个内置函数，用于判断给定函数的调用者。

6.49 Getting the Return or Frame Address of a Function里面有更多获取函数调用者的介绍。

void * __builtin_return_address (unsigned int level)

level为参数，如果level为0，那么就是请求当前函数的返回地址；如果level为1，那么就是请求进行调用的函数的返回地址。

2.2 使用实例

内核中ftrace使用的较多：

#define CALLER_ADDR0 ((unsigned long)__builtin_return_address(0))

#define CALLER_ADDR1 ((unsigned long)return_address(1))

#define CALLER_ADDR2 ((unsigned long)return_address(2))

#define CALLER_ADDR3 ((unsigned long)return_address(3))

#define CALLER_ADDR4 ((unsigned long)return_address(4))

#define CALLER_ADDR5 ((unsigned long)return_address(5))

#define CALLER_ADDR6 ((unsigned long)return_address(6))

一个测试示例：

#include <stdio.h>

void func_e(void)

{

    printf("func_e(0)=%p\n", __builtin_return_address(0));-------------------------打印返回层级地址

    printf("func_e(1)=%p\n", __builtin_return_address(1));

    printf("func_e(2)=%p\n", __builtin_return_address(2));

    printf("func_e(3)=%p\n", __builtin_return_address(3));

    printf("func_e(4)=%p\n", __builtin_return_address(4));

    printf("func_e(5)=%p\n", __builtin_return_address(5));

}

void func_d(void)

{

    func_e();

}

void func_c(void)

{

    func_d();

}

void func_b(void)

{

    func_c();

}

void func_a(void)

{

    func_b();

}

int main(int argc, char *agrv[])

{

    func_a();

    printf("func_a=%p, func_b=%p, func_c=%p, func_d=%p, func_e=%p\n", func_a, func_b, func_c, func_d, func_e);---------------------打印函数地址

}

执行结果如下：

func_e(0)=0x4005f2

func_e(1)=0x4005fd

func_e(2)=0x400608

func_e(3)=0x400613

func_e(4)=0x400629

func_e(5)=0x7fba4af1af45

func_a=0x40060a, func_b=0x4005ff, func_c=0x4005f4, func_d=0x4005e9, func_e=0x40052d

使用addr2line -e file -f addrs，可以看出编译是否-g的区别：

gcc caller.c -o caller	gcc caller.c -o caller -g
addr2line -e caller -f 4005f2 func_d ??:?	addr2line -e caller -f 4005f2 func_d /home/lubaoquan/temp/caller.c:16

通过nm xxxx也可以找到地址对应的函数名：

000000000040060a T func_a

00000000004005ff T func_b

00000000004005f4 T func_c

00000000004005e9 T func_d

000000000040052d T func_e

参考文档：

1.《Linux 内核中的 GCC 特性》

3. 基于HW Breakpoints的调试

3.1 HW Breakpoints背景

3.2

参考文档：

1. 《Hardware Breakpoint(or watchpoint) usage in Linux Kernel》

2. 《How Do Breakpoints Work》

4. likely和unlikely机制

1.likely和unlikely背景

likely和unlikely在include/linux/compiler.h中定义：

#if defined(CONFIG_TRACE_BRANCH_PROFILING) \------------------------------------------------------------------带调试信息的likely和unlikelly

    && !defined(DISABLE_BRANCH_PROFILING) && !defined(__CHECKER__)

...

# ifndef likely

#  define likely(x)    (__builtin_constant_p(x) ? !!(x) : __branch_check__(x, 1))

# endif

# ifndef unlikely

#  define unlikely(x)    (__builtin_constant_p(x) ? !!(x) : __branch_check__(x, 0))

# endif

...

#else

# define likely(x)    __builtin_expect(!!(x), 1)--------------------------------------------------------------不带调试信息

# define unlikely(x)    __builtin_expect(!!(x), 0)

#endif

__builtin_expect()是GCC从2.96开始支持的分支预测功能，降低因为指令跳转带来的分支下降，它的返回值就是它的第一个参数传递给它的值。

2.机制详解

__builtin_expect()通过改变汇编指令顺序，来充分利用处理器的流水线，直接执行最有可能的分支指令，而尽可能避免执行跳转指令(jmp)。因为jmp指令会刷新CPU流水线，而影响执行时间。

#include <stdio.h>

#define likely(x)    __builtin_expect(!!(x), 1)

#define unlikely(x)  __builtin_expect(!!(x), 0)

int main(char *argv[], int argc)

{

   int a;

   /* Get the value from somewhere GCC can't optimize */

   a = atoi (argv[1]);

   if (unlikely (a == 2))--------------------------if (likely (a == 2))

      a++;

   else

      a--;

   printf ("%d\n", a);

   return 0;

}

使用gcc xxx.c -o xxx -O2 -g编译。

通过gdb xxxx -q，然后disassemble main可以看出两者区别，左边是unlikely，右边是likely。

再来通过objdump -S xxx看一下结果。

unlikely反汇编结果如下：

Disassembly of section .text:

00000000004004b0 <main>:

#define likely(x)    __builtin_expect(!!(x), 1)

#define unlikely(x)  __builtin_expect(!!(x), 0)

int main(char *argv[], int argc)

{

  4004b0:    48 83 ec 08              sub    $0x8,%rsp

   int a;

   /* Get the value from somewhere GCC can't optimize */

   a = atoi (argv[1]);

  4004b4:    48 8b 7f 08              mov    0x8(%rdi),%rdi

  4004b8:    31 c0                    xor    %eax,%eax

  4004ba:    e8 e1 ff ff ff           callq  4004a0 <atoi@plt>

   if (unlikely (a == 2))

  4004bf:    83 f8 02                 cmp    $0x2,%eax

  4004c2:    74 1b                    je     4004df <main+0x2f>--------------------如果cmp返回的结果是等于，就跳转到0x4004df地址，也即a++。

      a++;

   else

      a--;

  4004c4:    8d 50 ff                 lea    -0x1(%rax),%edx-----------------------不跳转的情况下，顺序执行a--这条指令。这种情况不需要跳转，一直到retq结束。

}

__fortify_function int

printf (const char *__restrict __fmt, ...)

{

  return __printf_chk (__USE_FORTIFY_LEVEL - 1, __fmt, __va_arg_pack ());

  4004c7:    be 54 06 40 00           mov    $0x400654,%esi-----------------------printf也是接着a--这条语句，也不需要跳转。

  4004cc:    bf 01 00 00 00           mov    $0x1,%edi

  4004d1:    31 c0                    xor    %eax,%eax

  4004d3:    e8 b8 ff ff ff           callq  400490 <__printf_chk@plt>

   printf ("%d\n", a);

   return 0;

}

  4004d8:    31 c0                    xor    %eax,%eax

  4004da:    48 83 c4 08              add    $0x8,%rsp

  4004de:    c3                       retq   

   /* Get the value from somewhere GCC can't optimize */

   a = atoi (argv[1]);

   if (unlikely (a == 2))

      a++;

  4004df:    ba 03 00 00 00           mov    $0x3,%edx----------------------------------对应a++这句指令。

  4004e4:    eb e1                    jmp    4004c7 <main+0x17>-------------------------跳转到printf这条指令，这种情况跳转了两次。

likely反汇编结果如下：

00000000004004b0 <main>:

#define likely(x)    __builtin_expect(!!(x), 1)

#define unlikely(x)  __builtin_expect(!!(x), 0)

int main(char *argv[], int argc)

{

  4004b0:    48 83 ec 08              sub    $0x8,%rsp

   int a;

   /* Get the value from somewhere GCC can't optimize */

   a = atoi (argv[1]);

  4004b4:    48 8b 7f 08              mov    0x8(%rdi),%rdi

  4004b8:    31 c0                    xor    %eax,%eax

  4004ba:    e8 e1 ff ff ff           callq  4004a0 <atoi@plt>

   if (likely (a == 2))

  4004bf:    83 f8 02                 cmp    $0x2,%eax

  4004c2:    75 1d                    jne    4004e1 <main+0x31>------------------不等于就跳转到a--，预测是等于2的情况。所以紧接的语句是a++。

      a++;

  4004c4:    ba 03 00 00 00           mov    $0x3,%edx---------------------------a++对应的指令。

}

__fortify_function int

printf (const char *__restrict __fmt, ...)

{

  return __printf_chk (__USE_FORTIFY_LEVEL - 1, __fmt, __va_arg_pack ());

  4004c9:    be 54 06 40 00           mov    $0x400654,%esi----------------------紧接着的是printf知道retq结束。

  4004ce:    bf 01 00 00 00           mov    $0x1,%edi

  4004d3:    31 c0                    xor    %eax,%eax

  4004d5:    e8 b6 ff ff ff           callq  400490 <__printf_chk@plt>

      a--;

   printf ("%d\n", a);

   return 0;

}

  4004da:    31 c0                    xor    %eax,%eax

  4004dc:    48 83 c4 08              add    $0x8,%rsp

  4004e0:    c3                       retq

   a = atoi (argv[1]);

   if (likely (a == 2))

      a++;

   else

      a--;

  4004e1:    8d 50 ff                 lea    -0x1(%rax),%edx---------------------在cmp不等于情况下，跳转到此处。

  4004e4:    eb e3                    jmp    4004c9 <main+0x19>------------------a--之后再跳转回printf，两次跳转。

3.总结

如上汇编分析，__builtin_expect()的使用可以降低分置于句的跳转，按顺序执行，来减小对指令流水的刷新，从而加快程序的执行。

当预测a最有可能是2时，a++的指令紧接着判断语句，顺序执行的可能性很大。

当预测a最不可能是2是，a--的指令紧接着判断语句，a--被执行的可能性最大。

参考文档：

1. likely() and unlikely()

2. linux kernel中likely和unlikely宏的机制分析

5. 内存屏障barrier()和preempt_disable()

联系方式:arnoldlu@qq.com

Linux内核编程、调试技巧小集【转】的更多相关文章

Linux内核编程规范与代码风格
source: https://www.kernel.org/doc/html/latest/process/coding-style.html translated by trav, travmym ...
初探linux内核编程，参数传递以及模块间函数调用
一.前言我们一起从3个小例子来体验一下linux内核编程.如下: 1.内核编程之hello world 2.模块参数传递 3.模块间 ...
Linux内核编程-0：来自内核的 HelloWorld
Linux内核编程一直是我很想掌握的一个技能.如果问我为什么,我也说不上来. 也许是希望有一天自己的ID也出现在内核开发组的邮件列表里?或是内核发行文件的CREDITS文件上? 也许是吧.其实更多的, ...
Linux内核编程、调试技巧小集
1. 内核中通过lookup_symbol_name获取函数名称内核中很多结构体成员是函数,有时可能比较复杂不知道具体使用哪一个函数.这是可以通过lookup_symbol_name来获取符号表名称 ...
linux内核编程笔记【原创】
以下为本人学习笔记,如有转载请注明出处,谢谢 DEFINE_MUTEX(buzzer_mutex); mutex_lock(&buzzer_mutex); mutex_unlock(& ...
宋宝华： Linux内核编程广泛使用的前向声明(Forward Declaration)
本文系转载,著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 作者:宋宝华来源: 微信公众号linux阅码场(id: linuxdev) 前向声明编程定律先强调一点:在一切可 ...
linux内核编程入门 hello world
注意: Makefile 文件的命名注意M需要大写,否则会报错. 在Makefile文件中make命令前应为tab制表符. 下文转载至:https://blog.csdn.net/bingqing07 ...
linux内核编程入门--系统调用监控文件访问
参考的资料: hello world https://www.cnblogs.com/bitor/p/9608725.html linux内核监控模块--系统调用的截获 https://www. ...
linux 内核态调试函数BUG_ON()[转]
一些内核调用可以用来方便标记bug,提供断言并输出信息.最常用的两个是BUG()和BUG_ON(). 当被调用的时候,它们会引发oops,导致栈的回溯和错误信息的打印.为什么这些声明会导致 oops跟 ...

随机推荐

高阶JS---函数柯里化
什么是函数柯里化? 百度百科: 在计算机科学中,柯里化(Currying)是把接受多个参数的函数变换成接受一个单一参数(最初函数的第一个参数)的函数,并且返回接受余下的参数且返回结果的新函数的技术.通 ...
字典与json转化
json.dumps(字典) #转成json格式 json.loads(json格式) #转成字典格式
boostrap --- 弹窗modal的使用
<input id="btntext" type="button" value="添加文本组件" data-toggle=" ...
PyQt5发布技巧：指定插件（plugins）路径
一般来说,发布后的应用程序要能正常使用必须设置插件路径的环境变量: cmd脚本: wmic ENVIRONMENT create name="QT_QPA_PLATFORM_PLUGIN_P ...
A1029 Median (25 分)
一.技术总结最开始的想法是直接用一个vector容器,装下所有的元素,然后再使用sort()函数排序一下,再取出中值,岂不完美可是失败了,不知道是容器问题还是什么问题,就是编译没有报错,最后总是感觉 ...
Linux宝塔安装步骤
首先:先运行 X shell 一:输入命令 Centos安装命令(一般都用这个): yum install -y wget && wget -O install.sh http://d ...
Loj #2553. 「CTSC2018」暴力写挂
Loj #2553. 「CTSC2018」暴力写挂题目描述 temporaryDO 是一个很菜的 OIer .在 4 月,他在省队选拔赛的考场上见到了<林克卡特树>一题,其中 \(k = ...
匿名函数和for_each用法
匿名函数,C++11的 for_each 用法 #include <iostream> #include <algorithm> #include "testClas ...
微信小程序跳转页面时参数过长导致参数丢失
问题描述: 微信小程序:跳转页面时传参,参数过长导致参数丢失跳转到文章详情页时,使用的文章链接e.currentTarget.dataset.id过长导致参数丢失 handleClickArticl ...
简明了解apply()和call()
apply()和call()都是ES6语法的,并且都是函数的方法. function foo() { alert(this.name) } var obj = { name: '小明' } foo() ...

Linux内核编程、调试技巧小集【转】

1. 内核中通过lookup_symbol_name获取函数名称

2. 通过__builtin_return_address获取调用者函数地址

3. 基于HW Breakpoints的调试

4. likely和unlikely机制

5. 内存屏障barrier()和preempt_disable()

Linux内核编程、调试技巧小集【转】的更多相关文章

随机推荐

热门专题