Linux内核调试 - 一般人儿我都不告诉他（一）【转】

转自：http://www.cnblogs.com/armlinux/archive/2011/04/14/2396821.html

悄悄地进入Linux内核调试(一)

本文基址：http://blog.csdn.net/cugxueyu/archive/2007/12/21/1957740.aspx

※ 调试工作艰苦，是内核级开发区别于用户级开发的一个显著特点。
※ 驾驭内核调试的能力，很大程度上取决于经验和对整个操作系统的把握。

一、调试前的准备
   内核级bug具有行为不可靠，定义不清晰或者说很难再现的诸多特定，为内核级的bug跟踪和调试带来了很大的困难。
   ※ 对于一些定义不清楚地bug，问题的关键就是找到bug的源头，很多时候，当你精确地重现一个bug的时候，你就离成功不远了。

二、内核中的bug
   从隐藏在源代码中的错误到展现在目击者面前的bug，其发作往往是一系列连锁反应的事件才可能出发的。
   虽然内核调试有一定的困难，但是通过你的努力和理解，说不定你会喜欢上这样的挑战。

三、printk( )
内核提供的格式化打印函数。
1、printk函数的健壮性
    健壮性是printk最容易被接受的一个特质，几乎在任何地方，任何时候内核都可以调用它（中断上下文、进程上下文、持有锁时、多处理器处理时等）。
   ※ 在系统启动过程中，终端初始化之前，在某些地方是不能调用的。

2、记录等级
    printk函数可以指定一个记录级别，内核根据这个级别来判断是否在终端上打印消息。
    记录级别定义在<linux/kernel.h>中：
     #define    KERN_EMERG    "<0>"   /* system is unusable */
#define    KERN_ALERT    "<1>"    /* action must be taken immediately    */
#define    KERN_CRIT        "<2>"    /* critical conditions */
#define    KERN_ERR        "<3>"    /* error conditions    */
#define    KERN_WARNING    "<4>"    /* warning conditions */
#define    KERN_NOTICE   "<5>"    /* normal but significant condition    */
#define    KERN_INFO        "<6>"    /* informational */
#define    KERN_DEBUG    "<7>"   /* debug-level messages    */

调用方式：printk(KER_DEBUG “This is a debug notice!/n”);
内核用这个指定的纪录等级和当前终端的纪录等级console_loglevel比较，来决定是不是向终端打印。

关于< linux/kernel.h >的console_loglevel 定义：
#define console_loglevel (console_printk[0])
<printk.c>定义：
int console_printk[4] = {
           DEFAULT_CONSOLE_LOGLEVEL, /* console_loglevel */
           DEFAULT_MESSAGE_LOGLEVEL, /* default_message_loglevel */
           MINIMUM_CONSOLE_LOGLEVEL, /* minimum_console_loglevel */
           DEFAULT_CONSOLE_LOGLEVEL, /* default_console_loglevel */
};

3、记录缓冲区
   内核消息都被保存在一个LOG_BUF_LEN大小的环形队列中。
   关于LOG_BUF_LEN定义：
   #define __LOG_BUF_LEN     (1 << CONFIG_LOG_BUF_SHIFT)
   ※ 变量CONFIG_LOG_BUF_SHIFT在内核编译时由配置文件定义，对于i386平台，其值定义如下（在linux26/arch/i386/defconfig中）：
   CONFIG_LOG_BUF_SHIFT=18

   记录缓冲区操作：
   ①、消息被读出到用户空间时，此消息就会从环形队列中删除。
   ②、当消息缓冲区满时，如果再有printk()调用时，新消息将覆盖队列中的老消息。
   ③、在读写环形队列时，同步问题很容易得到解决。
   ※ 这个纪录缓冲区之所以称为环形，是因为它的读写都是按照环形队列的方式进行操作的。

4、syslogd和klogd
   在标准的Linux系统上，用户空间的守护进程klogd从纪录缓冲区中获取内核消息，再通过syslogd守护进程把这些消息保存在系统日志文件中。klogd进程既可以从/proc/kmsg文件中，也可以通过syslog()系统调用读取这些消息。默认情况下，它选择读取/proc方式实现。klogd守护进程在消息缓冲区有新的消息之前，一直处于阻塞状态。一旦有新的内核消息，klogd被唤醒，读出内核消息并进行处理。默认情况下，处理例程就是把内核消息传给syslogd守护进程。
   syslogd守护进程一般把接收到的消息写入/var/log/messages文件中。不过，还是可以通过/etc/syslog.conf文件来进行配置，可以选择其他的输出文件。
图1 X光了此过程：


四、OOPS
OOPS（也称 Panic）消息包含系统错误的细节，如 CPU 寄存器的内容等。是内核告知用户有不幸发生的最常用的方式。
内核只能发布OOPS，这个过程包括向终端上输出错误消息，输出寄存器保存的信息，并输出可供跟踪的回溯线索。通常，发送完OOPS之后，内核会处于一种不稳定的状态。
OOPS的产生有很多可能原因，其中包括内存访问越界或非法的指令等。
※ 作为内核的开发者，必定将会经常处理OOPS。
※ OOPS中包含的重要信息，对所有体系结构的机器都是完全相同的：寄存器上下文和回溯线索（回溯线索显示了导致错误发生的函数调用链）。

1、ksymoops
    在 Linux 中，调试系统崩溃的传统方法是分析在发生崩溃时发送到系统控制台的 Oops 消息。一旦您掌握了细节，就可以将消息发送到 ksymoops 实用程序，它将试图将代码转换为指令并将堆栈值映射到内核符号。
    ※ 如：回溯线索中的地址，会通过ksymoops转化成名称可见的函数名。
    图2X光了格式化 Oops 消息过程：


    ksymoops需要几项内容：Oops 消息输出、来自正在运行的内核的 System.map 文件，还有 /proc/ksyms、vmlinux 和 /proc/modules。
关于如何使用 ksymoops，内核源代码 /usr/src/linux/Documentation/oops-tracing.txt 中或 ksymoops 手册页上有完整的说明可以参考。Ksymoops 反汇编代码部分，指出发生错误的指令，并显示一个跟踪部分表明代码如何被调用。

2、kallsyms
    开发版2.5内核引入了kallsyms特性，它可以通过定义CONFIG_KALLSYMS编译选项启用。该选项可以载入内核镜像所对应的内存地址的符号名称（即函数名），所以内核可以打印解码之后的跟踪线索。相应，解码OOPS也不再需要System.map和ksymoops工具了。另外，
这样做，会使内核变大些，因为地址对应符号名称必须始终驻留在内核所在内存上。
    #cat /proc/kallsyms
     c0100240   T       _stext
     c0100240   t       run_init_process
     c0100240   T      stext
     c0100269   t       init
        …

五、内核调试配置选项
在编译内核的时候，为了方便调试和测试代码，内核提供了许多配置选项。
※ 启用选项例如：
   slab layer debugging（slab层调试选项）、high-memory debugging（高端内存调试选项）、I/O mapping debugging（I/O映射调试选项）、spin-lock debugging（自旋锁调试选项）、stack-overflow checking（栈溢出检查选项）和sleep-inside-spinlock checking（自旋锁内睡眠选项）等。

1、调试原子操作
从内核2.5开发，为了检查各类由原子操作引发的问题，内核提供了极佳的工具。
内核提供了一个原子操作计数器，它可以配置成，一旦在原子操作过程中，进城进入睡眠或者做了一些可能引起睡眠的操作，就打印警告信息并提供追踪线索。
所以，包括在使用锁的时候调用schedule()，正使用锁的时候以阻塞方式请求分配内存等，各种潜在的bug都能够被探测到。
下面这些选项可以最大限度地利用该特性：
CONFIG_PREEMPT = y
CONFIG_DEBUG_KERNEL = y
CONFIG_KLLSYMS = y
CONFIG_SPINLOCK_SLEEP = y

六、引发bug并打印信息
1、一些内核调用可以用来方便标记bug，提供断言并输出信息。最常用的两个是BUG()和BUG_ON()。
定义在<include/asm-generic>中：

#ifndef HAVE_ARCH_BUG
#define BUG() do {
printk("BUG: failure at %s:%d/%s()! ", __FILE__, __LINE__, __FUNCTION__);
panic("BUG!"); /* 引发更严重的错误，不但打印错误消息，而且整个系统业会挂起 */
} while (0)
#endif

#ifndef HAVE_ARCH_BUG_ON
    #define BUG_ON(condition) do { if (unlikely(condition)) BUG(); } while(0)
#endif

当调用这两个宏的时候，它们会引发OOPS，导致栈的回溯和错误消息的打印。
※ 可以把这两个调用当作断言使用，如：BUG_ON(bad_thing);

2、dump_stack()
    有些时候，只需要在终端上打印一下栈的回溯信息来帮助你调试。这时可以使用dump_stack()。这个函数只在终端上打印寄存器上下文和函数的跟踪线索。
    if (!debug_check) {
        printk(KERN_DEBUG “provide some information…/n”);
        dump_stack();
    }
备注：大部分内容引自《Linux内核设计与实现 - 第2版》

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/cugxueyu/archive/2007/12/21/1957740.aspx

Linux内核调试 - 一般人儿我都不告诉他（一）【转】的更多相关文章

Linux内核调试方法总结【转】
转自:http://my.oschina.net/fgq611/blog/113249 内核开发比用户空间开发更难的一个因素就是内核调试艰难.内核错误往往会导致系统宕机,很难保留出错时的现场.调试内核 ...
linux内核调试指南
linux内核调试指南一些前言作者前言知识从哪里来为什么撰写本文档为什么需要汇编级调试 ***第一部分:基础知识*** 总纲:内核世界的陷阱源码阅读的陷阱代码调试的陷阱原理理解的陷阱 ...
【转】Linux内核调试方法总结
目录[-] 一调试前的准备二内核中的bug 三内核调试配置选项 1 内核配置 2 调试原子操作四引发bug并打印信息 1 BUG()和BUG_ON() 2 dump_sta ...
Linux内核调试方法总结
Linux内核调试方法总结一调试前的准备二内核中的bug 三内核调试配置选项 1 内核配置 2 调试原子操作四引发bug并打印信息 1 BUG()和BUG_ON() 2 ...
Linux内核调试方法【转】
转自:http://www.cnblogs.com/shineshqw/articles/2359114.html kdb:只能在汇编代码级进行调试: 优点是不需要两台机器进行调试. gdb:在调试模 ...
Linux内核调试技术——jprobe使用与实现
前一篇博文介绍了kprobes的原理与kprobe的使用与实现方式,本文介绍kprobes中的另外一种探測技术jprobe.它基于kprobe实现,不能在函数的任何位置插入探測点,仅仅能在函数的入口处 ...
Linux Kernel - Debug Guide (Linux内核调试指南 )
http://blog.csdn.net/blizmax6/article/details/6747601 linux内核调试指南一些前言作者前言知识从哪里来为什么撰写本文档为什么需要汇编级 ...
Linux内核调试的方式以及工具集锦【转】
转自:https://blog.csdn.net/gatieme/article/details/68948080 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原 ...
Linux内核调试的方式以及工具集锦
原文:https://blog.csdn.net/gatieme/article/details/68948080 CSDN GitHubLinux内核调试的方式以及工具集锦 LDD-LinuxDev ...

随机推荐

13 Zabbix Item类型之Zabbix ODBC类型
点击返回:自学Zabbix之路 13 Zabbix Item类型之Zabbix ODBC类型 ODBC是C语言开发的.用于访问数据库的中间件接口 . zabbix支持查询任何ODBC支持的数据库.za ...
【ZJOI 2019】麻将（dp of dp）
这是我第一次写$dp \; of \; dp$,大致思路参考了xyx的做法,可能有些地方不太一样,但也许会详细一点. 考虑给你一副牌,如何判断这副牌是否是胡的. 容易发现相同的顺子不会选三个以上,于是 ...
django MTV架构下的网站开发步骤
1.需求分析必不可少,一定要具体列出本次网站项目所要实现的目标,可能包括简单的页面草图与功能方块图等. 2.数据库设计. 3.了解网站的每一个页面,并设计网页模板(.html)文件 4.使用virtu ...
JAVA8给我带了什么——并行流和接口新功能
流,确定是笔者内心很向往的天堂,有他之后JAVA在处理数据就变更加的灵动.加上lambda表达不喜欢都不行.JAVA8也为流在提供另一个功能——并行流.即是有并行流,那么是不是也有顺序流.没有错.我前 ...
A1016. Phone Bills
A long-distance telephone company charges its customers by the following rules: Making a long-distan ...
mongodb集群故障转移实践
简介 NOSQL有这些优势: 大数据量,可以通过廉价服务器存储大量的数据,轻松摆脱传统mysql单表存储量级限制. 高扩展性,Nosql去掉了关系数据库的关系型特性,很容易横向扩展,摆脱了以往老是纵向 ...
Sublime Text3—Code Snippets(自定义代码片段)
摘要程序员总是会不断的重复写一些简单的代码片段,为了提高编码效率,我们可以把经常用到的代码保存起来再调用. 平时用sublime安装各种插件,使用Tab键快速补全,便是snippets(可译为代码片 ...
cookies 不同端口是可以共享的
cookies 不同端口,是跨域吗? 我部署了两套系统在同一个ip上!8080,和8090! 这样.cookies,算跨域吗? 两套系统都记录了都有一个 historyItem的key的cookies ...
ElasticSearch 索引整体迁移方案
以下都是经过实战验证过的!!! [前提]使用相同的版本 ElasticSearch-5.5.1,只不过是在不同的服务器之间且重跑数据相对来说代价比较高,这种情况下就可以使用一下这种方式对索引整体迁移 ...

Linux内核调试 - 一般人儿我都不告诉他（一）【转】

Linux内核调试 - 一般人儿我都不告诉他（一）【转】的更多相关文章

随机推荐

热门专题