使用Bochs学习硬件原理

什么是Bochs？

简单地说，Bochs是一款仿真软件，可以用软件的方式模拟硬件的工作。同类软件有Qemu，仿真软件与虚拟机(hypervisor)还不完全相同，仿真软件是完全软件模拟硬件，而虚拟机软件(比如Vmware, VirtualBox)是利用主机的硬件进行工作。

Bochs的主页地址：http://bochs.sourceforge.net/

Bochs软件的下载地址：http://sourceforge.net/projects/bochs/files/bochs/

Bochs的使用

Bochs的使用依赖配置文件，通过配置文件指定不同的硬件，以及指定存储介质的映像文件(BIOS的ROM文件、磁盘文件等)。

在Windows环境下安装过Bochs后，在配置文件上右键菜单会出现Run, Debug的菜单选项，从而启动运行或者调试。

Bochs调试器

Bochs的调试器命令与gdb命令十分相似，但是更加强大。简单介绍几条命令的使用：

   1: #流程控制

   2: c             #continue, 继续执行

   3: s [count]     #step, 单步执行count次

   4: #断点

   5: vb seg:off    #设置逻辑地址断点

   6: lb addr       #设置物理地址断点

   7: info break    #查看断点

   8: d n           #删除断点

   9: #查看内存

  10: x/n[bhwg][xduotc] #查看内存

  11: [bhwg]        #显示单元大小，分别代表byte, half, word, giant word

  12: [xduotc]      #显示格式，分别代表hex, dec, unsigned, octal, binary, char

  13: #查看寄存器

  14: r             #查看基本寄存器

  15: sreg          #查看段寄存器

更多的命令，请输入help查看。

在Windows环境下编译Bochs源代码

首先说一下编译源码的动机，当我们安装了Bochs之后就已经可以使用它来运行或者调试一个被仿真的系统了。这种调试类似于gdb，调试目标是运行在Bochs之上的系统。

然而，我们知道，既然Bochs是一个开源的项目，以通过软件的方式仿真了硬件系统，那么我们就可以通过查看Bochs的源码来学习相关的硬件知识(比如Intel体系结构，BIOS，DMA等)了。

从上面的下载地址下载一份源代码，解压后，能看到vs2008/bochs.sln文件，从而打开Visual Studio项目进行编译。

默认配置选项中没有包含对bochsdbg的支持，因此我们需要重新运行configure程序，悲剧的是configure是Linux下面的程序，我们可以通过以下方式来达到同样的目的：

1. 安装mingw，以及msys，将msys/bin目录添加到系统PATH环境变量中；
2. 修改源码目录下的.conf.win32_vcpp文件，添加
```
   1: --enable-debugger --enable-disasm
```
3. 打开Visual Studio的Prompt命令行，cd到源码目录下，运行
```
   1: bash.exe .conf.win32_vcpp
```

完成以上步骤之后，就可以编译出具有debug功能的Bochs可执行程序了。

Bochs是怎样处理调试命令的？

我们可以在位置上设置断点：

   1: void bx_dbg_user_input_loop(void) /*dbg_main.cc*/

然后在调试窗口中输入命令

   1: r

程序会在这两个断点处中断，这个bx_dbg_user_input_loop函数就是不断接收调试命令的循环体，它会把接收到的调试命令经过lex&yacc框架进行解析，然后调用到相应的handler来处理调试请求。

这些handler都在debug.h文件中进行声明，比如处理r命令的handler定义为

   1: void bx_dbg_info_registers_command(int);

在该函数的定义处设置断点，我们就能够了解到Bochs是怎样处理r这样的调试请求的。

通过跟踪几个调试命令的实现，我们发现了三个重要的全局变量：

   1: BOCHSAPI BX_CPU_C bx_cpu;

   2: BOCHSAPI BX_MEM_C bx_mem;

   3: bx_devices_c bx_devices;

分别保存着用来描述CPU、内存和外部设备的数据结构。

指令IN和OUT是如何处理的？

由于我们希望通过Bochs来学习硬件相关的内容，所以会对IN和OUT这两条指令很感兴趣，因为CPU就是通过这两条指令与外部设备之间进行协调工作的。

我们通过尝试，找到了下面这个函数

   1: /*

   2:  * Write a byte of data to the IO memory address space.

   3:  */

4:

   5:   void BX_CPP_AttrRegparmN(3)

   6: bx_devices_c::outp(Bit16u addr, Bit32u value, unsigned io_len)

bx_devices会在内部维护一个外设端口对应的读和写的handler的数组

   1: struct io_handler_struct **read_port_to_handler;

   2: struct io_handler_struct **write_port_to_handler;

这是两个二维指针数组，用端口号作为下标可以找到某个端口对应的读写处理函数，默认会把每个handler都设置成io_write_handlers

   1: /* set handlers to the default one */

   2:  for (i=0; i < PORTS; i++) {

   3:    read_port_to_handler[i] = &io_read_handlers;

   4:    write_port_to_handler[i] = &io_write_handlers;

   5:  }

通过查找函数

   1: #define DEV_register_ioread_handler(b,c,d,e,f) bx_devices.register_io_read_handler(b,c,d,e,f)

   2: #define DEV_register_iowrite_handler(b,c,d,e,f) bx_devices.register_io_write_handler(b,c,d,e,f)

我们可以找到哪些设备支持了自己的IO读写功能，以及其对应的handler。

以DMA为例，我们可以找到如下的注册handler代码

   1: // 0000..000F

   2: for (i=0x0000; i<=0x000F; i++) {

   3:   DEV_register_ioread_handler(this, read_handler, i, "DMA controller", 1);

   4:   DEV_register_iowrite_handler(this, write_handler, i, "DMA controller", 3);

   5: }

6:

   7: // 00080..008F

   8: for (i=0x0080; i<=0x008F; i++) {

   9:   DEV_register_ioread_handler(this, read_handler, i, "DMA controller", 1);

  10:   DEV_register_iowrite_handler(this, write_handler, i, "DMA controller", 3);

  11: }

12:

  13: // 000C0..00DE

  14: for (i=0x00C0; i<=0x00DE; i+=2) {

  15:   DEV_register_ioread_handler(this, read_handler, i, "DMA controller", 1);

  16:   DEV_register_iowrite_handler(this, write_handler, i, "DMA controller", 3);

  17: }

只要在DMA模块的read_handler和write_handler处理设置断点，我们就可以动态地调试DMA的处理逻辑了。

经过了以上的准备工作之后，我们就可以开始调试一个具体的系统了。我是以DLX为目标进行调试的，在调试过程中，我们可以一步一步地了解到从计算机加电后执行BIOS开机自检程序，到加载MBR，通过LILO一步一步地把Linux操作系统启动起来的全过程，一个奇妙的旅程即将开始！

有人已经这样做了，并且根据Bochs的代码，出了一本书：http://www.mouseos.com/books/x86-64/index.html