游戏通常会包含各种各样的功能,如战斗系统、UI渲染、经济系统、生产系统等,每个系统又包含各式各样子功能,如伤害判定、施法、使用道具、角色移动、玩家之间交易等等。这些游戏功能在代码实现中往往少不了条件判断(如伤害判定)、循环(遍历物品列表,播放游戏动画)等。

在逆向过程中如果可以从汇编语言识别出对应的语法结构,在分析过程中将汇编代码转换为C语言语法结构,可以帮助对程序执行流程的理解。

下面分别介绍最常见的逻辑语法结构:

a) if...else

b) switch...case

c) for、while

注:文中使用的反汇编工具为IDA

一、 if...else

汇编代码:

if...else结构比较固定,通常包含cmp指令、jcc指令以及满足条件后执行的指令块。

if...else结构可以串联,串联后的if...else有明显的代码块边界,逆向工具通常可以将代码块标识出来(图中虚线)。

二、 switch...case

  1. 一个简单switch...case

  

汇编代码:

上图显示了switch...case基本的结构:a) 跳转表达式;b) 分支代码;c) 跳转表

a) 跳转表达式

其中loc_401235代码块对应switch...case中default分支。

当nGameEvent > 4时,跳转到loc_401235代码块,即default分支。

当nGameEvent <= 4时,根据跳转表达式进行跳转:

jmp     ds:off_40123C[nGameEvent*4]

其中off_40123C为跳转表地址,跳转表中每一项代表一个32位地址(4个字节),当nGameEvent为0按第一项地址跳转,当nGameEvent为1按第二项地址跳转,依次类推。

b) 分支代码

各个分支的处理逻辑都在这里,示例代码中仅仅简单的调用对应函数。
(PS:这里用jmp而不用call是编译器优化的结果)

c) 跳转表

跳转表实际是一个地址数组,存放了每个跳转分支的地址(32位绝对地址),当nGameEvent为0时,跳转表达式读取数组中第一项数据(0x0040121C),即

.text:0040121C E9 8F FF FF+     jmp     ?DoLogin@@YAXXZ

调用DoLogin函数。

(PS: 实际运行时,由于随机化基址,从调试器看到的跳转表内容可能与静态分析时不同,这是重定位引起的,关于重定位的原理可以参考相关文档,这里不再详述)

  1. 不连续的switch...case

上面的示例中case的值是连续的,因此跳转表比较规则。在实际使用中可能会遇到不规则的case值,如下图:

汇编代码:

上面的代码有两个特点:

  1. 最小case值非0
    上图中最小case值为3,为了不浪费跳转表空间,编译器会将索引值减去3保证最小的case值对应跳转表中的第一项。

  2.case值不连续
  编译器会在跳转表间隔中插入default跳转,保证逻辑正确。(以空间换取时间)

  3.双重跳转表

汇编代码:

相对于前一个示例,此处case值间隔更大。如果按照之前的方法,跳转表的大小需要(110-30 + 1)* 4 = 324字节,占用内存空间大。

编译器为了节省空间,使用了双重跳转:跳转表、间接跳转表。其中跳转表与之前介绍的跳转表一致,而间接跳转表保存的不是分支地址,而是索引值,指向跳转表中的索引。

跳转表:

间接跳转表:

在进入switch...case时,先算根据间接跳转表获得索引号,再根据索引号查找跳转表,获取实际分支地址。

使用双重跳转表后,实际占用空间:5*4 +(110 – 30 + 1)= 101字节,大大减少空间占用。

  1. swtich...case退化

当case值间隔过大,使用跳转表、双重跳转表消耗的空间太大,编译器会将switch...case退化为if...else,如下图:

汇编代码:

这里没有跳转表结构,只剩下cmp/jcc指令,可见编译器已经将swtich...case转换为等价的if...else。但在转换过程中,编译还是做了力所能及的优化:通过二叉查找法加快跳转分支的查找。

  1. 嵌套switch...case

汇编代码:

可以看出嵌套的switch...case结构在汇编代码上是相对独立的,外层和内层switch结构有各自的跳转表。

外层跳转表:

内存跳转表(双重跳转表):

根据跳转表中的地址项,也可以清楚的区分外层和内层的跳转分支。

三、 循环语句

a) for循环

汇编代码:

其中nop dword ptr[eax+00h] 为指令对齐,没有实际意义。循环的汇编实现为:

b) while循环

汇编代码:

其中nop dword ptr[eax+eax+00h] 为指令对齐,没有实际意义。循环的汇编实现为:

从上面可以看出,for和while结构的汇编实现几乎一摸一样,仅仅是使用的寄存器有些区别。实际逆向过程中将循环映射为for或者while结构都是可以的。同时还可以看出,循环有个明显的特征:往回跳转(向地址小的方向跳转),大部分情况下遇到往回跳转的指令就是循环,极少数如编译器代码结构优化生成的往回跳转不是循环除外。

四、 总结

语法结构对应的汇编代码与编译器有很大关系,同一份源代码不同编译器生成的汇编代码结构不一样;即使是同一个编译器,不同的编译选项生成的汇编代码结构也不尽相同。需要在逆向过程中慢慢熟悉编译器的特性。

*转载请注明来自游戏安全实验室(GSLAB.QQ.COM)

C语言与汇编语言对照分析的更多相关文章

  1. 浅谈单片机中C语言与汇编语言的转换

    做了一单片机设计,要用C语言与汇编语言同时实现,现将这次设计的感受和收获,还有遇到的问题写下,欢迎感兴趣的朋友交流想法,提出建议. 单片机设计:基于51单片机的99码表设计 软件环境:Proteus8 ...

  2. 关于C语言和汇编语言相互嵌套调用

    1.C嵌套汇编 首先说一下关于GCC编译嵌有汇编语言的c语言吧,GCC编译的汇编语言不是我们上课时学的Intel x86汇编,而是AT&T汇编,两者的区别可以查看<Gcc使用的内嵌汇编语 ...

  3. keil C语言与汇编语言混合编程

    C与汇编混合编程主要有以下几种:(1)C语言中嵌入汇编(2)无参数传递的函数调用(3)有参数传递的函数调用 一.C语言中嵌入汇编 1.在 C 文件中要嵌入汇编代码片以如下方式加入汇编代码: #prag ...

  4. 单片机C 语言与汇编语言混合编程

    在单片机应用系统设计中,过去主要采用汇编语言开发程序. 汇编语言编写的程序对单片机硬件操作很方便,编写的程序代码短,效率高,但系统设计的周期长,可读性和可移植性都很差.C语言程序开发是近年来单片机系统 ...

  5. C语言与汇编语言相互调用原理以及实例

    C语言与汇编语言相互调用原理以及实例 1.原理 其实不管是C语言还是汇编语言想要执行都是最终编译链接成为二进制文件. 这里一定要明确编译和链接是两个步骤,生成的文件格式也是不一样的. 编译生成的文件是 ...

  6. C语言与汇编语言混合编程实验

    混合编程方法: 模块链接法 汇编指令嵌入法 1: 模块链接法则 模块链接法是指分别用汇编语言和C语言实现独立的模块(或子程序),再用链接程序把各模块生成的obj文件连接成一个可执行程序. 1:C语言调 ...

  7. c语言快速入门1

    如果你想快速入门计算机,可以参考我的上一篇帖子,先了解一些必备的软知识,然后再来进行语言的快速入门 计算机入门基础知识 目录 1.1.1    计算机与程序 现代计算机可以自动完成计算任务 程序就是按 ...

  8. 如何用C语言编写病毒‘

    怎样用C语言编写病毒在分析病毒机理的基础上,用C语言写了一个小病毒作为实例,用TURBOC2.0实现.[Abstract] This paper introduce the charateristic ...

  9. 第九章 C语言在嵌入式中的应用

    上章回顾 编码的规范和程序版式 版权管理和申明 头文件结构和作用 程序命名 程序注释和代码布局规范 assert断言函数的应用 与0或NULL值的比较 内存的分配和释放细节,避免内存泄露 常量特性 g ...

随机推荐

  1. 3dContactPointAnnotationTool开发日志(二八)

      师姐说物体间不能有穿透,于是我试了下给物体加rigidbody和meshCollider   然后就报错:   说是用meshCollider要么去掉刚体要么就把刚体设置为iskinematic. ...

  2. phaser入手

    做phaser小程序,必须先把环境弄好 发现怎么导入都无济于事. 最后决定亲自操刀,在原代码中,引入全局变量.

  3. Beats Solo3 Wireless 无法链接 MacBook pro

    Beats Solo3 Wireless 无法链接 MacBook pro 问题解决了,原来只要长按耳机的开关按钮就能被识别到了,貌似需要5秒钟不松手. https://bbs.feng.com/re ...

  4. 关于ADO一个容易被忽视的问题!UpdateBatch [问题点数:0分]

    这是一个常见但容易被忽视的问题,旧贴有问及但没答案,因此提高分数.相信大家常这样使用Cache模式:ADOConnection1.BeginTrans;Try ADODataSet1.UpdateBa ...

  5. 【bzoj3560】DZY Loves Math V 欧拉函数

    题目描述 给定n个正整数a1,a2,…,an,求 的值(答案模10^9+7). 输入 第一行一个正整数n. 接下来n行,每行一个正整数,分别为a1,a2,…,an. 输出 仅一行答案. 样例输入 3 ...

  6. 洛谷 P2057 善意的投票(网络流最小割)

    P2057 善意的投票 题目描述 幼儿园里有n个小朋友打算通过投票来决定睡不睡午觉.对他们来说,这个问题并不是很重要,于是他们决定发扬谦让精神.虽然每个人都有自己的主见,但是为了照顾一下自己朋友的想法 ...

  7. c++字符串排序

    在主函数中输入10个等长的字符串,用另一函数对它们排序.然后在主函数输出这10个已排好序的字符串. 用两种方法完成. 方法一:用二维数组做函数参数: 方法二:用指向一维数组的指针做函数参数. 方法一: ...

  8. 【线段树】【P2572】【SCOI2010】序列操作

    Description lxhgww最近收到了一个01序列,序列里面包含了n个数,这些数要么是0,要么是1,现在对于这个序列有五种变换操作和询问操作: 0 a b 把[a, b]区间内的所有数全变成0 ...

  9. Oracle中rank() over, dense_rank(), row_number() 的区别

    摘自:http://www.linuxidc.com/Linux/2015-04/116349.htm Oracle 中 rank() over, dense_rank(), row_number() ...

  10. 使用Masonry在UIScrollView内布局

    理论分析 首先,我们知道Autolayout改变了传统的以frame为主的布局思想.它其实是一种相对布局,核心思想是视图与视图之间的位置关系.比如,我们可以根据矩形的起始横坐标.纵坐标.长和宽这四个变 ...