写在前面

  此系列是本人一个字一个字码出来的,包括代码实现和效果截图。 如有好的建议,欢迎反馈。码字不易,如果本篇文章有帮助你的,如有闲钱,可以打赏支持我的创作。如想转载,请把我的转载信息附在文章后面,并声明我的个人信息和本人博客地址即可,但必须事先通知我

你如果是从中间插过来看的,请仔细阅读 羽夏壳世界——序 ,方便学习本教程。

概述

  导入表和重定位表是一个比较复杂的结构,导入表相对复杂,当然还有更复杂的资源表,不过这里并不会介绍它。

  导入表是用来做什么的?比如你在写代码的时候,总会调用一些WinAPI,而这些函数都是通过DLL导出的。导入表的作用就是告诉操作系统加载该PE文件的时候需要找哪些DLL,使用了哪些DLL所提供的函数。

  重定位表可能稍微难理解一些,不过如果学习上篇应该就不太难了。我们在介绍ImageBase这个成员的时候,曾说它是PE文件倾向于要加载的地址,但是如果开了基址随机或者是DLL的话通常不会使用该地址,而这个成员就是用来进行重定位的,我们可以看看为什么需要重定位:

  如果执行上述代码,这个push是所谓的死地址,也就是要puts的字符串,如果加载的基址并不是我们所谓的ImageBase,而这个是作为硬编码的一部分的,如果不改变的话,这地址是错误的,如果不进行重定位,就会导致打印的字符串不对甚至报0xC0000005错误,这个就是重定位的意义,我们来看示意图:

  下面我们来介绍导入表和重定位表的结构:

导入表

  在介绍导入表之前,我们先放个示意图:

  导入表相关信息是放到IMAGE_IMPORT_DESCRIPTOR结构体中的,它的结构如下:

typedef struct _IMAGE_IMPORT_DESCRIPTOR {
union {
DWORD Characteristics; // 0 for terminating null import descriptor
DWORD OriginalFirstThunk; // RVA to original unbound IAT (PIMAGE_THUNK_DATA)
} DUMMYUNIONNAME;
DWORD TimeDateStamp; //时间戳
DWORD ForwarderChain; //不使用
DWORD Name; //指向Ascii字符串
DWORD FirstThunk; // RVA to IAT (if bound this IAT has actual addresses)
} IMAGE_IMPORT_DESCRIPTOR;
typedef IMAGE_IMPORT_DESCRIPTOR UNALIGNED *PIMAGE_IMPORT_DESCRIPTOR;

  这结构体一个挨着一个,以空结构体为结尾(内容全为0的IMAGE_IMPORT_DESCRIPTOR)。用一句话概括就是一个IMAGE_IMPORT_DESCRIPTOR不定长数组,通过最后一个是空表示结束。

  OriginalFirstThunk包含指向输入名称表INTRVAINT是一个IMAGE_THUNK_DATA结构的数组,数组中的每个IMAGE_THUNK_DATA结构都指向IMAGE_IMPORT_BY_NAME结构,数组以一个内容为0的IMAGE_THUNK_DATA结构结束。

  TimeDateStamp是一个32位的时间标志,可以忽略。

  ForwarderChain是第1个被转向的API的索引,一般为0,在程序引用一个DLL中的API,而这个API又在引用其他DLLAPI时使用,但这样的情况很少出现。

  Name是DLL名字的指针。它是一个以\0结尾的ASCII字符的RVA地址,该字符串包含输入的DLL名,例如KERNEL32.DLL

  FirstThunk包含指向输入地址表IATRVAIAT是一个IMAGE_THUNK_DATA结构的数组。

  OriginalFirstThunkFirstThunk指向IMAGE_THUNK_DATA数组结构,结构是相似的,它的结构体如下所示:

typedef struct _IMAGE_THUNK_DATA32 {
union {
DWORD ForwarderString; // PBYTE
DWORD Function; // PDWORD
DWORD Ordinal;
DWORD AddressOfData; // PIMAGE_IMPORT_BY_NAME
} u1;
} IMAGE_THUNK_DATA32;
typedef IMAGE_THUNK_DATA32 * PIMAGE_THUNK_DATA32;
typedef struct _IMAGE_THUNK_DATA64 {
union {
ULONGLONG ForwarderString; // PBYTE
ULONGLONG Function; // PDWORD
ULONGLONG Ordinal;
ULONGLONG AddressOfData; // PIMAGE_IMPORT_BY_NAME
} u1;
} IMAGE_THUNK_DATA64;
typedef IMAGE_THUNK_DATA64 * PIMAGE_THUNK_DATA64;

  上面的结构体32位和64位的区别不大,就是成员大小的问题。它是一个共用体的结构体,这个比较复杂,在不同的时刻具有不同的含义。

  当IMAGE_THUNK_DATA值的最高位为1时,表示函数以序号方式输人,这时低31位,或者一个64位可执行文件的低63位,被看成一个函数序号。当双字的最高位为0时,表示函数以字符串类型的函数名方式输入,这时的值是一个RVA,指向一个IMACE_IMPORT_BY_NAME结构。

  下面我们继续介绍IMAGE_IMPORT_BY_NAME,它的结构如下:

typedef struct _IMAGE_IMPORT_BY_NAME {
WORD Hint;
CHAR Name[1];
} IMAGE_IMPORT_BY_NAME, *PIMAGE_IMPORT_BY_NAME;

  Hint是本函数在其所驻留DLL的输出表中的序号。该域被PE装载器用来在DLL的输出表里快速查询函数。该值不是必需的,一些链接器将它设为·。

  Name含有输入函数的函数名。函数名是一个ASCII字符串,以'\0'结尾。注意,这里虽然将Name的大小以字节为单位进行定义,但其实它是一个可变尺寸域,是不定长的。

  为了更好的理解,我们来看一个OriginalFirstThunk指向的结构示意,FirstThunk也是一样的。

  那么IATINT到底有啥区别,我们来看个图:

PE加载前

PE加载后

  可以看出,当PE文件在磁盘的时候,这两个存储的东西是一模一样的,但是被加载后,IAT变为了地址表,而INT被废弃掉,不再使用。

  由于导入表的结构十分复杂,可能你看第一遍该博文的时候可能会犯糊涂,建议使用自己熟悉的编程语言手动解析PE的导入表,当你能够比较轻松的解析它的时候,你就会明白导入表的设计。

  下面我们来看一下在二进制文件中相应的内容:

重定位表

  重定位表的结构相对比较简单,在学习之前请看下面的示意图:

  导入表也是一个不定长数组,用与导入表相同的方式表示结束位置,每一个成员开头描述都是一个IMAGE_BASE_RELOCATION结构:

typedef struct _IMAGE_BASE_RELOCATION {
DWORD VirtualAddress;
DWORD SizeOfBlock;
// WORD TypeOffset[1];
} IMAGE_BASE_RELOCATION;
typedef IMAGE_BASE_RELOCATION UNALIGNED * PIMAGE_BASE_RELOCATION;

  VirtualAddress是指这组重定位数据的开始RVA地址。各重定位项的地址加这个值才是该重定位项的完整RVA地址。

  SizeOFBlock是当前重定位结构的大小。因为VirtualAddressSizeOfBlock的大小都是固定的4字节,所以这个值减8就是TypeOffset数组的大小。

  TypeOffset是一个数组。数组每项大小为2字节,共16位。这16位分为高4位和低12位。高4位代表重定位类型,低12位是重定位地址,它与VirtualAddress相加就是指向PE映像中需要修改的地址数据的指针。

  对于常见的重定位类型,如下所示:

类型 含义
IMAGE_REL_BASED_ABSOLUTE 没有具体含义,只是为了让每个段4字节对齐
IMACE_REL_BASED_HIGHLOW 重定位指向的整个地址都需要修正,实际上大部分情况下都是这样的
IMAGE_REL_BASED_DIR64 出现在64位 PE 文件中,对指向的整个地址进行修正

  基址重定位数据采用类似按页分割的方法组织,是由许多重定位块串接成的,每个块中存放4KB的重定位信息,每个重定位数据块的大小必须以4字节对齐。

  下面我们来看一下一个64位程序的重定位表:

  在二进制文件的位置和内容:

地址转化

  如果想要通过VA得到RVA,这个十分简单:内存地址 – ImageBase

  如果我们向通过RVA得到FOA,那么怎么样呢?首先我们得判断RVA是否位于PE头中,如果是FOA == RVA,因为此时并没有进行内存展开。如果RVA不在的话,我们就得判断RVA位于哪个节。若RVA >= 节.VirtualAddress && RVA <= 节.VirtualAddress +当前节内存对齐后的大小,那么差值 = RVA - 节.VirtualAddress,再加上相应的该节在文件中的FOA,就可以得到了真正的FOA

  如何通过FOA得到RVA呢?这里我就不多说了,原理是一样的,只是判断的东西不太一样,正确答案将会在实现篇进行揭晓。

下一篇

  羽夏壳世界——基础篇小结

羽夏壳世界—— PE 结构(下)的更多相关文章

  1. 羽夏壳世界—— PE 结构(上)

    羽夏壳世界之 PE 结构(上),介绍难度较低的基本 PE 相关结构体.

  2. (五)羽夏看C语言——结构体与类

    写在前面   由于此系列是本人一个字一个字码出来的,包括示例和实验截图.本人非计算机专业,可能对本教程涉及的事物没有了解的足够深入,如有错误,欢迎批评指正. 如有好的建议,欢迎反馈.码字不易,如果本篇 ...

  3. 羽夏 Bash 简明教程(下)

    写在前面   该文章根据 the unix workbench 中的 Bash Programming 进行汉化处理并作出自己的整理,并参考 Bash 脚本教程 和 BashPitfalls 相关内容 ...

  4. (四)羽夏看C语言——循环与跳转

    写在前面   由于此系列是本人一个字一个字码出来的,包括示例和实验截图.本人非计算机专业,可能对本教程涉及的事物没有了解的足够深入,如有错误,欢迎批评指正. 如有好的建议,欢迎反馈.码字不易,如果本篇 ...

  5. 羽夏笔记——PE结构(不包含.Net)

    写在前面   本笔记是由本人独自整理出来的,图片来源于网络.本人非计算机专业,可能对本教程涉及的事物没有了解的足够深入,如有错误,欢迎批评指正. 如有好的建议,欢迎反馈.码字不易,如果本篇文章有帮助你 ...

  6. 羽夏看Linux内核——引导启动(下)

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.如有好的建议,欢迎反馈.码字不易,如果本篇文章有帮助你的,如有闲钱,可以打赏支持我的创作.如想转载,请把我的转载信息附在文章后面,并 ...

  7. 羽夏逆向指引—— Hook

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.可能有错误或者不全面的地方,如有错误,欢迎批评指正,本教程将会长期更新. 如有好的建议,欢迎反馈.码字不易,如果本篇文章有帮助你的, ...

  8. 羽夏看Linux内核——中断与分页相关入门知识

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.如有好的建议,欢迎反馈.码字不易,如果本篇文章有帮助你的,如有闲钱,可以打赏支持我的创作.如想转载,请把我的转载信息附在文章后面,并 ...

  9. 跟羽夏学 Ghidra ——窗口

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.本人非计算机专业,可能对本教程涉及的事物没有了解的足够深入,如有错误,欢迎批评指正. 如有好的建议,欢迎反馈.码字不易,如果本篇文章 ...

  10. (三)羽夏看C语言——进制

    写在前面   由于此系列是本人一个字一个字码出来的,包括示例和实验截图.本人非计算机专业,可能对本教程涉及的事物没有了解的足够深入,如有错误,欢迎批评指正. 如有好的建议,欢迎反馈.码字不易,如果本篇 ...

随机推荐

  1. KingbaseES例程_普通表在线转分区表(基于规则)

    KingbaseES例程_普通表在线转分区表 概述 普通表转分区表,使用视图的替换式规则,以路由方式,实现在线转移数据. 数据准备 /*普通大表*/ create table tab_single a ...

  2. KingbaseES V8R6 运维系列 --单机小版本升级

    ​ 案例说明: 在KingbaseES V8R6版本提供了sys_upgrade的升级工具, 本案例描述了KingbaseES V8R6单机环境下数据库的小版本升级操作,案例涉及的版本从'(Kingb ...

  3. KingbaseES 集群运维系列 -- 验证系统用户修改密码或密码过期对ssh互信的影响

    案例说明: Kingbase V8主备流复制集群在通用机环境部署和运维,需要建立主机间的ssh互信,如果ssh互信被破坏,将导致集群故障.但有的生产环境为了系统安全需要,会配置密码管理策略,定期的修改 ...

  4. .NET分布式Orleans - 8 - 贪吃蛇项目实战(准备阶段)

    到目前为止,Orleans7的核心概念基本已经学完,我准备使用Orleans7做一个项目实战,来总结自己的学习效果. 项目效果 通过Orleans7来完成一个贪吃蛇游戏,要求如下: 可以多人在线玩 贪 ...

  5. 哈希表(HashTable)

    哈希表 哈希表:也叫做散列表.是根据关键字和值(Key-Value)直接进行访问的数据结构.也就是说,它通过关键字 key 和一个映射函数 Hash(key) 计算出对应的值 value,然后把键值对 ...

  6. 技术文档指南:版本说明、网站文案、FAQ、案例研究与内容优化

    Release Notes 和产品公告 Release Notes 通常是软件文档的一部分,是在新产品发布时提供给用户的简短.高级摘要.它们包含有关更新的重要信息,包括新功能.增强功能.错误修复,通常 ...

  7. Go 语言注释教程

    注释是在执行时被忽略的文本.注释可用于解释代码,使其更易读.注释还可用于在测试替代代码时防止代码执行.Go支持单行或多行注释. Go单行注释 单行注释以两个正斜杠(//)开头. 在//和行尾之间的任何 ...

  8. Dev 控件 gridControl教程

    Dev 控件 gridControl教程:https://www.bilibili.com/video/BV1gz4y1R7Wk/?spm_id_from=333.788.recommend_more ...

  9. std::thread 五:打包任务(packaged_task)

    #include <iostream> #include <thread> #include <mutex> #include <list> #incl ...

  10. .NET周刊【4月第1期 2024-04-07】

    国内文章 一个程序员的编年史 https://www.cnblogs.com/lunacy/p/18117213 作者拥有15年软件开发经验,曾在多家公司工作,项目和团队起伏充满变数.2007年,在太 ...