使用hexdump追踪FAT32文件系统中的一个文件
最近在看文件系统基础结构等知识,本来重点是想看EXT4文件系统,但是目前没有找到比较详细说明EXT4文件系统详细结构的,用EXT3的对应着找结果有点出入,在想是不是我用hexdump的参数有问题,于是找了一个FAT32文件系统来试验hexdump参数的使用,结果准确找到了文件内容,在这里记录一下。
- 操作系统:linux(centos6.5)
- 文件系统:FAT32(来自于U盘)
- 工具:hexdump,windows自带计算器
hexdump是linux操作系统中用来查看文件二进制内容的一种工具,win10打开windows自带计算器方法:windows+R然后输入Calc.exe回车
- 参考书目:《数据重现-文件系统原理精解与数据恢复最佳实践》(马林 著)
步骤:
FAT32文件系统结构:
| 保留区 | FAT区 | 数据区 |
1、查看文件系统相关信息:
df -T
解释:df可查看文件系统磁盘空间使用情况,-T选项可查看文件系统类型,以下是查看结果:

可以看到文件系统/dev/sdb为文件系统类型为vfat也就是FAT32类型(具体的目录就是插入的u盘),下面就是对该文件系统进行追踪。这里要追踪的文件是:childTEXT.txt,可从挂载点查看文件内容,childTEXT.txt的基本情况如下:

文件内容及基本信息:

2、查看引导扇区,得到每扇区字节数、每簇扇区数、保留扇区数、FAT表占用扇区数、FAT表个数、根目录起始簇号,进而定位FAT表、根目录、数据区位置。
命令:hexdump -s 0 -n 512 -C /dev/sdc
解释: 选项-s指偏移量,单位是字节,默认是十进制,也可以在数字前加上"0X"表示十六进制;
-n选项表示要读取的字节数,只能用十进制表示,引导扇区占一个扇区,一般为512个字节;
-C选项可以输出十六进制对应的ASCII码,要注意这里的是大写的C,小写的c选项表示单字节字符显示;
/dev/sdc为文件系统名
查看结果:

2.1得到基本数据:
首先可以看到偏移0x1fe-1ff处为“55aa”也就是引导扇区的结束标志。
0x0b-0x0c是每扇区字节数:0x0200(十进制的512)
0x0d是每簇扇区数:0x10(十进制的16)
0x0e-0x0f是保留扇区数:0x26(十进制38)
0x10是FAT表个数:0x02(十进制2)
0x24-0x27是一个FAT表扇区数:0x3e71(十进制15985)
0x2c-0x2f是根目录起始簇号:0x02(十进制2)
2.2定义FAT表
从FAT32文件系统结构可以看出,FAT区紧跟在保留区后面,因此引导扇区中获取保留区扇区数后就可以得到FAT区起始位置。
FAT起始字节=保留区扇区数*每扇区字节数
0x26*0x200=0x4c00(十进制19456)
计算FAT区大小:FAT区所占字节数=每FAT表所占扇区数*每扇区字节数*FAT表个数
0x3e71*0x200*0x02=0xf9 c400(十进制16,368,640)
读取命令:
hexdump -s 0x4c00 -n 1024 -C /dev/sdc
读取结果:

上面是FAT表部分内容,FAT表中四个字节为一个表项。
当某个簇未使用时,对应的FAT表项值为0x00000000;
当该簇是某个文件最后一个簇时,对应表项值为0x0fffffff(大端形式为:ff ff ff 0f);
当该簇为坏簇时;FAT表项值为0x0ffffff7(f7 ff ff 0f);
因为簇号起始于2号(FAT表项与簇是一一对应关系),因此FAT表项0,1项不与任何簇对应,其0号表项值总为“f8 ff ff 0f”;1表项可能用于记录脏标志(说明文件系统没有被正常卸载或磁盘表面存在错误),其表项值一般为“ffffffff”或“ffffff0f”。
2.3定位根目录
根目录位于数据区的开始,因此定位根目录就是定位数据区的开始。
数据区紧跟FAT区后,所以数据区的开始扇区号就是保留区+FAT区扇区号:
数据区起始扇区号=保留区扇区个数+每FAT表扇区个数*FAT表个数
0x26+0x3e71*0x02=0x7d08(十进制32008)
偏移字节:0x7d08*0x200=0xfa1000(十进制16388096)
读取结果:

3、从根目录中由子目录名来查找子目录的起始簇号和起始扇区号。
上图中可以看到我们要找的目录RootDIR有两个,这是因为根目录有32字节的短文件名目录项和32字节或更多个32字节的长文件名目录项,一般在短文件名目录项的前面(如果多于一个32字节,则倒序存放)
找到需要的目录项:
0x10c0-0x10ca为文件名,剩余文件名空间用0x20补齐。“52 4f 4f 54 44 49 52 20 20 20 20”,这里要说明一下,文件名的第一个字节比较特殊,当该文件被删除时,文件名的第一个字节就被改写为0xe5(未被使用是0x00)
0x10cb是文件属性:0x10表示目录
0x10da-0x10db是文件内容起始簇号低两个字节:0x5123(高两个字节位置是0x10d4-0x10d5,这里全为0)
0x10dc-0x10df是文件内容大小字节数:0x00000000,当文件属性为目录时,该值为0。
0x5123就是子目录RootDIR的起始簇号。
利用簇号找到他相对应的扇区号的公式是:
某簇对应的扇区号=保留区扇区个数+FAT区扇区个数+(簇号-2)*每次扇区个数
0x26+0x3e71*2+(0x5123-0x02)*0x10=0x58f18(十进制364312)
簇号对应的偏移字节:0x58f18*0x200=0xb1e3000。
4、从子目录中找到目标文件。
上一步中计算的0xb1e3000就是子目录的偏移字节。
依旧使用hexdump命令读取子目录内容:

在子目录中,我们看到前64个字节的文件名比较特殊,第一个32字节的文件名是“.”表示本目录,证据就是该目录起始簇号的低两个字节是0x5123,就是第三步中我们找到的RootDIR目录的起始簇号;第二个32字节的文件名是“..”表示根目录。
其次还可以看到目标子目录项的前后两个子目录都被删除了。
目标子目录项提供的信息:
0x30a0-0x30aa:文件名
0x30ab是文件属性:0x20表示存档文件
0x30ba-0x30bb是文件内容起始簇号的低两个字节:0x5126
0x30bc-0x30bf是文件内容大小:0x2e(十进制46,与第一步中我们用ls -l命令查看文件基本情况相符)
使用和第3步同样的方法计算出0x5126簇号对应的扇区号:
0x26+0x3e71*0x02+(0x5126-2)*0x10=0x58f48
偏移字节为:0x58f48*0x200=0xb1e9000
5、从起始簇号开始读取文件第一个簇内容。
使用上一步中计算出的偏移字节读取文件第一个簇的内容:

这里的示例文件大小小于一个簇(8192个字节),我们在第4步中已经知道他的大小为46个字节,因此可以使用下面命令准确读出文件内容。

6、查看FAT表项值,查找文件下一个簇内容。
查找簇号为0x5126的FAT表项值就可以找到该文件的下一个簇。
簇号对应的FAT表项值=簇号*每个FAT表项值所占字节数
0x5126*0x04=0x14498(十进制83096)
也就是说0x5126号簇的FAT表内偏移字节为0x14498,要想从开始算起则加上FAT区的起始字节就可以了。
某簇对应FAT表的绝对字节偏移=保留扇区数*每扇区字节数+簇号*每FAT表项字节数
0x14498+0x4c00=0x19098
读取偏移0x19098开始的4个字节内容

该表项值为0x0fffffff,表示该簇就是该文件的结束簇,文件读取结束。
到这里,利用hexdump追踪一个文件就结束了,居然写了一下午/(ㄒoㄒ)/~~,后续会追踪一个被删除的文件内容看看。
使用hexdump追踪FAT32文件系统中的一个文件的更多相关文章
- 使用hexdump工具追踪EXT4文件系统中的一个文件
昨天追踪EXT4文件系统的过程中出了点问题,就是找不到文件,于是试了一下追踪FAT32文件系统的,成功之后有了点信心,今天继续嗑EXT4文件系统,终于找到啦,记录一下. 操作系统:linux(cent ...
- 在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world
一.题目 编写一个内核模块,在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world.内核版本要求2.6.18 二.实验环境 物理主机:w ...
- 创建一个目录info,并在目录中创建一个文件test.txt,把该文件的信息读取出来,并显示出来
/*4.创建一个目录info,并在目录中创建一个文件test.txt,把该文件的信息读取出来,并显示出来*/ #import <Foundation/Foundation.h>#defin ...
- 分别应用include指令和include动作标识在一个jsp页面中包含一个文件。
分别应用include指令和include动作标识在一个jsp页面中包含一个文件. hello.jsp <%@ page language="java" import=&qu ...
- 在windows中把一个文件夹打成war包
转: 在windows中把一个文件夹打成war包 一般开发打war包时都是用MyEclipse或IntelliJ IDEA等直接导出war文件,这里介绍一种如何把一个文件夹打成war包的方式,如下 ...
- python实现获取文件列表中每一个文件keyword
功能描写叙述: 获取某个路径下的全部文件,提取出每一个文件里出现频率最高的前300个字.保存在数据库其中. 前提.你须要配置好nltk #!/usr/bin/python #coding=utf-8 ...
- Linux中显示一个文件最后几行的命令
tail -n 20 filename说明:显示filename最后20行. Linux下tail命令的使用方法.linux tail命令用途是依照要求将指定的文件的最后部分输出到标准设备,通常是终端 ...
- C#获取路径中最后一个文件夹的名字
using System; using System.IO; namespace ConsoleApplication1 { class Program { static void Main(stri ...
- Linux 获取目录中最后一个文件的名字
find /application/docker_hub/logs/fof1private/amount_dev -type l | xargs basename
随机推荐
- Error:Android Source Generator: [sdk] Android SDK is not specified.
有时候使用intellij idea 带入android 项目,运行提示Error:Android Source Generator: [sdk] Android SDK is not specifi ...
- 深入理解Activity的启动模式
众所周知,当我们多次启动同一个Activity时,会创建多个该Activity的实例,系统会按照先进后出的原则,将它们一一放进任务栈中,然后我们按back键,系统就会将栈顶的Activity移除栈,直 ...
- 为什么重写equals时必须重写hashCode方法?(转发+整理)
为什么重写equals时必须重写hashCode方法? 原文地址:http://www.cnblogs.com/shenliang123/archive/2012/04/16/2452206.html ...
- SCAU Individual Contest #1
总结一下就是自己太弱.每次打比赛遇到比较难题就喜欢瞎开题,结果都是每题想一下,然后就是结束了. A:题意让你用小写字母构造一个总共有K个的回文串,比如aba的话就是{a}{b}{a}{aba}四个,比 ...
- Java生成二维码--QRGen
最近公司需求需要生成一个二维码 , 由于之前没有接触过 , 故此做个记录 . 在网上找到了不少二维码生成工具,都蛮好用的. 不过要集成二维码生成功能到应用开发中,就要选择最好用成熟的库了,最终决定采用 ...
- 12款Linux系统恢复工具
电脑死机,硬盘崩溃,花巨大的money搞个急救保护器……这都是计算机的阴暗面.时间一直这样走着,走着,不定哪天背点儿.对于电脑损坏造成的损失,着急抓狂毫无意义.相反,使用恰当的工具反而会最小化损失.你 ...
- IIS的安装与设置(windows版本)
IIS,全英文名称:Internet Information Services(互联网信息服务),是由微软公司提供的基于运行Microsoft Windows的互联网基本服务.IIS的功能很多,如编辑 ...
- DOM详解
浏览器工作的基本流程 1.浏览器开始解析html文档,构建DOM树(DOM tree),DOM树的节点由文档的标签.属性.文本等组成:2.解析外部CSS文件及style标签中的样式信息,这些样式信息将 ...
- offsetHeight/Width clientHeight/Width scrollHeight/Width等高宽算法
图解: jquery里的对应取法: clientHeight/Width:innerHeight/Width(), offsetHeight/Width: outerHeight/Width(). w ...
- JAVA POI 应用系列(2)--读取Excel
添加maven依赖 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi< ...