使用hexdump追踪FAT32文件系统中的一个文件
最近在看文件系统基础结构等知识,本来重点是想看EXT4文件系统,但是目前没有找到比较详细说明EXT4文件系统详细结构的,用EXT3的对应着找结果有点出入,在想是不是我用hexdump的参数有问题,于是找了一个FAT32文件系统来试验hexdump参数的使用,结果准确找到了文件内容,在这里记录一下。
- 操作系统:linux(centos6.5)
- 文件系统:FAT32(来自于U盘)
- 工具:hexdump,windows自带计算器
hexdump是linux操作系统中用来查看文件二进制内容的一种工具,win10打开windows自带计算器方法:windows+R然后输入Calc.exe回车
- 参考书目:《数据重现-文件系统原理精解与数据恢复最佳实践》(马林 著)
步骤:
FAT32文件系统结构:
保留区 | FAT区 | 数据区 |
1、查看文件系统相关信息:
df -T
解释:df可查看文件系统磁盘空间使用情况,-T选项可查看文件系统类型,以下是查看结果:
可以看到文件系统/dev/sdb为文件系统类型为vfat也就是FAT32类型(具体的目录就是插入的u盘),下面就是对该文件系统进行追踪。这里要追踪的文件是:childTEXT.txt,可从挂载点查看文件内容,childTEXT.txt的基本情况如下:
文件内容及基本信息:
2、查看引导扇区,得到每扇区字节数、每簇扇区数、保留扇区数、FAT表占用扇区数、FAT表个数、根目录起始簇号,进而定位FAT表、根目录、数据区位置。
命令:hexdump -s 0 -n 512 -C /dev/sdc
解释: 选项-s指偏移量,单位是字节,默认是十进制,也可以在数字前加上"0X"表示十六进制;
-n选项表示要读取的字节数,只能用十进制表示,引导扇区占一个扇区,一般为512个字节;
-C选项可以输出十六进制对应的ASCII码,要注意这里的是大写的C,小写的c选项表示单字节字符显示;
/dev/sdc为文件系统名
查看结果:
2.1得到基本数据:
首先可以看到偏移0x1fe-1ff处为“55aa”也就是引导扇区的结束标志。
0x0b-0x0c是每扇区字节数:0x0200(十进制的512)
0x0d是每簇扇区数:0x10(十进制的16)
0x0e-0x0f是保留扇区数:0x26(十进制38)
0x10是FAT表个数:0x02(十进制2)
0x24-0x27是一个FAT表扇区数:0x3e71(十进制15985)
0x2c-0x2f是根目录起始簇号:0x02(十进制2)
2.2定义FAT表
从FAT32文件系统结构可以看出,FAT区紧跟在保留区后面,因此引导扇区中获取保留区扇区数后就可以得到FAT区起始位置。
FAT起始字节=保留区扇区数*每扇区字节数
0x26*0x200=0x4c00(十进制19456)
计算FAT区大小:FAT区所占字节数=每FAT表所占扇区数*每扇区字节数*FAT表个数
0x3e71*0x200*0x02=0xf9 c400(十进制16,368,640)
读取命令:
hexdump -s 0x4c00 -n 1024 -C /dev/sdc
读取结果:
上面是FAT表部分内容,FAT表中四个字节为一个表项。
当某个簇未使用时,对应的FAT表项值为0x00000000;
当该簇是某个文件最后一个簇时,对应表项值为0x0fffffff(大端形式为:ff ff ff 0f);
当该簇为坏簇时;FAT表项值为0x0ffffff7(f7 ff ff 0f);
因为簇号起始于2号(FAT表项与簇是一一对应关系),因此FAT表项0,1项不与任何簇对应,其0号表项值总为“f8 ff ff 0f”;1表项可能用于记录脏标志(说明文件系统没有被正常卸载或磁盘表面存在错误),其表项值一般为“ffffffff”或“ffffff0f”。
2.3定位根目录
根目录位于数据区的开始,因此定位根目录就是定位数据区的开始。
数据区紧跟FAT区后,所以数据区的开始扇区号就是保留区+FAT区扇区号:
数据区起始扇区号=保留区扇区个数+每FAT表扇区个数*FAT表个数
0x26+0x3e71*0x02=0x7d08(十进制32008)
偏移字节:0x7d08*0x200=0xfa1000(十进制16388096)
读取结果:
3、从根目录中由子目录名来查找子目录的起始簇号和起始扇区号。
上图中可以看到我们要找的目录RootDIR有两个,这是因为根目录有32字节的短文件名目录项和32字节或更多个32字节的长文件名目录项,一般在短文件名目录项的前面(如果多于一个32字节,则倒序存放)
找到需要的目录项:
0x10c0-0x10ca为文件名,剩余文件名空间用0x20补齐。“52 4f 4f 54 44 49 52 20 20 20 20”,这里要说明一下,文件名的第一个字节比较特殊,当该文件被删除时,文件名的第一个字节就被改写为0xe5(未被使用是0x00)
0x10cb是文件属性:0x10表示目录
0x10da-0x10db是文件内容起始簇号低两个字节:0x5123(高两个字节位置是0x10d4-0x10d5,这里全为0)
0x10dc-0x10df是文件内容大小字节数:0x00000000,当文件属性为目录时,该值为0。
0x5123就是子目录RootDIR的起始簇号。
利用簇号找到他相对应的扇区号的公式是:
某簇对应的扇区号=保留区扇区个数+FAT区扇区个数+(簇号-2)*每次扇区个数
0x26+0x3e71*2+(0x5123-0x02)*0x10=0x58f18(十进制364312)
簇号对应的偏移字节:0x58f18*0x200=0xb1e3000。
4、从子目录中找到目标文件。
上一步中计算的0xb1e3000就是子目录的偏移字节。
依旧使用hexdump命令读取子目录内容:
在子目录中,我们看到前64个字节的文件名比较特殊,第一个32字节的文件名是“.”表示本目录,证据就是该目录起始簇号的低两个字节是0x5123,就是第三步中我们找到的RootDIR目录的起始簇号;第二个32字节的文件名是“..”表示根目录。
其次还可以看到目标子目录项的前后两个子目录都被删除了。
目标子目录项提供的信息:
0x30a0-0x30aa:文件名
0x30ab是文件属性:0x20表示存档文件
0x30ba-0x30bb是文件内容起始簇号的低两个字节:0x5126
0x30bc-0x30bf是文件内容大小:0x2e(十进制46,与第一步中我们用ls -l命令查看文件基本情况相符)
使用和第3步同样的方法计算出0x5126簇号对应的扇区号:
0x26+0x3e71*0x02+(0x5126-2)*0x10=0x58f48
偏移字节为:0x58f48*0x200=0xb1e9000
5、从起始簇号开始读取文件第一个簇内容。
使用上一步中计算出的偏移字节读取文件第一个簇的内容:
这里的示例文件大小小于一个簇(8192个字节),我们在第4步中已经知道他的大小为46个字节,因此可以使用下面命令准确读出文件内容。
6、查看FAT表项值,查找文件下一个簇内容。
查找簇号为0x5126的FAT表项值就可以找到该文件的下一个簇。
簇号对应的FAT表项值=簇号*每个FAT表项值所占字节数
0x5126*0x04=0x14498(十进制83096)
也就是说0x5126号簇的FAT表内偏移字节为0x14498,要想从开始算起则加上FAT区的起始字节就可以了。
某簇对应FAT表的绝对字节偏移=保留扇区数*每扇区字节数+簇号*每FAT表项字节数
0x14498+0x4c00=0x19098
读取偏移0x19098开始的4个字节内容
该表项值为0x0fffffff,表示该簇就是该文件的结束簇,文件读取结束。
到这里,利用hexdump追踪一个文件就结束了,居然写了一下午/(ㄒoㄒ)/~~,后续会追踪一个被删除的文件内容看看。
使用hexdump追踪FAT32文件系统中的一个文件的更多相关文章
- 使用hexdump工具追踪EXT4文件系统中的一个文件
昨天追踪EXT4文件系统的过程中出了点问题,就是找不到文件,于是试了一下追踪FAT32文件系统的,成功之后有了点信心,今天继续嗑EXT4文件系统,终于找到啦,记录一下. 操作系统:linux(cent ...
- 在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world
一.题目 编写一个内核模块,在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world.内核版本要求2.6.18 二.实验环境 物理主机:w ...
- 创建一个目录info,并在目录中创建一个文件test.txt,把该文件的信息读取出来,并显示出来
/*4.创建一个目录info,并在目录中创建一个文件test.txt,把该文件的信息读取出来,并显示出来*/ #import <Foundation/Foundation.h>#defin ...
- 分别应用include指令和include动作标识在一个jsp页面中包含一个文件。
分别应用include指令和include动作标识在一个jsp页面中包含一个文件. hello.jsp <%@ page language="java" import=&qu ...
- 在windows中把一个文件夹打成war包
转: 在windows中把一个文件夹打成war包 一般开发打war包时都是用MyEclipse或IntelliJ IDEA等直接导出war文件,这里介绍一种如何把一个文件夹打成war包的方式,如下 ...
- python实现获取文件列表中每一个文件keyword
功能描写叙述: 获取某个路径下的全部文件,提取出每一个文件里出现频率最高的前300个字.保存在数据库其中. 前提.你须要配置好nltk #!/usr/bin/python #coding=utf-8 ...
- Linux中显示一个文件最后几行的命令
tail -n 20 filename说明:显示filename最后20行. Linux下tail命令的使用方法.linux tail命令用途是依照要求将指定的文件的最后部分输出到标准设备,通常是终端 ...
- C#获取路径中最后一个文件夹的名字
using System; using System.IO; namespace ConsoleApplication1 { class Program { static void Main(stri ...
- Linux 获取目录中最后一个文件的名字
find /application/docker_hub/logs/fof1private/amount_dev -type l | xargs basename
随机推荐
- 微服务框架下的思维变化-OSS.Core基础思路
如今框架两字已经烂大街了,xx公司架构设计随处可见,不过大多看个热闹,这些框架如何来的,细节又是如何思考的,相互之间的隔离依据又是什么...相信很多朋友应该依然存在自己的疑惑,特别是越来越火热的微服务 ...
- python 发包爬取中国移动充值页面---可判断手机号是否异常
1.用requests.Session()的方式,可以实现自动化管理cookie.session等. 2.具体流程可以抓包分析. 所有请求的参数如要搞清楚需要分析js源码.只能提示一下,一共分为三步: ...
- Customer segmentation – LifeCycle Grids with R(转)
I want to share a very powerful approach for customer segmentation in this post. It is based on cust ...
- React之组件通信
组件通信无外乎,下面这三种父子组件,子父组件,平行组件(也叫兄弟组件)间的数据传输.下面我们来分别说一下: 父子组件: var Demo=React.createClass({ getInitialS ...
- python爬虫从入门到放弃(六)之 BeautifulSoup库的使用
上一篇文章的正则,其实对很多人来说用起来是不方便的,加上需要记很多规则,所以用起来不是特别熟练,而这节我们提到的beautifulsoup就是一个非常强大的工具,爬虫利器. beautifulSoup ...
- Java之进程与线程练习
1.设计一个线程类:创建3个子线程,每个线程分别打印数字,分别睡眠100,200,300ms ->每个执行都是20次 代码: package Homework; //1.设计一个线程类:创建3个 ...
- Android计时器实现
Wyy.java package com.test; import android.app.Activity;import android.app.Service;import android.os. ...
- javascript痛点之三闭包
先来看看第一节的例子 'use strict'; function num(){ //用var声明一个变量num1 var num1 = 15; } alert(num1);//num1 is not ...
- Docker 网络命令
docker network create docker network connect docker network ls docker network rm docker network disc ...
- 关于QT5使用QtScript解析QJsonArray数组的问题
首先得在pro文件中加入QT+=script 然后导入相应的头文件 include <QStringList> #include <QtScript/QScriptEngine> ...