[转载]Delphi 版 everything、光速搜索代码
近日没啥事情,研究了一下 everything、光速搜索原理。花了一个礼拜时间,终于搞定。
废话不多说,直接上代码:
- unit uMFTSearchFile;
- {
- dbyoung@sina.com
- 2018-04-23
- }
- interface
- uses Windows, System.Classes, Generics.Collections;
- { 获取磁盘所有文件列表 }
- function GetLogicalDiskAllFiles(const chrLogiclDiskName: Char; var FileList: TStringList; const bSort: Boolean = False): Boolean;
- implementation
- type
- PFileInfo = ^TFileInfo;
- TFileInfo = record
- strFileName: String; // 文件名称
- FileReferenceNumber: UInt64; // 文件的ID
- ParentFileReferenceNumber: UInt64; // 文件的父ID
- end;
- const
- PARTITION_IFS = $07;
- BUF_LEN = 500 * 1024;
- USN_DELETE_FLAG_DELETE = $00000001;
- c_UInt64Root = 1407374883553285;
- type
- PARTITION_INFORMATION = record
- StartingOffset: LARGE_INTEGER;
- PartitionLength: LARGE_INTEGER;
- HiddenSectors: Cardinal;
- PartitionNumber: Cardinal;
- PartitionType: Byte;
- BootIndicator: Boolean;
- RecognizedPartition: Boolean;
- RewritePartition: Boolean;
- end;
- CREATE_USN_JOURNAL_DATA = record
- MaximumSize: UInt64;
- AllocationDelta: UInt64;
- end;
- USN_JOURNAL_DATA = record
- UsnJournalID: UInt64;
- FirstUsn: Int64;
- NextUsn: Int64;
- LowestValidUsn: Int64;
- MaxUsn: Int64;
- MaximumSize: UInt64;
- AllocationDelta: UInt64;
- end;
- MFT_ENUM_DATA = record
- StartFileReferenceNumber: UInt64;
- LowUsn: Int64;
- HighUsn: Int64;
- end;
- PUSN = ^USN;
- USN = record
- RecordLength: Cardinal;
- MajorVersion: Word;
- MinorVersion: Word;
- FileReferenceNumber: UInt64;
- ParentFileReferenceNumber: UInt64;
- USN: Int64;
- TimeStamp: LARGE_INTEGER;
- Reason: Cardinal;
- SourceInfo: Cardinal;
- SecurityId: Cardinal;
- FileAttributes: Cardinal;
- FileNameLength: Word;
- FileNameOffset: Word;
- FileName: PWideChar;
- end;
- DELETE_USN_JOURNAL_DATA = record
- UsnJournalID: UInt64;
- DeleteFlags: Cardinal;
- end;
- { TStringList 按数值排序 }
- function Int64Sort(List: TStringList; Index1, Index2: Integer): Integer;
- var
- Int64A, Int64B: Int64;
- begin
- Int64A := PFileInfo(List.Objects[Index1])^.FileReferenceNumber;
- Int64B := PFileInfo(List.Objects[Index2])^.FileReferenceNumber;
- if Int64A < Int64B then
- Result := -1
- else if Int64A = Int64B then
- Result := 0
- else
- Result := 1;
- end;
- { 简化的 MOVE 函数,也可以用 MOVE 函数来替代 }
- procedure MyMove(const Source; var Dest; Count: NativeInt); assembler;
- asm
- FILD QWORD PTR [EAX]
- FISTP QWORD PTR [EDX]
- end;
- { 获取文件全路径,包含路径和文件名 }
- procedure GetFullFileName(var FileList: TStringList; const chrLogiclDiskName: Char; const bSort: Boolean = False);
- var
- UInt64List: TArray<UInt64>;
- III : Integer;
- UPID : UInt64;
- intIndex : Integer;
- begin
- { 将 FileList 按 FileReferenceNumber 数值排序 }
- FileList.Sorted := False;
- FileList.CustomSort(Int64Sort);
- { 将排序好的 FileReferenceNumber 复制到 UInt64 数组列表中,便于下面进行快速查找 <TArray.BinarySearch 为高效的折半查找> }
- SetLength(UInt64List, FileList.Count);
- for III := 0 to FileList.Count - 1 do
- begin
- UInt64List[III] := PFileInfo(FileList.Objects[III])^.FileReferenceNumber;
- end;
- { 获取每一个文件全路径名称 }
- for III := 0 to FileList.Count - 1 do
- begin
- UPID := PFileInfo(FileList.Objects[III])^.ParentFileReferenceNumber;
- while TArray.BinarySearch(UInt64List, UPID, intIndex) do
- begin
- UPID := PFileInfo(FileList.Objects[intIndex])^.ParentFileReferenceNumber;
- FileList.Strings[III] := PFileInfo(FileList.Objects[intIndex])^.strFileName + '\' + FileList.Strings[III];
- end;
- FileList.Strings[III] := (chrLogiclDiskName + ':\' + FileList.Strings[III]);
- end;
- { 将所有文件按文件名排序 }
- if bSort then
- FileList.Sort;
- end;
- { 获取磁盘所有文件列表 }
- function GetLogicalDiskAllFiles(const chrLogiclDiskName: Char; var FileList: TStringList; const bSort: Boolean = False): Boolean;
- var
- Info : PARTITION_INFORMATION;
- bStatus : Boolean;
- hRootHandle: THandle;
- hTempHandle: Cardinal;
- cujd : CREATE_USN_JOURNAL_DATA;
- ujd : USN_JOURNAL_DATA;
- med : MFT_ENUM_DATA;
- dujd : DELETE_USN_JOURNAL_DATA;
- dwRet : DWORD;
- Buffer : array [0 .. BUF_LEN - 1] of Char;
- UsnRecord : PUSN;
- strFileName: String;
- int64Size : Integer;
- pfi : PFileInfo;
- III : Integer;
- begin
- Result := False;
- { 打开磁盘 需要管理员权限 }
- hTempHandle := 0;
- hRootHandle := CreateFile(PChar('\\.\' + chrLogiclDiskName + ':'), GENERIC_READ or GENERIC_WRITE, FILE_SHARE_READ or FILE_SHARE_WRITE, nil, OPEN_EXISTING, FILE_ATTRIBUTE_READONLY, hTempHandle);
- if hRootHandle = INVALID_HANDLE_VALUE then
- Exit;
- try
- { 是否是NTFS磁盘格式 }
- if not DeviceIoControl(hRootHandle, IOCTL_DISK_GET_PARTITION_INFO, nil, 0, @Info, Sizeof(Info), dwRet, nil) then
- Exit;
- if not Info.RecognizedPartition then
- Exit;
- if Info.PartitionType <> PARTITION_IFS then
- Exit;
- { 初始化USN日志文件 }
- bStatus := DeviceIoControl(hRootHandle, FSCTL_CREATE_USN_JOURNAL, @cujd, Sizeof(cujd), nil, 0, dwRet, nil);
- if not bStatus then
- Exit;
- { 获取USN日志基本信息 }
- bStatus := DeviceIoControl(hRootHandle, FSCTL_QUERY_USN_JOURNAL, nil, 0, @ujd, Sizeof(ujd), dwRet, nil);
- if not bStatus then
- Exit;
- { 枚举USN日志文件中的所有记录 }
- med.StartFileReferenceNumber := 0;
- med.LowUsn := 0;
- med.HighUsn := ujd.NextUsn;
- int64Size := Sizeof(Int64);
- while DeviceIoControl(hRootHandle, FSCTL_ENUM_USN_DATA, @med, Sizeof(med), @Buffer, BUF_LEN, dwRet, nil) do
- begin
- { 找到第一个 USN 记录 }
- UsnRecord := PUSN(Integer(@(Buffer)) + int64Size);
- while dwRet > 60 do
- begin
- { 获取文件名称 }
- strFileName := PWideChar(Integer(UsnRecord) + UsnRecord^.FileNameOffset);
- strFileName := Copy(strFileName, 1, UsnRecord^.FileNameLength div 2);
- { 将文件信息添加到列表中 }
- pfi := AllocMem(Sizeof(TFileInfo)); // 不要忘记释放内存
- pfi^.strFileName := strFileName;
- pfi^.FileReferenceNumber := UsnRecord^.FileReferenceNumber;
- pfi^.ParentFileReferenceNumber := UsnRecord^.ParentFileReferenceNumber;
- FileList.AddObject(strFileName, TObject(pfi));
- { 获取下一个 USN 记录 }
- if UsnRecord.RecordLength > 0 then
- Dec(dwRet, UsnRecord.RecordLength)
- else
- Break;
- UsnRecord := PUSN(Cardinal(UsnRecord) + UsnRecord.RecordLength);
- end;
- MyMove(Buffer, med, int64Size);
- end;
- { 获取文件全路径,包含路径和文件名 }
- GetFullFileName(FileList, chrLogiclDiskName, bSort);
- { 释放内存 }
- for III := 0 to FileList.Count - 1 do
- begin
- FreeMem(PFileInfo(FileList.Objects[III]));
- end;
- { 删除USN日志文件信息 }
- dujd.UsnJournalID := ujd.UsnJournalID;
- dujd.DeleteFlags := USN_DELETE_FLAG_DELETE;
- DeviceIoControl(hRootHandle, FSCTL_DELETE_USN_JOURNAL, @dujd, Sizeof(dujd), nil, 0, dwRet, nil);
- finally
- CloseHandle(hRootHandle);
- end;
- end;
- end.
Delphi 10.2 环境下开发。
调用:
var FileList : TStringList;
begin
FileList := TStringList.Create;
GetLogicalDiskAllFiles('C', FileList, False);
FileList.SaveToFile('d:\temp.txt', TEncoding.UTF8);
FileList.Free;
end;
在我的机器上100万个文件,耗时7秒左右。200万个文件,耗时15秒左右。
[转载]Delphi 版 everything、光速搜索代码的更多相关文章
- [转载]《Delphi 版 everything、光速搜索代码》 关于获取文件全路径 GetFullFileName 函数的优化
Delphi 版 everything.光速搜索代码>,文章中关于获取文件全路径的函数:GetFullFileName,有一个地方值得优化. 就是有多个文件,它们可能属于同一个目录. 譬如 Sy ...
- 教程-Delphi中的GExperts搜索代码快捷键
Shift+Ait+S 打开搜索 Ctrl+Ait+R 打开上次搜索结果
- 通过崩溃地址找错误行数之Delphi版
通过崩溃地址找错误行数之Delphi版2009-5-11 17:42:35 来源: 转载 作者:网络 访问:360 次 被顶:2 次 字号:[大 中 小]核心提示:什么是 MAP 文件?简单地讲, M ...
- 雪花算法(snowflake)delphi版
雪花算法简单描述: + 最高位是符号位,始终为0,不可用. + 41位的时间序列,精确到毫秒级,41位的长度可以使用69年.时间位还有一个很重要的作用是可以根据时间进行排序. + 10位的机器标识,1 ...
- 二维码生成delphi版
二维码生成delphi版 生成二维码的软件,代码从C语言转换过来(源地址:http://fukuchi.org/works/qrencode/),断断续续的差不多花了一周时间来转换和调试.在转换过程中 ...
- 支付宝签名验证实现-Delphi版
支付宝签名验证实现-Delphi版 首先介结下支付宝签名验证流程: 一 支付宝密钥生成 支付宝提供秘钥生成工具https://docs.open.alipay.com/291/105971/ 用此下 ...
- Delphi汉字简繁体转换代码(分为D7和D2010版本)
//delphi 7 Delphi汉字简繁体转换代码unit ChineseCharactersConvert; interface uses Classes, Windows; type T ...
- 网络IO模型-异步选择模型(Delphi版)
其实关于这个模型,网络上也有一个案例说明 老陈使用了微软公司的新式信箱.这种信箱非常先进,一旦信箱里有新的信件,盖茨就会给老陈打电话:喂,大爷,你有新的信件了!从此,老陈再也不必频繁上下楼检查信箱了, ...
- 完善dedecms站内搜索代码,为搜索结果添加第*页
自那些平凡而伟大的程序猿开发了内容管理系统(cms),为了让看客们更快地找到自己感兴趣的内容,他们不断完善站内搜索代码,形成了一个小型的站内搜索引擎.可能有些网站模板设计师没考虑到seo的问题,很多站 ...
随机推荐
- C语言写随机数
#include <stdio.h> #include <stdlib.h> #include <time.h> ; unsigned int rand0(); v ...
- _stdcall调用
以前看windows编程时一直有个 _stdcall 函数调用约定 一直不是很理解,只能硬记. 现在终于在<程序是怎样跑起来的>这本书书中找到了答案. 1. _stdcall 是stand ...
- 论文笔记 《Maxout Networks》 && 《Network In Network》
论文笔记 <Maxout Networks> && <Network In Network> 发表于 2014-09-22 | 1条评论 出处 maxo ...
- Longest Valid Parentheses——仍然需要认真看看(动态规划)
Given a string containing just the characters '(' and ')', find the length of the longest valid (wel ...
- [转载] Python itertools模块详解
原文在这里,写的很详细,感谢原作者,以下摘录要点. itertools用于高效循环的迭代函数集合. 无限迭代器 迭代器 参数 结果 例子 count() start, [step] start, st ...
- 在k8s 1.7.0上启用dashboard的注意事项
因为自k8s 1.6之后,有基于角色的安全性. 所以很多网上以前的教程就不能使用了. 结合以下三个文档,暂时实现了dashboard界面的推出. http://blog.csdn.net/jinzil ...
- [Bootstrap]modal弹出框
写在前面 在实际开发中,为了友好,更需要一种美观的弹出框,js原生的alert,很难满足需求.这里推荐一个bootstrap的弹出框. 一个例子 先看效果吧 代码: <!DOCTYPE html ...
- 前端读者 | 从一行代码里面学点JavaScript
本文来自 @张小俊128:链接:http://www.html-js.com/article/A-day-to-learn-from-a-line-of-code-inside-the-JavaScr ...
- jquery中的jsonp和js中的jsonp还有配合php实现的jsonp。
最近在做一个自己的网站,才知道一个前端需要学习的东西到底有多少. 来吧~步入正题,我的网站空间很小.所以在资源上,就有点吼不住了.跨域拿数据肯定是不可避免的了. 一.原生js: 我们知道他的原理,就是 ...
- CentOS 7 上搭建 ownCloud 私有云
所需软件 & 环境 操作系统:CentOS 7.3.1711 最小安装 (已关闭 SELinux 和防火墙) 应用软件: Nginx .MariaDB .PHP .ownCloud 10 ...