WiredTiger.wt文件是mongoDB的元数据文件,存储了其他数据库表的元数据信息。笔者最近遇到了WiredTiger.wt文件损坏的情况,MongoDB无法启动,数据库中的重要数据危在旦夕...

一、网上大多数文章的恢复方案 - 使用wt工具对数据进行打捞

由于笔者之前没有接触过MongoDB,对其知之甚少,只能参考网上的文章来试图恢复数据。看了下网上的文章,大多是说通过wt工具来打捞数据。然而wt工具打捞数据,需要WiredTiger.wt文件是完好可用,并不适用于笔者遇到的情形。

二、源码面前,了无秘密 - 读源码,直接从wt数据文件恢复数据

网上的恢复方案不对症,无奈只能另寻他法。

通过阅读wiredtiger的代码发现,wt数据文件中,数据库记录以bson格式存储的,并默认通过snappy进行了压缩,数据默认没有进行加密

1. wt数据文件结构分析

使用vim的十六进制模式观察collection*.wt数据文件发现:

  • wt数据文件的前4096字节是该wt文件的元数据信息
  • wt数据文件从4096开始存储数据库记录
  • wt数据文件的记录对齐4096

把视线聚焦到单独的某个记录上:

0001000: 0000 0000 0000 0000 0100 0000 0000 0000  ................
0001010: 70e2 0000 0200 0000 0705 0000 0060 0000 p............`..
0001020: fa49 5207 0100 0000 0581 80e2 c1c2 42e2 .IR...........B.
0001030: 0000 105f 6964 0057 0000 0010 7573 6572 ..._id.W....user
0001040: 9454 0000 0000 0000 b0c4 0330 5f69 6400 .T.........0_id.
0001050: e6a2 675c 1074 6173 6b01 0df0 4402 0000 ..g\.task...D...
0001060: 0002 696d 6167 655f 6e61 6d65 002f 0000 ..image_name./..
0001070: 006c 796d 7068 5f6e 6f64 655f 6d69 6372 .lymph_node_micr
0001080: 6f73 636f 7065 5753 495f 3139 3032 3238 oscopeWSI_190228
0001090: 5f31 3930 3330 3839 3231 312e 7376 7300 _1903089211.svs.
00010a0: 1069 053f e869 6400 7f09 0000 026a 736f .i.?.id......jso

在wiredtiger源码中定义每个数据数记录的存储格式:

  • 00 - 07 字节,recno,记录编号,关系不大
  • 00 - 15 字节,write_generation
  • 16 - 19 字节,记录解压后的size(记录默认是通过snappy压缩的),用于解压
  • 28 - 31 字节,在源码没找到,但是通过观察,应该是该记录的存储size,对齐4096,用于记录读取
2. 记录读取及snappy解压

从记录头部读取头部64字节的数据,从而解析到:

  • 记录解压后size,后文称 decompress_size
  • 记录存储size,后文称 store_size

从记录开头读取 store_size 字节的数据,跳过WT_BLOCK_COMPRESS_SKIP字节,对其后数据进行snappy解压,解压后数据总大小应为 decompress_size 。

3. 从记录中提取bson格式的数据

记录解压后,前面的很多字节并不是bson的数据,笔者也没详细去看前面的字节到底是什么,而是通过一个巧办法暴力地提取了bson格式的数据。

bson格式的前4个字节是bson数据的size,后面的数据会以 类型、名称、值这样的形式存储,具体可参考网上关于bson格式解释的文章

0001000: 0000 0000 0000 0000 0100 0000 0000 0000  ................
0001010: 70e2 0000 0200 0000 0705 0000 0060 0000 p............`..
0001020: fa49 5207 0100 0000 0581 80e2 c1c2 42e2 .IR...........B.
0001030: 0000 105f 6964 0057 0000 0010 7573 6572 ..._id.W....user

数据库记录中有个 _id 这样的字段、该字段的类型为32位数值,在bson中该类型表示为 0x10,因此这个32位数值类型的_id,会存储为105f 6964。其中,10是类型,5f 6964是_id,其后的32位存储了它的实际数值。
由于_id是bson数据中的第一个字段,根据bson格式定义,105f 6964前面的4个字节 42e2 0000是bson数据的大小,也就是bson数据的起始位置。

通过该寻找105f 6964,可以定位到bson数据的起始位置,并将bson数据存储成bson文件,如xxx.bson

4. 使用bsondump来解析bson文件,得到数据
[root@h-100 ~]# bsondump xxx.bson

三、切记、切记

使用MongoDB时,像WiredTiger.wt这样重要并不大的文件,多做备份,避免不必要的麻烦

五、关注笔者

专注笔者公众号,阅读更多干货文章:)

最牛MongoDB灾难恢复(WiredTiger.wt文件损坏,Mongo无法启动)的更多相关文章

  1. mongodump 失败且导致mongo服务挂掉【本质原因,wt文件损坏】

    ====================================================== 标题遇到的问题是我要解决的问题的中间环节. 原本问题是:需要在之前standlone的Mo ...

  2. 记:cloudstack--gluster主存储上的一个文件损坏导致SSVM启动失败

    cloudstack的系统vm(ssvm不停的重建失败).- 1.cloudstack-management 的关键日志 这行 cannot read header 'mnt.......':Inva ...

  3. 从损坏的wt文件中恢复出WiredTiger集合

    Reference: http://dev.guanghe.tv/2016/06/recovering-a-wiredtiger-collection-from-a-corrupt-wt-file.h ...

  4. mongodb文件损坏的恢复--无可恢复数据

    1.mongodb 启动异常error code 100,检查日志,数据文件损坏 2 检查collection-15-6548623434943640018.wt 可恢复数据,为空,不存在恢复的数据 ...

  5. (转)MongoDB 3.0 WT引擎参考配置文件

    mongodb 3.0 改变很多,从2.6版本升级到3.0要关注的细节很多,如权限等等.3.0在数据存储引擎上更换成了wiredTiger,在数据压缩方面很有效,解决大数据量问题的情况下,磁盘不够用的 ...

  6. MongoDB 3.0 WT引擎参考配置文件

    单实例: systemLog: destination: file ###日志存储位置 path: /data/mongodb/log/mongod.log logAppend: true stora ...

  7. MongoDB中WiredTiger的数据可用性设置

    此文已由作者温正湖授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. MongoDB中WiredTiger的参数配置主要通过 wiredtiger_open (http://so ...

  8. 用nginx-gridFS读取MongoDB的图片及文件(为什么你老是配不成功?)

    最近在部署公司服务器的nginx + mongodb + gridfs环境: 搜索了N多文档,基本上都一样,期间遇到很多问题: 下面是整理的一份搭建文档: 摘要 nginx-gridfs是一个ngin ...

  9. mongodb的mongod.lock文件及oplog文件

    在mongodb的启动时,在数据目录下,会生成一个mongod.lock文件.如果在正常退出时,会清除这个mongod.lock文件,若要是异常退出,在下次启动的时候,会禁止启动,从而保留一份干净的一 ...

随机推荐

  1. 大约PCA算法学习总结

    文章来源:http://blog.csdn.net/xizhibei ============================= PCA,也就是说,PrincipalComponents Analys ...

  2. XF 列表视图事件

    <?xml version="1.0" encoding="utf-8" ?><ContentPage xmlns="http:// ...

  3. DataSet 互相转换 List

    /// <summary> /// List <-> DataSet /// </summary> public class IListDataSet { /// ...

  4. SQL Server查询当前连接数

    行数就是连接数,每一行是连接详情 SELECT * FROM [Master].[dbo].[SYSPROCESSES] WHERE [DBID] IN ( SELECT [DBID] FROM [M ...

  5. EF 导航属性的使用

    using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threa ...

  6. SICP 1.17-1.19

    1.16 -------------> 不考虑0的情况 <------------ (define (fe b n) (define (fet m c) (cond ((= m n) c) ...

  7. Android零碎知识之Style and Theme

    Android的styles资源文件中存在了我们在应用中定义的各种style,它们都是以style开始的元素,包含许多属性的集合.但我们一般般它们分为style和theme,那它们有什么区别呢? 一. ...

  8. How to setup Assigned Access in Windows 10 (Kiosk Mode) 设置分配的访问权限(Kiosk模式)

    Let’s say you’re building some sort of ingenious mechanical contraption to be displayed in public th ...

  9. 我怎么忽略了身份框架魔法,只是使用OWIN验证的中间件,以获得要求我寻求什么呢?

    该OWIN中间件的东西第三方登录集成到您的ASP.NET应用程序是非常酷的,但我似乎无法弄清楚如何就剜出来的新的ID,它取代了蹩脚的成员身份 API.我没有兴趣在坚持所产生的债权,并在英法为基础的数据 ...

  10. Model-View-Controller Explained in C++

    The Permanent URL is: Model-View-Controller Explained in C++. The Model-View-Controller (MVC) is not ...