Oracle RedoLog-二进制格式分析,文件头,DML,DDL
上篇文章,简单介绍了 RedoLog 是什么,以及怎么从 Oracle Dump 二进制日志。接下来,分析下 Redo Log 二进制文件的格式,主要包括:文件头,重做日志头,DML-INSERT 操作,DDL-CREATE 操作。
Redo Log 二进制文件中,采用的是小端序字节序。
原文链接:https://www.chuonye.com/archives/oracle-redolog-format.html
1. File Header
文件头,占用第一个块。Oracle 中许多二进制的数据和日志文件都有相似的格式,在线日志 Redo Log 文件也是如此。下图是 RedoLog 文件开始的前 80 字节。

File Type
前 2字节 表示文件类型,区分不同的 Oracle 文件,比如,在 10g 版本中:
0xA2表示数据文件,Data File0xC2表示控制文件,Control File0x22表示重做日志文件,Redo Log File
Oracle 数据库其实就是由一堆文件组成的。
Block Size
偏移量 20,长度 2字节,存储的是块大小,它的值是固定的,只会因操作系统而不同。在 Windows, Linux 和 Solaris 上,块大小为 512字节–0x0200,而 HP-UX 的块大小为 1024。
另外,每个块都有一个 16字节 的块头,稍后会介绍它。
Number of Blocks
偏移量 24,长度 4字节,存储的是文件中的块数,不包括文件头本身使用的块,可以这样计算出整个文件的大小:
(0x00019000 + 1) * 512 = 52429312 (50MB)
Magic
魔数只是文件标识,用来检查是否是 Oracle 文件。
Block Header
每个块都有一个 16字节 的头部,即使一个 Redo Record 横跨多个块,解析时这一点尤为重要。

上图黄色指示的是一个头部示例,每个块头都是以签名 0x0122 开头,其中:
- 偏移量
4,长度4字节,存储的是块在文件中的编号 - 偏移量
8,长度4字节,存储的是日志序号 - 偏移量
12,长度1字节,存储的是 Record 在该块内的字节偏移量
这三个值正好是 Record 的 RBA 内容。
最后偏移量 14,长度 2字节,存储的是校验和,用于验证数据是否完整,验证的逻辑这里就不记录了,感兴趣的可以在上篇描述的 PDF 文件内找到。
2. Redo Log Header
重做日志头,占用第二个块。这里包含的信息就多了,如数据库SID,数据库版本和开始记录的时间等。

3. Redo Record
Redo Record 包含一个 SCN 中的所有操作,由一个头和一个或多个 change vector 组成。比如往一个有索引的表中插入一条数据,会创建以下内容:
- 为 INSERT 操作,分别创建
redo change和undo change - 为索引改动,分别创建
redo change和undo change - 一个事务开始 change,一个事务提交 change
其中的每个 Change 都有一个操作码,用于区分,常见的操作码:
- 5.1:撤销修改 - Undo Record
- 5.2:事务开始
- 5.4:事务提交 - Commit
- 11.2:插入一行数据
- 11.3:删除一行数据
- 11.11:插入多行数据
- 11.19:更新多行数据
- 10.2:插入一个索引 - INSERT LEAF ROW
- 10.4:删除一个索引 - DELETE LEAF ROW
- 13.1:申请空间 - CREATE TABLE 后
- 24.1:DDL 操作
4. DML-INSERT
增删改是数据库基本操作,下图显示的是一个插入操作 Record 转成十六进制的信息。

Block 头的第 12 个字节 0x10,表示 Record 开始字节在偏移量 16字节 处;
Record 开始的前 2字节 表示长度,最大为 65536字节,因此它可能需要多个 block 存储。这里长度是 0x01A8=424 一个 block 足以存储。之后的第4个字节是 Record 头长度标识 VLD,具体数值取决于 Record 类型,这里的 0x0D 表示头长度为 0x44=68;
跳过 0x44字节 就能找到第一个 Change Vector,操作码是 0x0B02 - 11.2,即 INSERT 操作。在操作码后的第22字节,可以找到插入对象的ID,这里是 0x0057 - 87,在字典表 dba_objects 查询 data_object_id=87 的记录可知插入的表为 SYS.SYSAUTH$;
跳过 0x44+0x18字节,开始的2字节 0x000C=12 表示第一个 Change 的元素长度列表的长度,元素长度占用 2字节,12字节表示除头2字节外,总共有 (12-2)/2=5 个 长度元素,这意味着插入了 3个 字段内容。
0x0014和0x0031:这两个值是半固定的,表示 KTB 和 KDO 的长度0x0002:表示插入第一列的数据字节数为2字节0x0002:表示插入第二列的数据字节数也为2字节0x0003:表示插入第三列的数据字节数为3字节
上面的长度计算的是实际长度,但在计算偏移量是都需要 4字节对齐。跳过指定的字节后,可以得到三个字段的值为:
0xC102:表示的内容为 数字 10xC105:表示的内容为 数字 40xC20931:表示的内容为 数字 848
结合 SYSAUTH$ 的字段就能还原 SQL:
SQL> INSERT INTO SYS.SYSAUTH$ (GRANTEE#,PRIVILEGE#, SEQUENCE#) VALUES (1,4,848);
再往后有两个 Change,0x0502 和 0x0501。0x0502 可以解析出此次事务的 XID;0x0501 是撤销操作,INSERT 对应的就是 DELETE。
5. DDL-CREATE
虽然 DDL 语句已写入 Redo Log 文件中,但是在使用 ALTER SYSTEM DUMP LOGFILE 命令后,结果中没有语句,内容如下:
REDO RECORD - Thread:1 RBA: 0x000082.0000febf.002c LEN: 0x00f4 VLD: 0x01
SCN: 0x0000.003a061f SUBSCN: 1 03/13/2007 13:55:41
CHANGE #1 MEDIA RECOVERY MARKER SCN:0x0000.00000000 SEQ: 0 OP:24.1
操作码 24.1 表明是 DDL 操作。从 RBA 中,可以看到块编号为 0x0000febf (65215),块大小为 512,所以该操作在二进制文件的偏移量为 512*65215=33390080 ,十六进制为 0x01FD7E00:

可以清楚的看到 DDL 语句:
create user wiggywiggywiggy identified by VALUES '2FA1749D698AD874'
对应二进制格式映射信息是:

6. 总结
本文简单描述了二进制格式具体是什么,实际分析的时候也是这样,把二进制文件打开转成 16进制显示,一个字节一个字节的分析。如果做过网络编程,特别是 TCP 私有协议设计和解析,应该很容易理解。
下一篇会介绍解析的一些问题,比如 Record 头长度怎么计算,Rowid 怎么计算等等。
Oracle RedoLog-二进制格式分析,文件头,DML,DDL的更多相关文章
- PE文件格式详解,第二讲,NT头文件格式,以及文件头格式
PE文件格式详解,第二讲,NT头文件格式,以及文件头格式 作者:IBinary出处:http://www.cnblogs.com/iBinary/版权所有,欢迎保留原文链接进行转载:) PS:本篇博客 ...
- 第二讲,NT头文件格式,以及文件头格式
今天详解NT 头格式,以及文件头格式,以及作用, 关于DOS头文件格式,以及DOSStub昨天的博客已经写过了.主要是分散讲解.便于理解. 一丶最小PE的生成,以及标准PE的生成 ps: (如果直接学 ...
- 【.net 深呼吸】使用二进制格式来压缩XML文档
在相当多的情况下,咱们写入XML文件默认是使用文本格式来写入的,如果XML内容是通过网络传输,或者希望节省空间,特别是对于XML文档较大的情况,是得考虑尽可能地压缩XML文件的大小. XmlDicti ...
- myeclipse中java文件头注释格式设置
转载:http://www.blogjava.net/yxhxj2006/archive/2014/01/14/408940.html myeclipse中java文件头注释格式设置 windows ...
- .net下二进制序列化的格式分析[转]
.net下二进制序列化的格式分析[转] -- 综合应用 (http://www.Host01.Com/article/Net/00020003/) --- .net下二进制序列化的格式分析 (http ...
- XBMC源代码分析 6:视频播放器(dvdplayer)-文件头(以ffmpeg为例)
XBMC分析系列文章: XBMC源代码分析 1:整体结构以及编译方法 XBMC源代码分析 2:Addons(皮肤Skin) XBMC源代码分析 3:核心部分(core)-综述 XBMC源代码分析 4: ...
- PE文件头格式解析
前言: 昨天写了一题de1ctf的题,发现要脱壳,手脱之后发现要iat修复,我就发现自己在这块知识缺失了,win逆向,好像一直都是打ctf,然后用逆向方法论去肝的 其他方面倒是没有很深入学习,但实际上 ...
- 【CTF杂项】常见文件文件头文件尾格式总结及各类文件头
文件头文件尾总结 JPEG (jpg), 文件头:FFD8FF 文件尾:FF D9PNG (png), 文件头:89504E47 文件尾:AE 42 60 82GIF (gif), 文件头:47494 ...
- go 读取BMP文件头二进制读取
BMP文件头定义: WORD 两个字节 16bit DWORD 四个字节 32bit package main import ( "encoding/binary" "f ...
随机推荐
- 第11.12节 Python元字符“|”支持的正则表达式多选一匹配模式
re模块支持多个正则表达式使用"|"(逻辑或)模式来组合,扫描目标字符串时, '|' 分隔开的正则表达式组合从左到右进行匹配,只要其中一个匹配成功就认为该组合匹配成功,不再进行组合 ...
- 第14.15节 爬虫实战1:使用Python和selenium实现csdn博文点赞
写在前面:本文仅供参考学习,请勿用作它途,禁止转载! 在开始学爬虫时,学习了csdn博客专家(id:明天依旧可好 | 柯尊柏)<实战项目二:实现CSDN自动点赞>的文章,文章介绍了通过Py ...
- 第15.21节 PyQt(Python+Qt)入门学习:QListView的作用及属性详解
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 一.概述 QListView是从QAbstractItemView 派生的类,实现了QAbstrac ...
- 第十七章、Model/View开发:QListView的功能及属性
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 一.概述 QListView是从QAbstractItemView 派生的类,实现了QAbstrac ...
- [Java复习]架构部署 超时重试 幂等防重
画一下你们系统的整体架构图,说说各个服务在生产环境怎么部署的? 核心:服务框架.注册中心.网关 即使你没有用很多微服务架构里的东西,只要有上述三个东西,配合上写一些文档,接口文档,分布式系统架构,其实 ...
- linux替换项目jar包
查看服务是否启动,如果启动,则需要根据 pid 停止服务: # ps -ef | grep xxx.jar 杀掉该项目进程 # kill -9 pid号 再次查看进程 # ps -ef | grep ...
- 团队作业part3--需求改进&系统设计
一.需求&原型改进 1. 需求的修改 借鉴其他开发游戏的组的经验以及老师的建议,针对之前的需求分析,作出如下修改: 问题1:这款游戏对玩家的吸引力与驱动性有所不足. 修改1:增加成就系统与排行 ...
- Apriori 算法-如何进行关联规则挖掘
公号:码农充电站pro 主页:https://codeshellme.github.io 在数据分析领域有一个经典的故事,叫做"尿布与啤酒". 据说,在美国西部的一家连锁超市发现, ...
- mysql 基础入门 单表查询
单表查询 select 表头,表头 as 别名 ,表头(+-*/的运算) from table_a 1.条件查询 where + 条件 <> , != 不等于 = 等于,也可以表示字符串值 ...
- springboot中使用h2数据库(内存模式)
使用H2的优点,不需要装有服务端和客户端,在项目中包含一个jar即可,加上初始化的SQL就可以使用数据库了 在springboot中引入,我的版本是2.1.4,里面就包含有h2的版本控制 <!- ...