mysql的innodb数据存储结构

数据库磁盘读取与系统磁盘读取

1，系统从磁盘中读取数据到内存时是以磁盘块（block）为基本单位，位于同一个磁盘块中的数据会被一次性读取出来。

2，innodb存储引擎中有页（Page）的概念，页是数据库管理磁盘的最小单位，innodb存储引擎中默认每个页的大小为16kb，每次读取磁盘时都将页载入内存中。

3，系统一个磁盘块的大小空间往往没有16kb这么大，因此innodb每次io操作时都会将若干个地址连续的磁盘块的数据读入内存，从而实现整页读入内存

问题：数据库的数据结构时怎样的？B树和B+树有什么区别，为什么选择B+树作为存储数据的结构，而不是B树？

B树和B+树

Btree

一个M阶的B-tree有如下特点

1，每个节点最多有m个孩子（分叉），

2，除了根节点和叶子节点外，其他每个节点至少有ceil（m/2）个孩子

3，若根节点不是叶子节点，则至少有两个孩子

4，所有叶子节点都再同一层，且不包含其他关键字信息

5，每个非终端节点包含n个关键字信息，关键字的个数n满足ceil(m/2)-1<=n<= m-1 其中m为阶数

6，ki(i=1,…n)为关键字，且关键字（主键primary key）升序排序。

7，. Pi(i=1,…n)为指向子树根节点的指针。P(i-1)指向的子树的所有节点关键字均小于ki，但都大于k(i-1);

B-tree每个节点都包含指针，key以及data，每个节点含有三个指向子节点的指针和两个升序排序的关键字（key）

模拟查找关键字29的过程：

1. 根据根节点找到磁盘块1，读入内存。【磁盘I/O操作第1次】

2. 比较关键字29在区间（17,35），找到磁盘块1的指针P2。

3. 根据P2指针找到磁盘块3，读入内存。【磁盘I/O操作第2次】

4. 比较关键字29在区间（26,30），找到磁盘块3的指针P2。

5. 根据P2指针找到磁盘块8，读入内存。【磁盘I/O操作第3次】

6. 在磁盘块8中的关键字列表中找到关键字29。

分析上面过程，发现需要3次磁盘I/O操作，和3次内存查找操作。由于内存中的关键字是一个有序表结构，可以利用二分法查找提高效率。而3次磁盘I/O操作是影响整个B-Tree查找效率的决定因素。

B树上大部分的操作（插入、删除、查询）所需要的磁盘存取次数和B树的高度是成正比的，并且B树是尽量多的在节点上存储信息，保证导数尽量少，在B树中可以检查多个子结点，由于在一棵树中检查任意一个结点都需要一次磁盘访问，所以B树避免了大量的磁盘访问，减少了磁盘I/O。

B+tree

毫无疑问，减少树的高度是有效减少IO次数提高效率的方式，b-tree结构每个节点不仅包含key值，还有data值，每一个页的存储（16kb）是有限的，每个节点可容纳的指针和keydata是有，如果data数据含量大，那么一个页保存的指针和key的数量就会减少，从而增页节点的数量，这就增加btree的深度，增加读取磁盘的次数，进而影响查询效率

而在b+tree中，一个节点记录的都是key值和指针（排除了data值），这样就可以记录更多的key值，其key值是升序排序，

B+tree和b-tree有如下不同点

1，非叶子节点只存储键值信息（key信息）

2，所有叶子节点之间都有一个链指针，数据都存放再叶子节点中

推算

innodb存储引擎一页的大小为16kb，一般主键类型为int占4个字节，或bigint占8个字节，指针类型页一般4个或8个字节，也就是说一个页中大概存储16*1024/16=1024个key，深度为3的B+tree索引（三页）可以维护1024*1024*1024=10亿条记录，实际情况每个节点不可能填满，B+tree的高度一般为2-4曾，mysql的innodb存储引擎将根节点常驻内存，也就是查找某一键值的行记录最多需要1-3次磁盘IO操作

页的概念，

页是innodb读取磁盘的最小单位，整页整页的读取

页分为，数据页（BTreeNode），Undo页（undo Log page），系统页（Systempage）,事务数据页（Transaction SystemPage）每个数数据页的大小为16kb，每个page使用一个32位int值来表示，

一个page的基本结构

1，0-38：page头部，id，类型信息等占38个字节，头部保存两个指针分别指向前一个page和后一个page，page是一个双向列表

2，38-16376：不同的类型页所含的数据不同，这部分空间包含系统记录（SystemRecord）和用户记录（UserRecord），我们表中的一条条记录就放在UserRecord部分，UserRecord存放的内容可以是以下内容

a,主键索引树非叶子节点,B+tree索引，和指针

b,主键索引树叶子节点，key和data（就是记录本身）

c,辅助键索引树非叶子节点,B+tree辅助索引

d,辅助键索引树叶子节点，key和data（这里的data是主键）

页可以装很多种数据信息，有的页是B+树的所有主键索引，有的页是B+树的叶子节点也就是数据记录本身，有的页是我们创建的二级索引，

16376-16384：page尾部

页和节点的关系

页和节点没有强相关关系

由页组成的链表，页之间是双向列表，页里面的数据是单向链表，这种结构组成了主键索引B+树，组成了叶子节点数据。

定位一条记录的过程，select * from table where id = 29

系统经过解析sql语句，首先读取装有非叶子节点page页，遍历非叶子节点，这个过程随着节点的遍历会将一个或多个page页加载到内存，直到定位到这条记录的叶子节点，然后遍历找出该条记录。

如果使用了二级索引则先读取二级索引page遍历这个二级索引，找到装有主键信息叶子节点page页，遍历找到该主键。然后再根据主键索引寻找到该条记录

https://mp.weixin.qq.com/s?__biz=MzI4NTEzMjc5Mw==&mid=2650554818&idx=1&sn=ff0bd7677c431d42ed2346f1aa4e2b7d&chksm=f3f83354c48fba4293a6d0f7bab8aa5744ffaa31a0c42f5419fee63fcbb7f0658413850f5399&token=1663379705&lang=zh_CN#rd

mysql的innodb数据存储结构的更多相关文章

InnoDB数据存储结构
MySQL服务器上存储引擎负责对表中数据的读取和写入工作,不同存储引擎中存放的格式一般是不同的,甚至有的存储引擎(Memory)不用磁盘来存储数据. 页 (Page) 是磁盘和内存之间交互的基 ...
MySQL之InnoDB数据页结构(转自掘金小册 MySQL是怎样运行的，版权归作者所有！)
InnoDB为了不同的目的而设计了不同类型的页,我们把用于存放记录的页叫做数据页. 一个数据页可以被大致划分为7个部分,分别是 File Header,表示页的一些通用信息,占固定的38字节. Pag ...
mysql之innodb存储引擎---数据存储结构
一.背景 1.1文件组织架构首先看一下mysql数据系统涉及到的文件组织架构,如下图所示: msyql文件组织架构图从图看出: 1.日志文件:slow.log(慢日志),error.log(错误日 ...
MySQL InnoDB 逻辑存储结构
MySQL InnoDB 逻辑存储结构从InnoDB存储引擎的逻辑结构看,所有数据都被逻辑地存放在一个空间内,称为表空间,而表空间由段(sengment).区(extent).页(page)组成.p ...
MYSQL Innodb逻辑存储结构
转载于网络这几天在读<MySQL技术内幕 InnoDB存储引擎>,对 Innodb逻辑存储结构有了些了解,顺便也记录一下: 从InnoDB存储引擎的逻辑存储结构看,所有数据都被逻辑地存放 ...
Mysql+innodb数据存储逻辑
Mysql+innodb数据存储逻辑. 表空间由段,区,页组成 ibdata1:共享表空间.即所有的数据都存放在这个表空间内.如果用户启用了innodb_file_per_table,则每张表内的数据 ...
InnoDB 逻辑存储结构
本文同时发表在https://github.com/zhangyachen/zhangyachen.github.io/issues/80 如果创建表时没有显示的定义主键,mysql会按如下方式创建主 ...
Innodb页面存储结构-2
上一篇<Innodb页面存储结构-1>介绍了Innodb页面存储的总体结构,本文会介绍页面的详细内容,主要包括页头.页尾和记录的详细格式. 学习数据结构时都说程序等于数据结构+算法,而在i ...
InnoDB逻辑存储结构
从InnoDB存储引擎的逻辑存储结构看,所有数据都被逻辑地存放在一个空间中,称之为表空间(tablespace).表空间又由段(segment).区(extent).页(page)组成.页在一些文档中 ...

随机推荐

Spark sql -- Spark sql中的窗口函数和对应的api
一.窗口函数种类 ranking 排名类 analytic 分析类 aggregate 聚合类 Function Type SQL DataFrame API Description Ranking ...
CKA认证简介
C# 发送Post请求（带参数）
此处内容传输都是用UTF-8编码 1.不带参数发送Post请求 /// <summary> /// 指定Post地址使用Get 方式获取全部字符串 /// </summary> ...
traefik安装
注意这篇文档有个错误,需要改正一下: 1.nginx1-7.yaml nginx1-8.yaml traefik.yaml 这三个文件里面的80端口需要改成8080端口,否则报错,其他的文件不变. 2 ...
Zabbix使用主动模式进行监控配置方法
一直都是在用Zabbix的被动模式(即默认模式)进行监控. 但是总有些情况是不适用被动模式的,刚好工作上有这个需求,于是捣鼓了一下,发现配置起来也挺简单的. (1)Agent配置修改Zabbix-a ...
centos7安装rsync及两台机器进行文件同步
安装及配置 yum -y install rsync #启动rsync服务 systemctl start rsyncd.service systemctl enable rsyncd.service ...
dd命令的使用
1.dd命令的使用 dd命令用于复制文件并对源文件的内容进行转换和格式化处理,在有需要的时候可以使用dd命令对物理磁盘进行操作,使用dd对磁盘操作时,最好使用块设备文件. (1)命令语法 dd (选项 ...
WPS应用技巧
打开云文档的文件:文件-打开-我的云文档 (选择时的文档为PDF时仅扫描PDF文件)
C++中几种字符串表示方法
最近学习C++时,被几种字符串搞的有点乱,这里记录一下. c++中有两种风格字符串,分别是: C++风格字符串 C风格字符串它们各自的声明方式如下: void main(){ string a = ...
Django框架之第五篇（模板层） --变量、过滤器、标签、自定义标签、过滤器，模板的继承、模板的注入、静态文件
模板层模板层就是html页面,Django系统中的(template) 一.视图层给模板传值的两种方法方式一:通过键值对的形式传参,指名道姓的传参 n = 'xxx'f = 'yyy'return ...

mysql的innodb数据存储结构

mysql的innodb数据存储结构的更多相关文章

随机推荐

热门专题