mysql学习笔记-底层原理详解

前言

我相信每一个程序员都避免不了和数据库打交道，其中Mysql以其轻量、开源成为当下最流行的关系型数据库。Mysql5.0以前以MyISAM作为默认存储引擎，在5.5版本以后，以InnoDB作为默认存储引擎，相比MyISAM，InnoDB完整的支持ACID事务特性,同时支持行级锁，支持事务这一特性也决定了InnoDB代替MyISAM成为主流存储引擎的一大决定性因素。

本文着重分析Mysql的创建流程以及InnoDB引擎特性，其他数据库存储引擎不在本次分享之列。

Mysql系统架构图

mysql整体包含四大部分：

连接层：包含各种组件和连接交互接口(Connectors:各种语言可以操控SQL的基础，支持各种语言)

核心层：也被称作SQL Laye,包括安全、权限、sql解析、缓存、执行优化。我们常用的视图、存储过程、触发器等功能的实现也集中在这一层

存储引擎层：也被Storage Engine Layer，由多种存储引擎共同组成，负责存储和获取数据。服务器是通过存储引擎API来与它们交互的。MySQL中的存储引擎可以实现插件式管理，它提供了一系列标准的管理和服务支持。

系统层：实际存储一些数据库文件以及日志文件等

连接层主要是一些操作sql的组件，例如Java中的JDBC(后面会有博客专门分享它)、系统层则是一些系统保存下的数据库物理文件，本文不做重点介绍，下面着重介绍下核心层和系统层

Sql执行流程图

连接层

如上图(Sql执行流程)所示，我们Sql执行首先是客户端向MySQL服务器发送一条查询请求，与connectors交互，连接池认证相关处理。

半双工通信：Mysql客户端/服务端通信协议是一种半双工的通信信道，什么叫半双工呢？半双工指的是允许客户端和服务端双方相互通信，但是同一时刻只允许存在单向通信。对于查询sql来讲，大多数都是客户端发送的查询数据包较小且为单个数据包，服务端返回的数据包较大且较大时大多拆分为多个数据包，多个数据包都需要被客户端完整接收才算是查询结束，这也是为什么在实际开发中要求我们避免使用select *以及增加limlt查询条件的原因之一。
Connectors(连接器)的职责就是维护上述过程中的连接通到，包括建立连接、权限表验证、维持连接和关闭连接。新建和关闭应该不用过多描述；权限表验证是从user、host、db等表查出权限，放置在连接的上下文中(也就是说已经打开的链接不受权限变更影响)。维持连接则指的是Connectors需要保障完全接收服务器响应的数据包，不能出现丢包的情况。
Connection Pool(连接池) ：作为一个单进程多线程的应用，mysql连接也参照实现一种池化

对于mysql连接，任何时刻都有一个状态，该状态表示了mysql当前正在做什么。使用show full processlist命令查看当前状态。下面是这些状态的解释：

sleep：线程正在等待客户端发送新的请求；

query：线程正在执行查询或者正在将结果发送给客户端；

locked：在mysql服务器层，该线程正在等待表锁。在存储引擎级别实现的锁，例如InnoDB的行锁，并不会体现在线程状态中。对于MyISAM来说这是一个比较典型的状态。

analyzing and statistics：线程正在收集存储引擎的统计信息，并生成查询的执行计划；

copying to tmp table：线程在执行查询，并且将其结果集复制到一个临时表中，这种状态一般要么是做group by操作，要么是文件排序操作，或者union操作。如果这个状态后面还有on disk标记，那表示mysql正在将一个内存临时表放到磁盘上。

sorting Result：线程正在对结果集进行排序。

sending data：线程可能在多个状态间传送数据，或者在生成结果集，或者在想客户端返回数据。

核心层

我们之前说过，核心层包括安全权限(Management Services & Utilities 、)、sql解析(Parser)、缓存(cache)、执行优化(Optimizer)四块，不过还应该再加上SQL Interface(Sql接口)，这一块主要是承担和连接层的交互的作用。所以归纳而言

名称	说明
Management Services & Utilities	MySQL 的系统管理和控制工具，包括备份恢复、MySQL 复制、集群等。
SQL Interface（SQL 接口）	用来接收用户的 SQL 命令，返回用户需要查询的结果。
Parser（查询解析器）	包含验证和解析两部分，以便可以转换为MySQL优化器可以识别的数据结构或返回 SQL 语句的错误。
Optimizer（查询优化器）	验证权限和优化查询。举个例子 `SELECT id, name FROM student WHERE sex = "女";`,SELECT 查询先根据 WHERE 语句进行选取，而不是将表全部查询出来以后再进行`sex`过滤。这就属于一种优化。 SELECT 查询先根据 id 和 name 进行属性投影，而不是将属性全部取出以后再进行过滤，将这两个查询条件连接起来生成最终查询结果。所以说Mysql是使用“选取-投影-连接”策略进行查询。
Caches & Buffers（查询缓存）	查询的时候如果发现缓存中有(hash实现)，就直接返回缓存中的结果。这个缓存机制是由一系列小缓存组成的，比如表缓存、记录缓存、key 缓存、权限缓存等。

Caches & Buffers（查询缓存）

对select查询结果做缓存，这个缓存可能包含多个小缓存，缓存的key值是通过查询本身、当前要查询的数据库、客户端协议版本号等一些可能影响结果的信息计算得来。所以两个查询在任何字符上的不同 (例如 : 空格、注释)，都会导致缓存不会命中。

MySQL 8.0版本中查询缓存的功能已经被删除

Management Services & Utilities

主要为Mysql的管理服务和一些工具组件，主要作用是对数据的恢复、回滚，以及数据迁移、复制、元数据的管理。主要为以下功能

数据库备份和恢复
数据库安全管理，如用户及权限管理
数据库复制管理
数据库集群管理
数据库分区，分库，分表管理
数据库元数据管理

SQL Interface（SQL 接口）

主要是用来接收Sql信息和返回执行结果.大体可以分以下几类：

Data Manipulation Language (DML).
Data Definition Language (DDL).
存储过程
视图
触发器

Parser（查询解析器)

  主要是对传递过来sql的分解，先对语法进行验证检查。语法检查通过后，解析器会查询缓存，如果缓存中有对应的语句，就直接返回结果不进行接下来的优化执行操作。

ps: 缓存中数据被修改，会被清出缓存。

Optimizer（查询优化器）

  Optimizer阶段主要就是对sql的优化了，通过系统规则选定最优的执行方案。这个过程包括选择语法、常量转换与计算、无效代码排除、AND/OR等等，必要时还可能查询存储引擎，获得最优策略。

Pluggable Storage Engine(存储引擎层)

作为Mysql最具有特色的一块地方，Mysql将存储引擎作为一个抽象类，InnoDB、MyISAM、BDB、Memory等等都是其子类。5.5版本以后以InnoDB作为其默认实现。目前除mysql以外其他大多都是单一存储引擎。

ps:存储引擎是基于表的，而不是数据库

InnoDB(默认存储引擎)

完整的支持ACID事务
支持行级锁
支持外键
使用聚集索引，索引和数据绑在一起在一个逻辑空间上，b+树叶子节点对于主键索引存储的是数据，对于辅助索引(二级索引)对应的则是主键的值
count扫全表
必须存在唯一索引(主键)

MyISAM

不支持事务，但是插入和更新更快
支持表级锁
不支持外键
使用非聚集索引，索引和数据分离的，b+树叶子结点均存储的是实体数据文件地址的指针
count走变量不走全表
唯一索引非必要

对于存储引擎的分析在下一篇博客会着重介绍，这里先介绍整个Mysql的架构，通过架构可以反应出一个sql的执行流程

文件系统层

    磁盘最小单位是512字节，操作系统是4KB，mysql里最小的是page（页面）有16K

因为基于存储引擎的不同，底层文件结构也会有些不同，比如InnoDB：frm是表定义文件，ibd是数据文件，而MyISAM：myd是数据文件，myi是索引文件。InnoDB还有redo Log、undo Log

结尾

本篇博客作为一个Mysql全局概览的介绍，由连接层自上而下的说明了整个Mysql的结构组成，但是Mysql核心还是在存储引擎上，所以后面会专门拿出一篇博文来介绍InnoDB默认引擎，巩固自己的知识点。

扫一扫，关注我的公众号

mysql学习笔记-底层原理详解的更多相关文章

Spring Aop底层原理详解
Spring Aop底层原理详解(来源于csdn:https://blog.csdn.net/baomw)
expect学习笔记及实例详解【转】
1. expect是基于tcl演变而来的,所以很多语法和tcl类似,基本的语法如下所示:1.1 首行加上/usr/bin/expect1.2 spawn: 后面加上需要执行的shell命令,比如说sp ...
线程池底层原理详解与源码分析（补充部分---ScheduledThreadPoolExecutor类分析）
[1]前言本篇幅是对线程池底层原理详解与源码分析的补充,默认你已经看完了上一篇对ThreadPoolExecutor类有了足够的了解. [2]ScheduledThreadPoolExecut ...
Docker技术入门与实战第二版-学习笔记-3-Dockerfile 指令详解
前面已经讲解了FROM.RUN指令,还提及了COPY.ADD,接下来学习其他的指令 5.Dockerfile 指令详解 1> COPY 复制文件格式: COPY <源路径> .. ...
Struts2学习笔记(二)——配置详解
1.Struts2配置文件加载顺序: default.properties(默认常量配置) struts-default.xml(默认配置文件,主要配置bean和拦截器) struts-plugin. ...
vue.js学习笔记(二)——vue-router详解
vue-router详解原文链接:www.jianshu.com 一.前言要学习vue-router就要先知道这里的路由是什么?为什么我们不能像原来一样直接用<a></a> ...
HBase 底层原理详解（深度好文，建议收藏）
HBase简介 HBase 是一个分布式的.面向列的开源数据库.建立在 HDFS 之上.Hbase的名字的来源是 Hadoop database,即 Hadoop 数据库.HBase 的计算和存储能力 ...
Redis学习笔记4-Redis配置详解
在Redis中直接启动redis-server服务时, 采用的是默认的配置文件.采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务.按照本Redi ...
Struts2学习笔记二配置详解
Struts2执行流程 1.简单执行流程,如下所示: 在浏览器输入请求地址,首先会被过滤器处理,然后查找主配置文件,然后根据地址栏中输入的/hello去每个package中查找为/hello的name ...

随机推荐

visual studio自动向量化
//////////////////////////////////////////////////*SSE 和 AVX 每个都有16个寄存器SSE 有 XMM0 ~ XMM15,是128bitAVX ...
Python基础—基础数据类型list（Day4）
基础数据类型四.list列表存放大量数据,大量的数据在列表中便于操作,列表示有序的,有索引值,可切片,方便取值. 1.list的增 1).append('元素') 在列表后面按元素添加 ...
Redis 中 String 类型的内存开销比较大
使用 String 类型内存开销大 1.简单动态字符串 2.RedisObject 3.全局哈希表使用 Hash 来存储总结参考使用 String 类型内存开销大如果我们有大量的数据需要来保 ...
Python "爬虫"出发前的装备之一正则表达式
1. 正则表达式正则表达式是一种模板表达式语言通过定义规则去匹配.查找.替换.分割一个长字符串中特定的子字符信息. 如在一篇文章中查找出所有合法的电子邮箱地址,则可以先用正则表达式定义一个电子邮箱 ...
[VM trunk ports]opensatck VM 单网卡,多VLAN配置
描述需求产生场景 1.用户在虚机运行 K8S ,采用 VLAN 模式组网,要求 VM 端口要支持 trunk,支持多个 VLAN 网络数据在同一虚拟网卡上传输. 2.需要动态的增删虚拟机上的网络接口 ...
查看jQuery版本号
1. 看源码 2. 用方法 console.log($().jquery) console.log($.fn.jquery)
kali linux开启ssh
虚拟机中安装好Kali linux 2.0,如何从windows中通过SecureCRT.putty或XShell等工具远程到Kali中. [GeeK]出诊过程如下: 1.首先在window10中te ...
AWVS漏洞扫描教程之扫描方式
实验目的掌握AWVS的基本用法. 实验原理 Acunetix Web Vulnerability Scanner是一个网站及服务器漏洞扫描软件. 实验内容对Web站点进行安全测试. 实验环境描述 ...
Linux：保证数据安全落盘
背景在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据.但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer ...
【C# 线程】 atomic action原子操作|primitive(基元、原语)
概念原子操作(atomic action):也叫primitive(原语.基元),它是操作系统用语范畴.指由若干条指令组成的,用于完成一定功能的一个过程. 原语是由若干个机器指令构成的完成某种特定 ...