类型相关

INT(1)和INT(20)对于存储和计算来说，意义是相同的，他不会限制值的合法范围，只是一些交互工具会用来显示字符的个数

默认是有符号的，可以指定为无符号，增加数据存储范围，如0-255，可以声明unsigned

整数比字符操作代价更低，因为字符集和校对规则使字符更复杂，如果是ip，也应该用整型存储

尽量避免NULL：如果查询中包含可能为null的列，对Mysql来说更难优化。它使索引、索引统计和值都比较复杂，可为NULL的列会使用更多的存储空间，当为Null的列表被索引时，每个索引记录需要一个额外的字节，尽量不为NULL列建索引【InnoDB例外，它使用单独的bit存储NULL值，对于很多值为NULL，少数非NULL有很好的空间效率】

char适合存储定长的值，它占用的存储空间固定

varchar适合存储可变长的值，由于值的长度可变，所以存储的空间不确定，当一个内存页无法容纳完varchar数据占用的空间时，innodb会分裂成两页

varchar适合：列的更新少，使用了复杂的字符集，每个字符使用不同的字节数存储时

varchar保存时占用空间： 1-byte or 2 byte + data

BLOB、TEXT:

值太大时，Innodb会分配额外的存储区域，每个值在行内需要1到4个字节存储一个指针

Blob存储的二进制数据，没有排序规则和字符集

TIMESTAMP只能保存1970年到2038年，显示的值依赖当前的时区

Datetime从1001年到9999年，类似字符串，因此和时区无关

字符集相关

字符集：

unicdoe一个字符统一用2个字节来标识，不管是汉字还是英文字母，还是符号，因此空间会有浪费

utf-8是一种变长的编码方式，使用1-4个字节，当字符在ascii码范围，就用一个字节标识，一个中文字符占3个字节

utf-8是广义的unicode字符集的实现方案，他已经尽力节省了空间，但GBK这种字符集还在大行其道，因为GBK是为中文量身定制的，他的空间更少，只是只支持中文，其他文字如韩文，会乱码，因此特定场景下还是有优势的

优化操作

从行缓冲中将编码过的列转换成行数据结构的操作代价是很高的，所以，用什么字段，取什么字段

粗略的经验法则：单个查询关联的表在12个表以内

大表的alter table可能会很慢，Mysql执行大部分修改表结构操作的方法是用新的结构创建一张表，从旧表中插入所有数据，删除旧表，如果服务器内存不足，有很大可能会持续几个小时

聚簇索引

聚簇索引指的是数据行存放在索引的叶子页中，一个表只能有一个聚簇索引

如果一个索引包含了所有需要用到的值，就叫覆盖索引，对于innodb，可以避免对主键索引的二次查询，效率很高

聚簇索引：索引和数据在一起，数据在叶子节点上，非叶子节点不存存储数据，这就决定了一个表只会有一个聚簇索引，B+树结构，适合排序？

优点:访问同一页的不同行数据时，如果数据页已经被加载到内存中，就不用再访问磁盘了

缺点：插入或修改时，代价昂贵，可能导致内存页一分为二；同时建议使用int主键，如果有uuid或其他规则的字符串做主键，可能导致索引稀疏，查询慢

辅助索引：叶子节点存放的不是数据，而是主键id，所以使用辅助索引，会先查到主键id，再查找到数据页

BTree:非叶子节点上也有数据，适合随机检索，越靠近root，磁盘i/o时间越少，速度越快

有j个孩子的节点，恰好有j-1个关键字

红黑树：弱平衡二叉树，每个节点到叶子节点的高度相同，java TreeMap,因此查询效率相当，数据存在节点上(所有节点上都有数据)

B+树blog:https://www.cnblogs.com/dreamworlds/p/5398535.html

为什么不把b+树的真实数据放到非叶子节点：导致每个磁盘存放的数据变多，而磁盘容量大小有限，最终导致磁盘块数据增大，进而导致树的高度增高，树的高度增高后，一次索引查询的磁盘i/o次数变多，磁盘i/o是耗时操作！这实际提高了空间利用率

B+树查询效率稳定,还实现了range-query，扫描所有叶子节点就能扫描全库，这也是数据库使用它作为索引的数据结构的重要原因

mysql分区表

分区表并没有一个全局索引，索引只是在各个底层表上各自加上完全相同的索引，并且操作对程序是暗箱的，有一定风险

redo undo

Redo Log:记录已经commit但尚未写到磁盘的事务的最新数据，保证持久性

Undo Log:记录操作前的数据，方便崩溃回滚，在事务中想看到修改前的数据时，也会用到undo Log，undo log记录了修改前的数据

Innodb

Redo Log包含了Undo Log的内容、事务回滚时的操作

一个被回滚的事务，在恢复时，会先修改redo，再undo，因此不会破坏数据唯一性

==join原理

https://www.cnblogs.com/shengdimaya/p/7123069.html

innodb 特性

innodb会把>=768bytes的定长field转换可变长field，如char(255)可能存放超过768bytes数据，如utf8md4字符集中，一个字符最多可能占用4个字节，255个字符最多占用255*4= 10220bytes

innodb 默认row-format = Dynamic

dynamic row format

支持了page压缩 format格式下，innodb会把一行的最长的可变长那些列放到单独的off-page中去，并在cluster index上为溢出页保留一个20byte的指针，直到cluster index leaf-node page可以装下它。这通常和page大小以及row占用的总字节长度有关。

当行太长时，将选择最长的列放到页外存储，直到聚集索引记录适合B树页的大小。同时，小于或等于40字节的文本列和BLOB列存储在行中。

disk I/O

Innodb 会使用异步的disk I/O，如果可以的话。方法为：创建一些I/O线程，同时允许在I/O仍在进行时继续执行其他数据库操作。Linux和Windows环境下，会使用可用的OS library方法执行native的异步I/O

How Pages Relate to Table Rows

https://dev.mysql.com/doc/refman/5.7/en/innodb-file-space.html

最大的row length 为略微低于数据页 size的一半，如默认情况page size =16KB ,则单行数据要略小于8KB

如果row没有超过超过最大row length,它的所有列都会存到这个page中。

反之，则会将可变长的列放到额外的off-page中，直到满足row length限制。

额外的off-page依据列存放依赖row format:

COMPACT and REDUNDANT Row Formats 存储前768 bytes在当前row中，其余的放到溢出页中，768个字节中包含了20-byte的value存储列的真实长度及溢出数据存储的位置

DYNAMIC and COMPRESSED Row Formats 存储20-byte的指针在当前row中

Buffer pool

https://dev.mysql.com/doc/refman/5.7/en/innodb-change-buffer.html

Buffer pool一般会配置为mysql实例的80%的内存，来提高查询速度

基于LRU算法，将Pool分为New Sublist和OldSublist，新增的查询会放到New Sublist，同时可能淘汰掉Old空间的数据

change buffer

Innodb有一个Change Buffer,会将二级索引页的的改变缓存起来

清理操作周期性且高效的更新索引页到磁盘

合并Change Buffer的过程中可能会花费几个小时，当有很多受影响的行或者众多的二级索引需要更新时。在这段时间中，disk I/O会增加，可能导致显著的磁盘绑定查询变慢。

Change Buffer merging也可能在事务提交后、关机、重启时发生。

在内存中，change buffer占据了buffer pool的部分空间。

在磁盘中，change buffer 是system tablespace的一部分

读高性能Mysql摘要的更多相关文章

读高性能MySql笔记
1.1 MySQL逻辑架构 MySql服务器逻辑架构图 1.连接管理与安全性每个客户端连接都会在服务器进程中拥有一个线程,这个连接的查询只会在这个单独的线程中执行,该线程只能轮流在某个CPU核心或者 ...
mysql中的范式与范式——读<<高性能mysql>>笔记一
对于任何给定的数据库通常都有很多表示方法,从完全的范式化到完全的反范式化,以及两者的折中.在范式化的数据库中,每个事实数据会出现并且只出现一次.相反,在反范式化的数据库中,可能会存储在多个地方. 那什 ...
高性能Mysql主从架构的复制原理及配置详解
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
1121高性能MySQL之运行机制
本文来自于拜读<高性能MySQL(第三版)>时的读书笔记作者:安明哲转载时请注明部分内容来自<高性能MySQL(第三版)> MySQL的逻辑构架 MySQL服务器逻辑架构最上 ...
《高性能MySQL》读书笔记－－锁、事务、隔离级别转
1.锁为什么需要锁?因为数据库要解决并发控制问题.在同一时刻,可能会有多个客户端对表中同一行记录进行操作,比如有的在读取该行数据,其他的尝试去删除它.为了保证数据的一致性,数据库就要对这种并发操作进 ...
《高性能MySQL》
<高性能MySQL>(第3版)讲解MySQL如何工作,为什么如此工作? MySQL系统架构.设计应用技巧.SQL语句优化.服务器性能调优.系统配置管理和安全设置.监控分析,以及复制.扩展和 ...
转:高性能Mysql主从架构的复制原理及配置详解
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
高性能Mysql主从架构的复制原理及配置详解(转)
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
《高性能MySQL（第3版）》【PDF】下载
内容简介 <高性能mysql(第3版)>是mysql 领域的经典之作,拥有广泛的影响力.第3版更新了大量的内容,不但涵盖了最新mysql5.5版本的新特性,也讲述了关于固态盘.高可扩展性设 ...

随机推荐

.NET Core加解密实战系列之——使用BouncyCastle制作p12(.pfx)数字证书
简介加解密现状,编写此系列文章的背景: 需要考虑系统环境兼容性问题(Linux.Windows) 语言互通问题(如C#.Java等)(加解密本质上没有语言之分,所以原则上不存在互通性问题) 网上资料 ...
Spring学习（九）Spring 和数据库编程【了解】
一.传统 JDBC 回顾用一个大佬的demo来简单看一下 /** * 使用jdbc,根据id查询单个Student的信息 */ public class JdbcManage { public St ...
搜索引擎学习（三）Lucene查询索引
一.查询理论创建查询:构建一个包含了文档域和语汇单元的文档查询对象.(例:fileName:lucene) 查询过程:根据查询对象的条件,在索引中找出相应的term,然后根据term找到对应的文档i ...
jwt攻击手段
jwt 秘钥泄漏/敏感文件泄漏在一些配置文件被我们可查的情况下,包括各种文件读取,源码泄漏,此时伪造身份就变得很容易了. 空加密算法对于明文的加密算法通常为HS256,在jwt中分为三个部分,以点 ...
pwnable.kr-shellshock-witeup
思路是:发现文件执行没什么好反馈显示结果的,于是看文件和权限,通过bash文件猜测可能存在破壳漏洞(CVE-2014-6271)漏洞,于是利用它并结合文件权限成功获得flag. 通过scp下载文件至本 ...
MySQL: 2、SQL语言
一.SQL的简介: 1.SQL的概念: SQL就是结构化查询语言,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询.更新和管理关系数据库系统 2.SQL的作用: - ...
MySQL-Atlas--读写分离架构
一.Atlas简介 Atlas是由 Qihoo 360公司Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目.它在MySQL官方推出的MySQL-Proxy 0.8.2版本的基础 ...
selenium学习之元素等待(四)
--为什么要设置元素等待: 目前大多数web应用程序都是使用AJAX和JavaScript开发,每次加载一个网页,包括静态网页和动态网页,也就是加载各种HTML标签和JS文件.在网页中进行元素定位时, ...
060 01 Android 零基础入门 01 Java基础语法 06 Java一维数组 07 冒泡排序
060 01 Android 零基础入门 01 Java基础语法 06 Java一维数组 07 冒泡排序本文知识点:冒泡排序冒泡排序实际案例分析冒泡排序流程第1轮比较: 第1轮比较的结果:把最 ...
C++里的程序 GetDlgItem(IDC_EDIT_INPUTFILE) ->EnableWindow(TRUE)
转载:https://zhidao.baidu.com/question/654519209423407765.html GetDlgItem(IDC_EDIT_INPUTFILE) ->Ena ...

读高性能Mysql摘要