一、关于IOT:索引组织表

  表在存储的时候按照主键排序进行存储,同时在主键上建立一棵树,这样就形成了一个索引组织表,一个表的存储方式以索引的方式来组织存储的。

  所以,MySQL表一定要加上主键,通过主键来访问MySQL表的性能是最好:

    1、显式定义主键:primary key

    2、隐式定义主键:如果没有指定主键,MySQL自己会默认建立一个主键(rowid隐藏主键)

1、特点

  1、表按照主键排好序,数据按照主键顺序存放(核心原因)

  2、主键上有一棵树,叶子节点就是数据节点

  3、表本身就是索引,表就是索引、索引就是表

  4、IOT对于通过主键找表数据的成本最低

2、IOT适合的场合

  1、根据主键访问数据(永远是效果最好的方式),一级索引

  2、主键选择好,非常有利于insert,特别注意存在递增列的情况

3、主键建立原则

  1、主键的顺序最好和最常使用的索引列的顺序一致

  2、如果能够实现最常使用的索引列作为主键列,效果最好

    技巧:索引列+自增长列

4、IOT最大的弊端:所有主键以外的索引都是二级索引(innodb默认)

二、不访问索引的其中一种情况

  索引成本比全表扫描的成本高,就算建了索引也不会走索引。

1、全表扫描的成本

  多块读,扫描冷数据,造成大量的物理读。

  通过预读机制,将可能要访问的数据读入内存,减少io访问磁盘次数。

2、索引的成本

  1、访问索引(内存命中的概率很高)

  2、主键的树(内存命中的概率很高)

  3、集群因子(计算索引访问成本):index clustering factor是oracle一个参数。

3、索引的有序度和主键的有序度的一个比较

  访问数据时,如果访问的数据是主键挨着的,那么在表中可能位于磁盘的一个块上(这样索引的效率最高,成本最低);如果不挨着,就会来回跳,不在一个块中。
  所以在建立主键时,尽量保持和最常用的索引的增长趋势是一致的,这样索引的成本最低,效率最高。表中有两个列,name列和id列,如果最经常访问的是name列,但是id列是主键有顺序的,通过name列访问是无序的,效果非常差。
  解决办法:可以在建立主键时,让namelie在前面,自增长列在后面,建立联合主键这样就不会导致主键冲突,就算到时候取80%的数据时,也可以实现用索引取数据。

4、全表扫描优于索引情况

  查询结果的记录大于表中记录一定比例(对于大多数数据库来说,这个比例是10%)的时候,全表扫描要比使用索引快。

  这个主要是由于索引扫描后要利用索引中的指针去逐一访问记录,假设每个记录都使用索引访问,则读取磁盘的次数是查询包含的记录数T,而如果表扫描则读取磁盘的次数是存储记录的块数B,如果T>B 的话索引就没有优势了。

  即先对结果数量估算,如果小于这个比例用索引,大于的话即直接全表扫描。

三、为什么需要insert buffer,针对二级索引

1、索引数据页的更新

  表的索引存于该表的ibd文件中,数据也存于此文件。表数据更新的同时也会更新对应的表的索引数据,所以:对表进行insert时,很可能会产生大量的物理读(物理读索引数据页)

2、索引对insert的影响

  1、表insert,对应表上的所有索引都需要insert;

  2、假设这些索引不常使用,容易产生物理读;

  3、索引的顺序和表的顺序完全不一致;

  原则:一个表上的索引最好不超过6个

3、change buffer

  A special data structure that records changes to pages in secondary indexes. These values could result from SQL INSERT, UPDATE, or DELETE statements (DML). The set of features involving the change buffer is known collectively as change buffering, consisting of insert buffering, delete buffering, and purge buffering.

  将对索引的更新记录存入insert buffer中,而不是直接调入索引页进行更新;择机进行merge insert buffer的操作,将insert buffer中的记录合并(merge)到真正的辅助索引中。

  解决了insert表数据产生过多物理读的问题。

4、merge insert buffer的操作可能发生在什么情况下

  在merge insert buffer之前,insert buffer数据是存在内存中,为了防止数据库意外宕机导致数据丢失,系统会周期性将insert buffer数据写入共享表空间中。

  1、辅助索引页被读取到buffer pool中

    例如这在执行正常的select查询操作,索引页被调入内存,该索引页对应在insert buffer中的索引更改记录就会发生merge操作。

  2、insert buffer bitmap页追踪到该辅助索引页已无可用空间时

    存于ibd文件中(表数据文件)

    记录每一个索引页在insert buffer中对应的行数

  3、master thread工作

    在master thread线程中每秒或每10秒会进行一次merge insert buffer的操作,不同之处在于每次进行merge操作的页的数量不同。

mysql> show engine innodb status\G
……
-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 1, free list len 0, seg size 2, 0 merges
merged operations:
insert 0, delete mark 0, delete 0
discarded operations:
insert 0, delete mark 0, delete 0

  1、insert buffer空间占有量:2*16K

    对表进行批量IDU的时候,可能会导致change buffer迅速增加。

  2、merges合并的次数:一次合并对应一次物理读

  3、insert 0, delete mark 0, delete 0

  4、discarded是数据还没有合并,索引被删除,相应的数据也要被删除。

假设:

  Merges:10

  Insert:1000

  Delete Mark:3000

  Delete:3000

  (1000+3000+3000)/10=700:表示merge一次解决了对索引的多少次更改,此处700次索引更改一次merge

5、如何看insert buffer的效果

  1、insert buffer所占空间,占比太高就影响缓冲性能

  2、每次merge处理的数据量

    1、merges如果很高,说明insert buffer调小了,也说明索引建多了;

    2、对表进行批量IDU的时候,可能会导致insert buffer迅速增加。

6、关注change buffer在innodb buffer pool中的占比

mysql> show variables like '%change_buffer%';
+-------------------------------+-------+
| Variable_name | Value |
+-------------------------------+-------+
| innodb_change_buffer_max_size | 25 |
| innodb_change_buffering | all |
+-------------------------------+-------+
2 rows in set (0.01 sec)

  1、innodb_change_buffer_max_size:表示change buffer在buffer pool中的最大占比,默认25%,最大50%

  2、innodb_change_buffering:表示索引列merge对象,all表示对IDU索引列都起作用,都进行merge,如果只想对insert索引列进行merge,就把all改为inserts。

调整依据:

  1、如果系统中有严重的insert、update并且还有活跃的delete时,就增大max_size;

  2、针对不更改数据的纯报表系统,可以减小该参数值。

InnoDB关键特性之change buffer的更多相关文章

  1. InnoDB关键特性之insert buffer

    insert buffer 是InnoDB存储引擎所独有的功能.通过insert buffer,InnoDB存储引擎可以大幅度提高数据库中非唯一辅助索引的插入性能. 数据库对于自增主键值的插入是顺序的 ...

  2. innodb 关键特性(insert buffer)

    一.insert buffer 性能改善 insert buffer和数据页一样,也是物理页的一个组成部分. 在innodb存储引擎中,主键是行唯一的标识符.通常应用程序中行记录的插入顺序是按照主键递 ...

  3. my36_InnoDB关键特性之change buffer

    一.关于IOT:索引组织表 表在存储的时候按照主键排序进行存储,同时在主键上建立一棵树,这样就形成了一个索引组织表,一个表的存储方式以索引的方式来组织存储的. 所以,MySQL表一定要加上主键,通过主 ...

  4. InnoDB关键特性学习笔记

    插入缓存 Insert Buffer Insert Buffer是InnoDB存储引擎关键特性中最令人激动与兴奋的一个功能.不过这个名字可能会让人认为插入缓冲是缓冲池中的一个组成部分.其实不然,Inn ...

  5. innodb关键特性之double write

    # 脏页刷盘的风险 两次写的原理机制 1.解决问题 2.使用场景 3.doublewrite的工作流程 4.崩溃恢复 # doublewrite的副作用 1.监控doublewrite负载 2.关闭d ...

  6. 【mysql】Innodb三大特性之insert buffer

    一.什么是insert buffer insert buffer是一种特殊的数据结构(B+ tree)并不是缓存的一部分,而是物理页,当受影响的索引页不在buffer pool时缓存 secondar ...

  7. mysql小特性:change buffer

    change buffer是在其他数据库中没有的一个概念,说白了就是一块系统表空间分配的空间,针对的对象是辅助索引的叶子节点(为什么不是主键索引?因为主键索引是聚集索引,在磁盘上的排列是有序的,磁盘的 ...

  8. InnoDB关键特性之刷新邻接页-异步IO

    Flush neighbor page 1.工作原理 2.参数控制 AIO 1.开启异步IO 一.刷新邻接页功能 1.工作原理 当刷新一个脏页时,innodb存储引擎会检测该页所在区(extent)的 ...

  9. InnoDB关键特性之自适应hash索引

    一.索引的资源消耗分析 1.索引三大特点 1.小:只在一个到多个列建立索引 2.有序:可以快速定位终点 3.有棵树:可以定位起点,树高一般小于等于3 2.索引的资源消耗点 1.树的高度,顺序访问索引的 ...

随机推荐

  1. Android搞事篇——使用Intent跳转界面

    跳转页面基本分为三个步骤: 1.初始化一个intent:(一个intent就够用了): 2.传入intent参数: 3.调用startactivity();实现跳转页面 具体操作如下 首先你需要一个项 ...

  2. 基于范围的for循环(STL)

    1. ]={4.99,5.99,6.99,7.99,8.99}; for (double x : prices) cout<<x<<endl; //////////////// ...

  3. 深入探索C++对象模型(六)

    执行期语意学(Runtime Semantics) 对象的构造和析构(Object Constructor and Destructor) 一般而言,constructor和destructor的安插 ...

  4. “java.lang.IllegalArgumentException: Failed to evaluate expression ‘ROLE_USER’”报错的解决

    这个问题出现在Spring Security的相关配置中,找到原来的这一行: <security:intercept-url pattern="/**" access=&qu ...

  5. NN-Neural Network

    开始学习神经网络(Neural Network) 已有线性与逻辑回归,为什么需要用到NN 实际的应用中,需要根据很多特征进行训练分类器,当今有两个特征下,可以通过下图表述: 然而还有太多的特征需要考虑 ...

  6. PHPUnit-函数依赖-数据提供-异常-忽略-自动生成

    1. 本文目的 本文目的是收录一些PHPUnit的有用技巧,这些技巧能够为给PHPUnit单元测试带来很多便利.本文将要介绍的技巧如下: 函数依赖测试 数据提供函数 异常测试 跳过忽略测试 自动生成测 ...

  7. 设计模式(2)工厂方法模式(Factory Method)

    设计模式(0)简单工厂模式 设计模式(1)单例模式(Singleton) 源码地址 0 工厂方法模式简介 0.0 工厂方法模式定义 工厂方法模式是在简单工厂模式基础上,为解决更复杂的对象创建问题而衍生 ...

  8. [编织消息框架][netty源码分析]10 ByteBuf 与 ByteBuffer

    因为jdk ByteBuffer使用起来很麻烦,所以netty研发出ByteBuf对象维护管理内存使用ByteBuf有几个概念需要知道1.向ByteBuf提取数据时readerIndex记录最后读取坐 ...

  9. MySQL访问控制实现原理

    MySQL访问控制实现原理 MySQL 访问控制实际上由两个功能模块共同组成,从第一篇的第二章架构组成中可以看到,一个是负责 “看守 MySQL 大门”的用户管理模块,另一个就是负责监控来访者每一个动 ...

  10. 统计学习方法 三 kNN

    KNN (一)KNN概念: K近邻算法是一种回归和分类算法,这主要讨论其分类概念: K近邻模型三要素: 1,距离: 2,K值的选择: K值选择过小:模型过复杂,近似误差减小,估计误差上升,出现过拟合 ...