一、关于IOT:索引组织表

  表在存储的时候按照主键排序进行存储,同时在主键上建立一棵树,这样就形成了一个索引组织表,一个表的存储方式以索引的方式来组织存储的。

  所以,MySQL表一定要加上主键,通过主键来访问MySQL表的性能是最好:

    1、显式定义主键:primary key

    2、隐式定义主键:如果没有指定主键,MySQL自己会默认建立一个主键(rowid隐藏主键)

1、特点

  1、表按照主键排好序,数据按照主键顺序存放(核心原因)

  2、主键上有一棵树,叶子节点就是数据节点

  3、表本身就是索引,表就是索引、索引就是表

  4、IOT对于通过主键找表数据的成本最低

2、IOT适合的场合

  1、根据主键访问数据(永远是效果最好的方式),一级索引

  2、主键选择好,非常有利于insert,特别注意存在递增列的情况

3、主键建立原则

  1、主键的顺序最好和最常使用的索引列的顺序一致

  2、如果能够实现最常使用的索引列作为主键列,效果最好

    技巧:索引列+自增长列

4、IOT最大的弊端:所有主键以外的索引都是二级索引(innodb默认)

二、不访问索引的其中一种情况

  索引成本比全表扫描的成本高,就算建了索引也不会走索引。

1、全表扫描的成本

  多块读,扫描冷数据,造成大量的物理读。

  通过预读机制,将可能要访问的数据读入内存,减少io访问磁盘次数。

2、索引的成本

  1、访问索引(内存命中的概率很高)

  2、主键的树(内存命中的概率很高)

  3、集群因子(计算索引访问成本):index clustering factor是oracle一个参数。

3、索引的有序度和主键的有序度的一个比较

  访问数据时,如果访问的数据是主键挨着的,那么在表中可能位于磁盘的一个块上(这样索引的效率最高,成本最低);如果不挨着,就会来回跳,不在一个块中。
  所以在建立主键时,尽量保持和最常用的索引的增长趋势是一致的,这样索引的成本最低,效率最高。表中有两个列,name列和id列,如果最经常访问的是name列,但是id列是主键有顺序的,通过name列访问是无序的,效果非常差。
  解决办法:可以在建立主键时,让namelie在前面,自增长列在后面,建立联合主键这样就不会导致主键冲突,就算到时候取80%的数据时,也可以实现用索引取数据。

4、全表扫描优于索引情况

  查询结果的记录大于表中记录一定比例(对于大多数数据库来说,这个比例是10%)的时候,全表扫描要比使用索引快。

  这个主要是由于索引扫描后要利用索引中的指针去逐一访问记录,假设每个记录都使用索引访问,则读取磁盘的次数是查询包含的记录数T,而如果表扫描则读取磁盘的次数是存储记录的块数B,如果T>B 的话索引就没有优势了。

  即先对结果数量估算,如果小于这个比例用索引,大于的话即直接全表扫描。

三、为什么需要insert buffer,针对二级索引

1、索引数据页的更新

  表的索引存于该表的ibd文件中,数据也存于此文件。表数据更新的同时也会更新对应的表的索引数据,所以:对表进行insert时,很可能会产生大量的物理读(物理读索引数据页)

2、索引对insert的影响

  1、表insert,对应表上的所有索引都需要insert;

  2、假设这些索引不常使用,容易产生物理读;

  3、索引的顺序和表的顺序完全不一致;

  原则:一个表上的索引最好不超过6个

3、change buffer

  A special data structure that records changes to pages in secondary indexes.
These values could result from SQL INSERT, UPDATE, or DELETE statements
(DML). The set of features involving the change buffer is known
collectively as change buffering, consisting of insert buffering, delete
buffering, and purge buffering.

  将对索引的更新记录存入insert buffer中,而不是直接调入索引页进行更新;择机进行merge insert buffer的操作,将insert buffer中的记录合并(merge)到真正的辅助索引中。

  解决了insert表数据产生过多物理读的问题。

4、merge insert buffer的操作可能发生在什么情况下

  在merge insert buffer之前,insert buffer数据是存在内存中,为了防止数据库意外宕机导致数据丢失,系统会周期性将insert buffer数据写入共享表空间中。

  1、辅助索引页被读取到buffer pool中

    例如这在执行正常的select查询操作,索引页被调入内存,该索引页对应在insert buffer中的索引更改记录就会发生merge操作。

  2、insert buffer bitmap页追踪到该辅助索引页已无可用空间时

    存于ibd文件中(表数据文件)

    记录每一个索引页在insert buffer中对应的行数

  3、master thread工作

    在master thread线程中每秒或每10秒会进行一次merge insert buffer的操作,不同之处在于每次进行merge操作的页的数量不同。

mysql> show engine innodb status\G
……
-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 1, free list len 0, seg size 2, 0 merges
merged operations:
insert 0, delete mark 0, delete 0
discarded operations:
insert 0, delete mark 0, delete 0

  1、insert buffer空间占有量:2*16K

    对表进行批量IDU的时候,可能会导致change buffer迅速增加。

  2、merges合并的次数:一次合并对应一次物理读

  3、insert 0, delete mark 0, delete 0

  4、discarded是数据还没有合并,索引被删除,相应的数据也要被删除。

假设:

  Merges:10

  Insert:1000

  Delete Mark:3000

  Delete:3000

  (1000+3000+3000)/10=700:表示merge一次解决了对索引的多少次更改,此处700次索引更改一次merge

5、如何看insert buffer的效果

  1、insert buffer所占空间,占比太高就影响缓冲性能

  2、每次merge处理的数据量

    1、merges如果很高,说明insert buffer调小了,也说明索引建多了;

    2、对表进行批量IDU的时候,可能会导致insert buffer迅速增加。

6、关注change buffer在innodb buffer pool中的占比

mysql> show variables like '%change_buffer%';
+-------------------------------+-------+
| Variable_name | Value |
+-------------------------------+-------+
| innodb_change_buffer_max_size | 25 |
| innodb_change_buffering | all |
+-------------------------------+-------+
2 rows in set (0.01 sec)

  1、innodb_change_buffer_max_size:表示change buffer在buffer pool中的最大占比,默认25%,最大50%

  2、innodb_change_buffering:表示索引列merge对象,all表示对IDU索引列都起作用,都进行merge,如果只想对insert索引列进行merge,就把all改为inserts。

调整依据:

  1、如果系统中有严重的insert、update并且还有活跃的delete时,就增大max_size;

  2、针对不更改数据的纯报表系统,可以减小该参数值。

转自 https://www.cnblogs.com/geaozhang/p/7235953.html

my36_InnoDB关键特性之change buffer的更多相关文章

  1. InnoDB关键特性之change buffer

    一.关于IOT:索引组织表 表在存储的时候按照主键排序进行存储,同时在主键上建立一棵树,这样就形成了一个索引组织表,一个表的存储方式以索引的方式来组织存储的. 所以,MySQL表一定要加上主键,通过主 ...

  2. InnoDB关键特性之insert buffer

    insert buffer 是InnoDB存储引擎所独有的功能.通过insert buffer,InnoDB存储引擎可以大幅度提高数据库中非唯一辅助索引的插入性能. 数据库对于自增主键值的插入是顺序的 ...

  3. innodb 关键特性(insert buffer)

    一.insert buffer 性能改善 insert buffer和数据页一样,也是物理页的一个组成部分. 在innodb存储引擎中,主键是行唯一的标识符.通常应用程序中行记录的插入顺序是按照主键递 ...

  4. mysql小特性:change buffer

    change buffer是在其他数据库中没有的一个概念,说白了就是一块系统表空间分配的空间,针对的对象是辅助索引的叶子节点(为什么不是主键索引?因为主键索引是聚集索引,在磁盘上的排列是有序的,磁盘的 ...

  5. Mysql InnoDB三大特性-- change buffer

    Mysql InnoDB三大特性-- change buffer

  6. InnoDB关键特性学习笔记

    插入缓存 Insert Buffer Insert Buffer是InnoDB存储引擎关键特性中最令人激动与兴奋的一个功能.不过这个名字可能会让人认为插入缓冲是缓冲池中的一个组成部分.其实不然,Inn ...

  7. InnoDB的关键特性-插入缓存,两次写,自适应hash索引

    InnoDB存储引擎的关键特性包括插入缓冲.两次写(double write).自适应哈希索引(adaptive hash index).这些特性为InnoDB存储引擎带来了更好的性能和更高的可靠性. ...

  8. SQL Server2014 SP2关键特性

    SQL Server2014 SP2关键特性 转载自:https://blogs.msdn.microsoft.com/sqlreleaseservices/sql-2014-service-pack ...

  9. SQL Server 2016 CTP2.3 的关键特性

    SQL Server 2016 CTP2.3 的关键特性 数据库方面的增强 Row Level Security已经支持In-memory OLTP 表.用户现在可以对内存优化表实施row-level ...

随机推荐

  1. C# 判断未将对象引用设置到对象的实例,出错的代码到底在第几行

    DataTable dt = null; try { var x = dt.Rows.Count; } catch(NullReferenceException nullexception) { Me ...

  2. Python 爬取妹子图(技术是无罪的)

    ... import requests from bs4 import BeautifulSoup import os import sys class mzitu(): def html(self, ...

  3. AnnotationConfigApplicationContext(1)之初始化Scanner和Reader

    AnnotationConfigApplicationContext(1)初始化Scanner和Reader 我们以AnnotationConfigApplicationContext为起点来探究Sp ...

  4. [bzoj1188]分裂游戏

    容易发现所有豆子相互独立,只需要考虑每一个豆子的sg函数并异或起来即可,sg函数从后往前暴力即可 1 #include<bits/stdc++.h> 2 using namespace s ...

  5. [bzoj1071]组队

    题目即要求$Ah+Bv<=C+Aminh+Bminv$,如果同时枚举minh和minv,那么即要求$minh\le h$,$minv\le v$且$s\le C+Aminh+Bminv$从小到大 ...

  6. BFS实现迷宫问题

    BFS实现迷宫问题 问题描述,要求从起点走到终点,找出最短的距离,要避开障碍 输入描述,输入一个二维数组表示地图,其中等于10就是终点,等于-10就是起点,等于1就是障碍,等于0就是可以走的 代码: ...

  7. linux结束进程命令

    在linux中,进程之间通过信号来通信.进程的信号就是预定义好一个消息,进程能识别它并决定忽略还是做出反应. 信号 名称 描述 1 HUP 挂起 2 INT 中断 3 QUIT 结束运行 9 KILL ...

  8. CF1208H Red Blue Tree

    CF1208H Red Blue Tree 原本应该放在这里但是这题过于毒瘤..单独开了篇blog 首先考虑如果 $ k $ 无限小,那么显然整个树都是蓝色的.随着 $ k $ 逐渐增大,每个点都会有 ...

  9. P4497 [WC2011]拼点游戏

    P4497 [WC2011]拼点游戏 在我的 cnblogs 中查看 数据结构大杂烩 + 阿巴细节题. 调了三个小时. 首先考虑第一小问的答案. 注意到点数的计算方式是先负后正的形式,不妨看做选出 \ ...

  10. Python 包管理工具 pip 与 conda

    简介 pip是接触 python 后最早认识的包管理工具.通过使用 pip 能够自动下载和解决不同 python 模块的依赖问题,使 python 的配置过程变得简单. 与 pip 类似,conda ...