高性能mysql 第五章索引部分总结

高性能索引

1。索引基础：索引的作用类似'目录'帮助Query来快速定位数据行。

1.1索引类型：

1.1.1

b-tree索引

b-tree（balance tree）索引：使用平衡树（非平衡二叉树）来保存索引值，叶子结点的到根节点的距离相差不超过1；对于不同的引擎，不同的索引类型叶子结点保存的值可以不同，同过索引找到数据行的方式也不同

可以使用b-tree索引的查询类型:1.全值索引；2.最左前缀；3.前缀索引；4.匹配范围；5.精准匹配某一列，范围匹配另一列（可以在看作最左前缀的扩大化）6.覆盖查询（只访问索引的查询）

局限：范围查询对复合索引的截断作用。

1.1.2

hash索引

hash索引：hash索引使用索引字段的hash值（散列值）作为索引寻址的标识，找到对应hash值时即可通过hash表对应的指针找到表数据。

散列值通过散列函数获得：书中对一般例子中使用的MD5（）与sha1（）两个散列函数的劣势做了分析（这两个函数本来是两种加密函数），两者得到的散列值长度过长，浪费空间；

hash冲突：使用一个hash函数传入两个不同的值可能产生一样的散列值，这就会导致hash冲突；解决办法一般为修改散列函数，与再散列；以及增加where条件人工消除hash冲突的影响三种。

文中提到：比较廉价的方式是截取md5（）返回值的一部分作为散列值。

应该注意到：myisam，innodb引擎并不支持hash索引。但是innodb有一个特殊的功能“自适应hash索引”，使其给予b-tree索引建立一个hash索引，具有一定hash索引性质。

1.1.3空间数据索引（R-tree）

MYISAM支持R-tree,但是mysql数据库在空间索引方面是弱势的，pgsql的postGIS做的比较好。

1.1.4全文索引

全文索引与b-tree索引不冲突，适用于match，against操作。第七章会详细讨论

1.1.5其他索引

这里提到了tokudb引擎使用的分型树索引（fractal tree index）；以及后面将要讲解的聚簇索引以及覆盖索引。

5.2

索引优点：

1.大大减少了服务器需要扫描的数据量；

2.帮助服务器避免了排序和临时表；

3.将随机io变为顺序io；

5.3高性能索引

5.3.1

左值才是索引列

索引不能使用表达式的一部分例：where a_id+1=2

5.3.2

前缀索引与索引的选择性

这一节详细讨论了前缀索引对于选择多常记录作为索引字段合适的问题：

提出了一个‘基数’的概念，即前缀对应唯一条目的数量与总数的笔直。前缀的基数应该接近完整列

例：count（distinct tt（city，3））/count（*）

这个值可以称为选择性

注：部分字段后缀索引有时候更加有效

5.3.3

索引合并

5.0以后会有一新增了索引合并这一优化策略：

问题：对于一条sql中有多个单列索引可以用到，但是由于优化器对where子句的解析原因，只用到一个（一个索引即可过滤大量数据）或者干脆直接全表扫描（5.0以前优化器的缺陷）。

解决1：使用union all等保留字对数据进行sql进行拆分；

解决2:5.0mysql以上提供了一种索引合并策略，explain以后再会有类似extra：using union（primary，id_key）的提示项。

说明：索引合并大多数时候说明索引不太符合实际运用，需要优化更新索引。

5.3.4 合适顺序的索引

（1）索引项先后顺序对效率的影响

索引项先后顺序对效率的影响：多列索引中索引顺序的考量，1.可以由前缀索引的知识了解到，索引的顺序对索引的适用情景有较大的限制，这里讨论的是索引顺序对索引效率的影响，可以通过选择性计算的方式，将选择性高的数据放在前面（因为可以一次性过滤掉更多的数据）。需要注意的是多列索引的索引项顺序是需要整体考量的，因为一条query的查询索引优化可能是另一条query的负优化。

（2）聚簇索引

（1）中讨论的索引项的顺序对索引的效率的影响。这里讨论索引中数据顺序对磁盘io的影响：

对于聚簇索引我们需要明白，它是innodb中的索引类型，在前面的章节我们了解innodb与myisam引擎索引结构的区别的时候说明了，两者对表数据的存放有一些区别，innodb不同于myisam将数据与索引分卡存放的方式，而是将数据行与索引存放在一起，存放了数据行的索引就是聚簇索引，数据行保存在顺序的索引叶子页中，这是io是顺序的，相比随即io能节省很多的io时间。所以innodb表需要一个主键，没有显示定义的话，innodb也会隐式的定义一个主键索引顺序保存数据。

聚簇索引的缺点

聚簇索引要求索引与数据行一起顺序保存就使得非顺序插入，修改等需要需要操作原有数据的操作需要对数据的移位（这样才能保证数据的顺序性），非顺序数据插入后最好使用optimize table重新组织一下表。

数据加入的过程中往往可能需要对数据也进行也分裂与也合并，导致数据页中的数据并不是紧靠的，会占用跟多空间，微微的降低全表扫描的效率。、

二级索引（innodb中的非主键索引）除索引项以外需要保存主键值。

5.3.5innodb与myisam数据分布对比、

这里在上文聚簇索引中基本都有涉猎，就不再赘述了。

5.3.6覆盖索引

顾名思义覆盖索引就是索引中包含索引包含查询需要的数据，包括select子句，与where子句。

优点：

只需要访问索引，而不需要访问数据行就能获取需要的数据；

缺点：

使用条件很苛刻，需要索引使用包含足够多的索引项才能使得索引在query中能被用到。

说明：对于不能使用覆盖索引的数据，可以采用‘延迟关联’的方法来处理，即在子查询中使用覆盖索引，返回数据在进行外层查询。即覆盖查询获取普通查询的条件值。

5.3.7索引排序

索引排序可以在explain的 type列看到index，说明使用了索引扫描排序，如果该索引不是覆盖索引，那么要根据扫描到的索引项到磁盘去读取数据，产生了大量的随机io所以时间会比全表扫描更久。当然比文件排序还是要快不少。

索引排序在既有order by又有limit的语句中很有用！

5.3.8压缩索引

myisam对索引的一种优化方式；

对索引进行前缀压缩，即将索引中相同的部分用一个简单的标识符替换如perform与performance可以替换为7；ance。

由于索引值做了简化，索引中存在依赖关系，影响了索引的查找，是一种cpu换io的优化。

5.3.9冗余与重复索引

应该尽量拓展目前已有的索引，而不是去建立新索引，多列索引与单列索引就很容易产生重复。

可以节省空间，同时方便了io

5.3.10未使用索引

除了重复索引与冗余索引，未使用的索引也是应该被清除的对象。可以通过打开userstate服务器变量，让服务器运行一段时间，再查询对应的information_schema.index_statistics就能知道索引的使用情况。

5.3.11索引与锁

innodb的行锁是加在索引上的，依赖于索引的存在。其中还有一个细节是innodb在二级索引上使用共享锁，一级索引使用排它锁。

5.4索引使用案例

5.4.1支持多种过滤条件

最左前缀的推广

可以通过将多列索引的最左前缀值罗列出来，来使用多列索引中的后缀部分。

5.4.2避免多个范围条件

多等值条件与范围条件在explain中显示的type都是range，但是范围条件会导致多列索引的后续索引项无法使用索引，而多等值条件没有这样的限制。

如果mysql能实现松散索引扫描范围条件就能突破限制

5.4.3优化排序

针对group by与limit的优化：使用limit可能使返回数据大量的被抛弃。

解决1：通过反范式，预先计算，缓存来处理。（从数据源上精细化数据）

解决2：通过延迟关联，使用覆盖索引，以最小的代价来确定得数据行，在读取数据行的其他具体内容。

5.5索引的维护

5.5.1定位表损坏并修复

myisam的系统崩溃可能导致表损坏，使用check table来排查，通过repair或者一个不做任何有效操作的alter语句来修复表。

innodb的表不容易损坏（应该是数据索引的高度纠缠，可以以我修复），innodb需要进入强制恢复模式来恢复表

5.5.2更新索引统计信息

mysql提供两个api来查看索引值分布：

1.records_in_range（），传入边界值来获取其中的记录数。myisam返回准确值，innodb返回估计值。

2.info（），返回包括索引基数在内的各种数据。

可以通过analyze table来重新生成统计信息来处理优化错误的情况。myisam将索引统计信息保存在磁盘中，通过analyze table命令来维护，innodb不在磁盘中储存维护这些信息，而是通过随机索引访问来评估并将其储存在内存中。

show information_schema.statistics。

5.5.3mysql碎片整理

碎片类型：1行碎片，2行间碎片，3剩余空间碎片

myisam可能三种碎片都有，而innodb不会有行碎片，它会移动短小的行并重写到一个片段中。

清理用optimize table 或者使用不做任何有效操作alter。

高性能mysql 第五章索引部分总结的更多相关文章

高性能MySQL中的三星索引
高性能MySQL中的三星索引我对此提出了深深的疑问: 一星:相关的记录指的是什么??(相关这个词很深奥,“相关部门”是什么部门) 二星:如果建立了B-Tree(B+Tree)索引,数据就有序了.三星 ...
MySQL高级第二章——索引优化分析
一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...
高性能mysql 第5章创建高可用的索引
b-tree索引一定程度上说,mysql只有b-tree索引.他没有bitmap索引.还有一个叫hash索引的,只在Memory存储引擎中才有. b-tree索引跟oracle中的大同小异. mys ...
高性能mysql 第6章查询性能优化
查询缓存: 在解析一个sql之前,如果查询缓存是打开的,mysql会去检查这个查询(根据sql的hash作为key)是否存在缓存中,如果命中的话,那么这个sql将会在解析,生成执行计划之前返回结果. ...
高性能mysql 第六章查询性能优化总结（上）查询的执行过程
6 查询性能优化 6.1为什么查询会变慢这里说明了的查询执行周期,从客户端到服务器端,服务器端解析,优化器生成执行计划,执行(可以细分,大体过程可以通过show profile查看),从服务器端返 ...
高性能mysql第6章
第6章,优化配置 https://www.cnblogs.com/musings/p/5913157.html 1:服务器读取的配置文件,可以使用下面的命令查询 admin@iZwz92c0zpe8t ...
高性能MySQL第1章知识点梳理
1. MySQL的逻辑架构最上面不是MySQL特有的,所有基于网络的C/S的网络应用程序都应该包括连接处理.认证.安全管理等. 中间层是MySQL的核心,包括查询解析.分析.优化和缓存等.同时它还提 ...
【MySQL高级特性】高性能MySQL第七章
2017-07-25 14:15:43 前言:MYSQL从5.0和5.1版本开始引入了很多高级特性,例如分区.触发器等,这对有其他关系型数据库使用背景的用户来说可能并不陌生.这些新特性吸引了很多用户 ...
高性能mysql 第7章 mysql高级特性之分区表
分区表: 分区表是一个独立的逻辑表,底层通过多个物理表实现. mysql实现分区表的方式是对底层表的封装.这意味着没有全局索引,索引是建立在底层的每个表上的(跟ORACLE不一样). 用到分区表的几种 ...

随机推荐

Python日期的加减等操作
1. 日期输出格式化所有日期.时间的api都在datetime模块内. 1. datetime => string now = datetime.datetime.now() now.strf ...
小白的python之路10/22 day1
一.操作系统操作系统就是一个协调.管理和控制计算机硬件资源和软件资源的控制程序.操作系统所处的位置如下图
第一份offer
11月6日参加的面试,今天签完三方,回头想想,感慨万千. (很多过程没有详细写,只保留了基本的客观事实,避免自吹嫌疑.....) 6号面试,当时来了能有100-200人,以川大和电子科大研究生为主,主 ...
用mybatis中的insert方法插入数据，返回值为1，但数据库却没有数据
刚才在写东西的时候,用mybatis中的 <insert id="add" parameterType="cn.entity.Computer"> ...
angular2在ts中使用transform转换时间格式
摘要:在angular1中我们可以在控制器中像下面那样使用filter: $filter('date')(myDate, 'yyyy-MM-dd'); 但是如何在angular2中在ts中使用自定义p ...
sqlite3 语法
https://www.sqlite.org/index.html 官网 http://tutlane.com/tutorial/sqlite/sqlite-case-statement http: ...
素数定理π(n)~n/lnn弱化版证明
在大半年前写的Miller-Rabin素数测试正确性证明中使用过此结论~当时完全不会证,现在进步了一点点会证弱化版的了Orz 完整版的素数定理: π(n):=|{p|p<=n,p是素数}| li ...
超级简单的数据压缩算法—LZW算法
1. 前文回顾在字符串算法—数据压缩中,我们介绍了哈夫曼压缩算法(Huffman compression),本文将介绍LZW算法. 2. LZW算法这个算法很简单,为了方便讲述,我们将采用16进制 ...
MySQL Execution Plan--NOT EXISTS子查询优化
在很多业务场景中,会使用NOT EXISTS语句来确保返回数据不存在于特定集合,部分场景下NOT EXISTS语句性能较差,网上甚至存在谣言"NOT EXISTS无法走索引". 首 ...
nginx里proxy_pass有无/的区别
nginx在反向代理的时候,proxy_pass需要指定路径,有无"/"的区别,如下: location /lile { 配置一: proxy_pass http://192. ...

高性能mysql 第五章 索引部分总结

高性能mysql 第五章 索引部分总结的更多相关文章

随机推荐

热门专题

高性能mysql 第五章索引部分总结

高性能mysql 第五章索引部分总结的更多相关文章