1.索引的种类

聚簇索引，非聚簇索引
主键索引，唯一索引，普通索引（前缀索引），全文索引
单值索引，复合索引
二级索引
覆盖索引

1.1 聚簇索引，非聚簇索引

参考文档：

https://www.cnblogs.com/jiawen010/p/11805241.html

https://learnku.com/articles/45521

总结（根据第二个博客）：

聚簇索引
- 索引必须为唯一索引
- 叶子节点存储的是整行数据
非聚簇索引
- 索引值不唯一
- 叶子节点存储的是索引行和主键

Q：聚簇索引一定是主键吗？

A：不一定，但主键一定是聚簇索引。如果没有主键索引，InnoDB会选择内置6字节长的ROWID作为隐含的聚集索引。

1.2.前缀索引

参考博客：https://blog.51cto.com/u_15144024/2860391

主要针对较长的varchar类型字段以及TEXT、BLOB类型类型。

通常可以索引开始的部分字符，这样可以大大节约索引空间，从而提高索引效率。但这样也会降低索引的选择项。索引的选择性是指，不重复的索引值（也称为基数 cardinality）和数据表的记录总数（#T）的比值，范围从1/#T到1之间。索引的选择项越高则查询效率越高，唯一索引的选择性是1，这是最好的索引选择性，性能也是最好的。

对于BLOB、TEXT或者很长的varchar类型的列，必须使用前缀索引，因为mysql不允许索引这些列的完整长度。

诀窍在于要选择足够长的前缀以保证较高的选择性，同时又不能太长（以便节约空间）。前缀应该足够长，以使得前缀索引的选择性接近于索引整个列。换句话说，前缀的"基数"应该接近于完整列的"基数"

-- 计算完整列的选择性

select count(distinct city)/count(*) from city_demo;

mysql无法使用前缀索引做order by和group by，也无法使用前缀索引做覆盖索引

1.3.全文索引

参考博客：https://blog.csdn.net/mrzhouxiaofei/article/details/79940958

之前只能用myisam创建全文索引，5.6之后innodb也可以了

查找文本中的关键词，而不是直接比较索引中的值。它有许多需要注意的细节，如停用词、词干和复数、布尔搜索等。全文索引更类似于搜索引擎做的事情，而不是简单的where条件匹配。在相同的列上同时创建全文索引和基于值的B-Tree索引不会有冲突，全文索引适用于match against操作，而不是普通的where条件操作。

有时候后缀索引也有用途，mysql原生不支持反向索引，但是可以把字符串反转后存储，并基于此建立前缀索引。姓名把名反转放前面，做名的右模糊查询，但中间的没法模糊查询

参考博客：https://blog.csdn.net/weixin_38106322/article/details/106583450

1.4.二级索引

主键索引之外的都可以统称二级索引

1.5.覆盖索引

：不需要回表查询；多字段创建一个索引，查询只需要返回覆盖索引包含的字段

2.索引的B+树如何生长的

3.索引优化

查询某张表有哪些索引：show index from tablename;

4.索引优化之explain

id：编号
select_type：查询类型
type：索引类型
table：表名
possible_keys：预测用到的索引
key：实际使用的索引
key_len：实际使用索引的长度
ref：表之间的引用
rows：被索引优化查询的数据个数
extra：额外信息

4.1 id

针对连表查询：

id值相同，从上往下，顺序执行
id值不同：id值越大越优先查询（在嵌套子查询时，先查内层，再查外层）
数据小的表，优先查询（rows）
id值不同，id值越大越优先查询

4.2 select_type

primary：包含子查询SQL中的主查询（最外层）
subquery：包含子查询SQL中的子查询（非最外层）
simple：简单查询
derived：衍生查询（使用到了临时表）
- 在from子查询中只有一张表
- 在from子查询中，如果有table1 union table2，则table1就是derived

4.3 type

system > const > eq_ref > ref > range > index > all，要对type优化的前提是：有索引

system、const 理想情况

ref、range 实际能达到

system：只有一条数据的系统表，或衍生表只有一条数据的主查询

查询返回的字段有些有索引，有些没有

const：仅仅能查到一条数据的SQL，用于primary key或unique索引
eq_ref：唯一性索引，对于每个索引键的查询，返回匹配唯一行数据（有且只有1个，不能多、不能0）

select ... from ...where name = ... 常见于唯一索引和主键索引
ref：非唯一性索引，返回匹配的所有行（0，多）
range：检索指定范围的行，where后面是一个范围查询(between..in,>,<=)

特殊：in有时候会失效，从而转为无索引all

index：查询全部索引中数据
all：查询全部表中数据

总结:

system/const：结果只有一条数据
eq_ref：结果多条，但是每条数据是唯一的
ref：结果多条，但是每条数据是0或是多条

4.4 possible_keys

如果possible_keys/key是null，则说明没用索引

4.5 key_len

：索引的长度，用于判断复合索引是否被完全使用

一个字符占3个字节，一个字节表示null，两个字节标识可变长度

4.6 extra

using filesort：性能消耗比较大，需要"额外"的依次排序（查询），常见于order by语句中
using tempoary：性能损耗大，用到了临时表，一般出现在groupby（已经有表了，但不适用，必须再来一张表）
using where：需要回原表
using index：性能提升，索引覆盖（覆盖索引）。原因，不读取原文件，只从索引文件中获取数据（不需要回表查询）
- 如果用到了索引覆盖时，会对possible_keys和key造成影响
  - 如果没有where，则索引只出现在key中
  - 如果有where，则索引出现在key和possible_keys中
using join buffer：mysql主动优化，加了缓存
impossible where：WHERE子句始终为false，不能选择任何行 select ... from ... where 1 < 0;
using index condition：using index + 回表 + where 过滤

5.索引优化之慢日志查询

注：不要在生产环境测试（测试环境数据量最好和生产环境一致）

：mysql提供的一种日志记录，用于记录mysql中响应时间超过阈值（long_query_time 默认10s），默认是关闭的，最终部署是关闭。

查询mysql是否开启慢日志查询： show variables like'%slow_query_log%'

临时开启： set global slow_query_log = 1;

设置慢查询阈值：set global long_query_time = 5; (修改后，重新登录后起效，不需要重启服务)

在内存中开启；重启 mysql service restart mysql

永久开启：在 /etc/my.cnf 中追加配置：

slow_query_log=1

slow_query_log_file=/var/lib/mysql/localhost-slow.log

# 超时时间

long_query_time=3

查看超过阈值的sql：show global status like '%slow_queries%';

或者去指定的日志文件去看 /var/lib/mysql/localhost-slow.log

6.单表优化

最佳左前缀，保持索引的定义和使用的顺序一致性
索引需要逐步优化
将含In的范围查询放where条件的最后，防止失效
通过key_len证明in可以使索引失效

7.两表优化

teacher ：tid，cid

course ：cid，cname

索引往哪加？-小表驱动大表[一般情况下对于左外连接，给左表加索引；右外连接，给右表加索引]

8.三表优化

小表驱动大表
索引建立在经常查询的字段上

9.避免索引失效的一些原则

复合索引，不要跨列或无序使用（最佳左前缀）
复合索引，尽量使用全索引匹配
不要在索引上进行任何操作（计算，函数，类型转换），否则索引失败
对于复合索引，如果左边失效，右边全部失效
复合索引不能使用不等于（!= <>）或is null（is not null），否则自身以及右侧所有全部失效；复合索引有 > ，则自身和右侧索引全部失效
%x% 会导致索引失效， x% 不会，或者用索引覆盖
尽量不要使用类型转换（显式、隐式），否则索引失效
尽量不要使用or，否则索引失效，将or左侧的索引失效

10.一些其他的优化方法

如果主查询的数据集大，则使用in
如果子查询的数据集大，则使用exist。 select...from table where exist/in (子查询);

exist: 将主查询的结果，放到子查询中进行条件校验，如果复合校验，则保留数据

order by 优化
- using filesort：双路排序、单路排序（根据IO的次数）
- 选择使用单路、双路；调整buffer的容量大小
- 避免select * ...
- 复合索引不要跨列使用，避免using filesort
- 保证全部的排序字段，排序的一致性（都是升序或降序）

mysql4.1 默认使用双路排序（扫描两次磁盘【1.从磁盘读取排序字段

｛在buffer中进行的排序｝ 2.扫描其他字段】）；4.1之后，默认使用单

路排序（只读取一次【全部字段｛在Buffer中进行排序｝】），有一定

隐患，不一定是一次，可能是多次IO

原因：如果数据量特别大，则无法将所有字段的数据一次性读完，索引

会进行"分片读取"

注意：单路排序比双路排序，会占用更多的Buffer。如果数据大，可以

考虑调大buffer的容量大小：set max_length_for _sort_data = 1024

byte

如果max_length_for _sort_data太低（需要排序的列总大小超过了

max_length_for _sort_data定义的字节数），则mysql会自动从单路切

换到双路

MySQL学习（十）索引的更多相关文章

【笔记】MySQL学习之索引
[笔记]MySQL学习之索引一索引简单介绍索引,是数据库中专门用于帮助用户快速查询数据的一种数据结构.类似于字典中的目录,查找字典内容时可以根据目录查找到数据的存放位置,然后直接获取即可. 普通 ...
MySQL学习13 - 索引
一.索引的介绍二 .索引的作用三.常见的几种索引: 3.1 普通索引 3.2 唯一索引 3.3 主键索引 3.4 组合索引四.索引名词五.正确使用索引的情况什么是最左前缀呢? 六.索引的注意 ...
Mysql学习笔记—索引
一.什么是索引一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,所以查询语句的优化显然是重中之重. 在数据 ...
MySQL学习(十五)
索引的概念索引是数据的目录,能快速定位数据的位置.索引提高了查询速度,降低了增删改的速度.并非加的越多越好. 一般在查询频率高的列上加,而且在重复度低的列上加效果更好.如在性别列上不用加索引,但是身 ...
MySQL学习(十二)
视图 view 在查询中,我们经常把查询结果当成临时表来看, view是什么?view可以看成一张虚拟表,是表通过某种运算得到的一个投影. 表的变化会影响到视图既然视图只是表的某种查询的投影,所以主 ...
MYSQL学习(三) --索引详解
创建高性能索引 (一)索引简介索引的定义索引,在数据结构的查找那部分知识中有专门的定义.就是把关键字和它对应的记录关联起来的过程.索引由若干个索引项组成.每个索引项至少包含两部分内容.关键字和关键 ...
MySQL学习笔记——索引和视图
索引(index)和管理索引模式中的一个数据库对象作用:在数据库中用来加速对表的查询创建:自动在主键和唯一键上面创建索引通过使用快速路径访问方法快速定位数据,减少了磁盘的I/O 与表独立存放, ...
mysql学习之索引
首先,看一个例子,有一张大表,记录数超过1000,SELECT * FROM student WHERE name='xinan'; 如果没有索引,查找程序就得从头查找,很费时间,表越大越费时间.建立 ...
MySQL学习(十六)
MySQL高级部分触发器触发器是一类特殊的事务,可以监视某种数据操作(insert/update/delete),并触发相关的操作(insert/update/delete) 触发器创建语法之4要 ...
MySQL学习(十四)
utf8的bom问题在xp下,用记事本创建utf8文件的时候,前面多了3个字节,这3个字节不用来显示,是用来辨识编码用的,EF BB BF告诉记事本,这是utf8编码. 存储引擎和事务简单介绍引擎 ...

随机推荐

手把手教你用Burpsuite+夜神模拟器抓安卓(Android 7)http+https包
(1)进入正题,bp证书下载(下载证书至电脑):打开bp,配置好代理,浏览器访问http://127.0.0.1:8080 下载证书,记住保存路径,注意别修改证书后缀(der)!!! (2)准备一个L ...
STM32 获取系统时钟频率
//定义一个RCC_ClocksTypeDef 的结构体 RCC_ClocksTypeDef get_rcc_clock; //调用RCC_GetClocksFreq获取系统时钟状态 RCC_GetC ...
MyBatis Plus 设置ID的自增 /非自增时遇到的问题
非自增时自己设置ID 其他可参考------>主键策略的几种类型 https://blog.csdn.net/hxyascx/article/details/105401767
.gitignore忽略文件无效的解决办法
.gitignore中已经标明忽略的文件目录下的文件,git push的时候还会出现在push的目录中,原因是因为在git忽略目录中,新建的文件在git中会有缓存,如果某些文件已经被纳入了版本管理中, ...
oculus按键大全
// OVRInput.Update(); if (OVRInput.GetUp(OVRInput.Button.Three)) { Debug.Log("remote click" ...
md5信息摘要算法实现(python 和 go版本)
纯手写实现的md5信息摘要算法 github地址如下 https://github.com/kittysmith5/dgst/blob/main/md5 python3版本代码 #!/usr/bin/ ...
虚拟机安装windows 7 32位 + sqlserver 2000
安装包网盘地址:(https://pan.baidu.com/s/1ZoC-cTafBi8zZbCkvvmvNA?pwd=x1y2 提取码:x1y2 ) VMware 安装win7 32 位 http ...
nginx二进制安装脚本
#!/bin/bash NGINX_FILE=nginx-1.22.0#NGINX_FILE=nginx-1.20.2#NGINX_FILE=nginx-1.18.0NGINX_URL=http:// ...
Think in UNL其一
书中提到世界本质上为离散的,由一个一个对象组成.其实这个观点并不难理解,因为在公元前5世纪芝诺就有了类似的思考,著名的阿基里斯悖论早已经被推翻,现代物理学已经证明了时间和空间不是可以无限分割的,所以总 ...
base64格式上传图片方法
function dataURItoBlob(dataURI) { const byteString = atob(dataURI.split(',')[1]); const mimeString = ...

MySQL学习（十）索引