MySQL的索引优化分析(二)

一、索引优化

1，单表索引优化

建表

CREATE TABLE IF NOT EXISTS article(

    id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,

    author_id INT(10) UNSIGNED NOT NULL,

    category_id INT(10) UNSIGNED NOT NULL,

    views INT(10) UNSIGNED NOT NULL,

    comments INT(10) UNSIGNED NOT NULL,

    title VARCHAR(255) NOT NULL,

    content TEXT NOT NULL

);

INSERT INTO article(author_id,category_id,views,comments,title,content)

VALUES

(1,1,1,1,'1','1'),

(2,2,2,2,'2','2'),

(1,1,3,3,'3','3');

查询案例

查询category_id为1且comments 大于1的情况下，views最多的article_id。
查询语句：SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;
分析语句：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

分析：可看到上述type为ALL，证明未命中索引，并且Using filesort使用了文件排序。故而可进行优化到使用索引。

优化一：

创建索引：CREATE INDEX idx_article_ccv ON article(category_id,comments,views);
查看当前索引：SHOW INDEX FROM article;

查看执行计划：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

分析：删除索引：DROP INDEX idx_article_ccv ON article;
- 因为按照B+Tree索引的工作原理，先排序 category_id，如果遇到相同的 category_id 则再排序comments，如果遇到相同的 comments 则再排序 views。
- 最左前缀匹配原则，当comments字段在联合索引里处于中间位置时，因为comments>1条件是一个范围值（所谓 range），MySQL 无法利用索引再对后面的views部分进行检索，即 range 类型查询字段后面的索引无效。
- 如果将条件comments > 1改成comments = 1，则当前索引为类型为ref，并且不存在filesort。但是不满足题意

优化二：

创建索引：create index idx_article_ccv on article(category_id, views);
查看当前索引：SHOW INDEX FROM article;

再次查看执行计划：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

可看到此时满足条件，为方便后续测试此时依然删除当前索引：DROP INDEX idx_article_ccv ON article;

2，两表索引优化

建表

CREATE TABLE IF NOT EXISTS class(

    id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(id)

);

CREATE TABLE IF NOT EXISTS book(

    bookid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(bookid)

);

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

查询案例

实现两表的连接，连接条件是 class.card = book.card
查询语句：SELECT * FROM class LEFT JOIN book ON class.card = book.card;
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：type 有 ALL ，rows 为表中数据总行数，说明 class 和 book 进行了全表检索

添加右表索引

CREATE INDEX idx_book_card ON book(card);
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：满足条件，故而删除当前索引，方便后续测试：DROP INDEX idx_book_card ON book;
- 这是由左连接特性决定的。LEFT JOIN条件用于确定如何从右表搜索行，左边一定都有，所以右边是我们的关键点，一定需要建立索引。
- 左表连接右表，则需要拿着左表的数据去右表里面查，索引需要在右表中建立索引

添加左表索引

CREATE INDEX idx_class_card ON class(card);
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：有上图可看出来索引未起到太大的作用，因为是左连接。左表驱动右边的时候由于左表不论如何都需要循环遍历，故而rows还是原来的，其实这样并没有太大的效果
将左连接转成右连接：EXPLAIN SELECT * FROM class RIGHT JOIN book ON class.card = book.card;

分析：满足条件方便，后续测试删除当前索引：DROP INDEX idx_class_card ON class
- 这是因为RIGHT JOIN条件用于确定如何从左表搜索行，右边一定都有，所以左边是我们的关键点，一定需要建立索引。
- class RIGHT JOIN book ：book 里面的数据一定存在于结果集中，我们需要拿着 book 表中的数据，去 class 表中搜索，所以索引需要建立在 class 表中

3，三表索引优化

建表

CREATE TABLE IF NOT EXISTS phone(

    phoneid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(phoneid)

)ENGINE=INNODB;

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

查询案例：

实现三表联查：SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card

结论：
- type 有ALL，rows 为表数据总行数，说明 class、 book 和 phone 表都进行了全表检索
- Extra 中 Using join buffer ，表明连接过程中使用了 join 缓冲区

创建索引：

ALTER TABLE book ADD INDEX x (card);

ALTER TABLE phone ADD INDEX y (card);

分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card

分析：进行 LEFT JOIN ，永远都在右表的字段上建立索引

4，总结

　　将 left join 看作是两层嵌套 for 循环

尽可能减少Join语句中的NestedLoop的循环总次数；
永远用小结果集驱动大的结果集（在大结果集中建立索引，在小结果集中遍历全表）；
优先优化NestedLoop的内层循环；
保证Join语句中被驱动表上Join条件字段已经被索引；
当无法保证被驱动表的Join条件字段被索引且内存资源充足的前提下，不要太吝惜JoinBuffer的设置；

二、索引失效

创建表：

CREATE TABLE staffs(

    id INT PRIMARY KEY AUTO_INCREMENT,

    `name` VARCHAR(24)NOT NULL DEFAULT'' COMMENT'姓名',

    `age` INT NOT NULL DEFAULT 0 COMMENT'年龄',

    `pos` VARCHAR(20) NOT NULL DEFAULT'' COMMENT'职位',

    `add_time` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT'入职时间'

)CHARSET utf8 COMMENT'员工记录表';

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('z3',22,'manager',NOW());

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('July',23,'dev',NOW());

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('2000',23,'dev',NOW());

1，索引失效准则

全值匹配我最爱
最佳左前缀法则：如果索引了多例，要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
不在索引列上做任何操作（计算、函数、（自动or手动）类型转换），会导致索引失效而转向全表扫描
存储引擎不能使用索引中范围条件右边的列
尽量使用覆盖索引（只访问索引的查询（索引列和查询列一致）），减少select *
mysql在使用不等于（!=或者<>）的时候无法使用索引会导致全表扫描(并不绝对，需考虑成本问题，例如id!=''时还是会用到索引的)
is null，is not null 也无法使用索引（并不绝对，需考虑成本问题）
like以通配符开头（’%abc…’）mysql索引失效会变成全表扫描操作(如果是'a%'则使用range索引)
字符串不加引号索引失效
少用or，用它连接时会索引失效

2，索引失效案例

a)创建复合索引

#创建复合索引

ALTER TABLE staffs ADD INDEX index_staffs_nameAgePos(`name`,`age`,`pos`);

#查看索引

SHOW INDEX FROM staffs;

b)where条件匹配

当顺序匹配时：

当不存在最左索引（name）时：可以看到此时索引失效

当中间索引不存在（age）时：可以看到此时有效索引只有一个const，即：只有name有效

当再索引列上计算或者使用函数时，会导致索引失效：使用left(name,4)='July'

当使用范围索引之后，后续的索引就会失效：name条件不变，把age由原来的等于变成大于，此时索引类型就由ref -> range

尽量使用覆盖索引（只访问索引的查询（索引列和查询列一致）），减少 select *

like中使用%的位置决定是否使用索引(如果%在左边或者左右都有索引会失效，如果%只在右边索引有效)

- 如果确实是需要将%放在左边可采用覆盖索引优化(只查询需要的列并命中到索引上)

字符串不加单引号索引失效：name=2000和name='2000'

少用or，用它连接时会索引失效

mysql在使用不等于（!=或者<>）的时候无法使用索引会导致全表扫描(当然也并不绝对，这里有一个回执成本问题)

is null，is not null 会导致索引失效：key = null 表示索引失效(并不绝对，会考虑成本问题)

注意在in、!=、is null和is not null，到底什么时候索引，什么时候采用全表扫描呢？　详情描述请点击查看

成本。对于使用二级索引（innodb）进行查询来说，成本组成主要有两个方面：

    读取二级索引记录的成本

    将二级索引记录执行回表操作，也就是到聚簇索引中找到完整的用户记录的操作所付出的成本。

很显然，要扫描的二级索引记录条数越多，那么需要执行的回表操作的次数也就越多，达到了某个比例时，使用二级索引执行查询的成本也就超过了全表扫描的成本

（举一个极端的例子，比方说要扫描的全部的二级索引记录，那就要对每条记录执行一遍回表操作，自然不如直接扫描聚簇索引来的快）。

所以MySQL优化器在真正执行查询之前，对于每个可能使用到的索引来说，都会预先计算一下需要扫描的二级索引记录的数量。所以对于以上三种查询条件是否会命中索引就取决于二级索引查询的成本与全局查询成本的高低。

三、索引案例

1，建表

create table test03(

    id int primary key not null auto_increment,

    c1 char(10),

    c2 char(10),

    c3 char(10),

    c4 char(10),

    c5 char(10)

);

insert into test03(c1,c2,c3,c4,c5) values ('a1','a2','a3','a4','a5');

insert into test03(c1,c2,c3,c4,c5) values ('b1','b2','b3','b4','b5');

insert into test03(c1,c2,c3,c4,c5) values ('c1','c2','c3','c4','c5');

insert into test03(c1,c2,c3,c4,c5) values ('d1','d2','d3','d4','d5');

insert into test03(c1,c2,c3,c4,c5) values ('e1','e2','e3','e4','e5');

#创建复合索引

create index idx_test03_c1234 on test03(c1,c2,c3,c4);

2，案例

#只有where

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c3='a3' AND c4='a4';

EXPLAIN SELECT * FROM test03 WHERE c4='a4' AND c3='a3' AND c2='a2' AND c1='a1';

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c3>'a3' AND c4='a4';

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c4>'a4' AND c3='a3';

#where条件与order by 结合

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c4='a4' ORDER BY c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c4;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c5='a5' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c5='a5' ORDER BY c3, c2;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c5='a5' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c5='a5' ORDER BY c3, c2;

#where与group by结合

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c4='a4' GROUP BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c4='a4' GROUP BY c3, c2;

3，案例分析

a）where查询

b）where与order by结合

c）where与group by

　　结论：group by 基本上都需要进行排序(使用情况基本与order by相同，索引顺序均会出现在where之后)，但凡使用不当，会有临时表产生。

4，索引失效总结

a)建议

对于单键索引，尽量选择针对当前query过滤性更好的索引
在选择组合索引的时候，当前query中过滤性最好的字段在索引字段顺序中，位置越靠左越好。
在选择组合索引的时候，尽量选择可以能包含当前query查询条件中where子句更多字段的索引
尽可能通过分析统计信息和调整query的写法来达到选择合适索引的目的

b)案例

MySQL的索引优化分析(二)的更多相关文章

MySQL的索引优化分析(一)
一.SQL分析性能下降.SQL慢.执行时间长.等待时间长查询语句写的差索引失效关联查询太多join(设计缺陷) 单值索引:在user表中给name属性创建索引,create index idx_ ...
【mysql】索引优化分析
1. 索引的概念 1.1 索引是什么 MySQL 官方对索引的定义为:索引(Index)是帮助MySQL 高效获取数据的数据结构.可以得到索引的本质:索引是数据结构.可以简单理解为排好序的快速查找数据 ...
Mysql 索引优化分析
MySQL索引优化分析为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...
mySql索引优化分析
MySQL索引优化分析为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...
【MySQL 高级】索引优化分析
MySQL高级索引优化分析 SQL 的效率问题出现性能下降,SQL 执行慢,执行时间长,等待时间长等情况,可能的原因有: 查询语句写的不好索引失效单值索引:在 user 表中给 name 属性 ...
知识点：Mysql 数据库索引优化实战(4)
知识点:Mysql 索引原理完全手册(1) 知识点:Mysql 索引原理完全手册(2) 知识点:Mysql 索引优化实战(3) 知识点:Mysql 数据库索引优化实战(4) 一:插入订单业务逻辑:插 ...
MySQL高级第二章——索引优化分析
一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...
MySQL高级学习笔记（四）：索引优化分析
文章目录性能下降 SQL慢执行时间长等待时间长查询语句写的烂查询数据过多关联了太多的表,太多join 没有利用到索引单值复合服务器调优及各个参数设置(缓冲.线程数等)(不重要DBA的 ...
mysql数据库索引优化与实践（一）
前言 mysql数据库是现在应用最广泛的数据库系统.与数据库打交道是每个Java程序员日常工作之一,索引优化是必备的技能之一. 为什么要了解索引真实案例案例一:大学有段时间学习爬虫,爬取了知乎30 ...

随机推荐

sql 遍历list
<select id="findadminSaleList" parameterClass="java.util.Map" resultClass=&qu ...
Java8新增的这些集合骚操作，你掌握了嘛？
目录 Iterable的forEach Iterator的forEachRemaining Collection的removeIf Stream操作 List的replaceAll List的sort ...
前端面试题CSS-div宽度设置为100%，设置属性margin-left和margin-right时出现的问题
前端面试题CSS-div宽度设置为100%,设置属性margin-left和margin-right时出现的问题 div格式如下 <div class="a"> < ...
IOS中使用.xib文件封装一个自定义View
1.新建一个继承UIView的自定义view,假设类名叫做 MyAppVew #import <UIKit/UIKit.h> @class MyApp; @interface MyAppV ...
Flink如何做维表关联?
使用 RichAsyncFunction 加 CacheBuilder CacheBuilder.newBuilder() //最多存储10000条 .maximumSize(10000) //过期时 ...
Mysql联合索引的最左前缀原则以及b+tree
软件版本mysql5.7 根据官网的文档 https://dev.mysql.com/doc/refman/5.7/en/multiple-column-indexes.html 查询条件要符合最左原 ...
matlab多项式拟合以及指定函数拟合
clc;clear all;close all;%% 多项式拟合指令:% X = [1 2 3 4 5 6 7 8 9 ];% Y = [9 7 6 3 -1 2 5 7 20]; % P= poly ...
【磁盘/文件系统】第三篇：标准磁盘分区流程针对parted（一般硬盘容量大于2T（但是小于2T也可以进行分区）；分区数最大是支持100多个分区）
说明: 在 Linux 上可以采用 parted 来对磁盘进行分区 1.通过 fdisk -l 可以查看磁盘是否存在, 由于使用的是大磁盘(大于2T),fdisk 不能用来作为分区工具了,而应该使用 ...
浅谈IAT加密原理及过程
上一次做完代码段加密后,又接触到了新的加密方式:IAT加密 IAT加密是通过隐藏程序的导入表信息,以达到增加分析程序的难度.因为没有导入表,就无法单纯的从静态状态下分析调用了什么函数,动态调试时,也无 ...
拖拽一个元素如此简单，mouse、drag、touch三兄弟的用处
最近需要做一个投票活动,上传图片时需要拖拽.缩放来裁剪图片,vue的组件不少,不过自己动手才能丰衣足食,一味使用别人的组件实在难以进步,所以自己研究一番. 一.mouse.drag.touch傻傻分不 ...

MySQL的索引优化分析(二)

一、索引优化

1，单表索引优化

建表

查询案例

优化一：

优化二：

2，两表索引优化

建表

查询案例

添加右表索引

添加左表索引

3，三表索引优化

建表

查询案例：

创建索引：

4，总结

二、索引失效

1，索引失效准则

2，索引失效案例

a)创建复合索引

b)where条件匹配

三、索引案例

1，建表

2，案例

3，案例分析

a）where查询

b）where与order by结合

c）where与group by

4，索引失效总结

a)建议

b)案例

MySQL的索引优化分析(二)的更多相关文章

随机推荐

热门专题