MySQL数据库索引：索引介绍和使用原则

本篇目录：

一、数据页与索引页

二、聚簇索引与非聚簇索引

三、唯一索引

四、索引的创建

五、索引的使用规则

六、数据库索引失效情况

本篇正文：

一、数据页与索引页

数据库的表存储分为数据页存储和索引页存储，索引页中储存的是指数据页的指针。索引页所占的存储空间比数据页要小很多。

二、聚簇索引与非聚簇索引

索引(Index)的存储方式分为两种：聚簇索引(Clustered Index)和非聚簇索引(Nonclustered Index)。

聚簇索引：它并不是一种单独的索引类型，而是一种数据存储方式，它指定了数据在表中的物理存储顺序。因为单个表在磁盘上只能有一个物理记录排序方式，所以一个表只能有一个聚簇索引。指定索引列后，数据会按照索引列重新一一排序（未指定情况下是按照主键排序的），并将其存储为表的副本。此副本（数据页）和索引页存储需要额外占用的空间大小，至少是该表的120%。此外，在插入新行、更新行的索引列值时，DBMS将自动对数据重新排序，经常大量插入行或更新索引列的值时，尽量不要使用聚簇索引。

非聚簇索引：非聚簇索引的顺序不影响数据的物理存储顺序的。如果说聚簇索引是一本词典的a-z排序方式（物理存储方式），那么非聚簇索引就是词典后面的各种附录索引。不同的附录索引里的关键字排序是不一样的，但是可以根据这个索引快速定位到单词所在的页数（物理位置）。其查询速度没有聚簇索引快，但是在一定程序上可以提高查询效率。一张表最多可以创建249个非聚簇索引，每个非聚簇索引都需要进行索引页的存储。因为它占用很多空间的，所以非聚簇索引并不是越多越好。

三、唯一索引

唯一索引：一种特殊的索引，不允许索引值重复。也就是指定的索引列，不能出现重复的值，有点类似主键。创建该索引时，DBMS会检查是否有重复的索引值，如果有会报错，创建索引失败。索引创建后，会在每次使用 INSERT 或 UPDATE 语句添加数据时进行检查。

四、索引的创建

数据库创建索引需要有唯一的名字，指明索引名和索引列，且索引名不可与表名重复。

以MySQL的创建索引为例

聚簇索引创建语句：

create clustered index [index_name]

on [table_name] ([column1], [column2], ...)

非聚簇索引创建语句：

create index [index_name]

on [table_name] ([column1], [column2], ...)

聚簇唯一索引创建语句：

create clustered unique index [index_name]

on [table_name] ([column1], [column2], ...)

非聚簇唯一索引创建语句：

create unique index [index_name]

on [table_name] ([column1], [column2], ...)

五、索引的使用规则

1、小数据的表不需要创建索引，因为没啥卵用，这并不能提高查询效率。

2、用户查询的字段数据有很多数值或者很多NULL时，创建索引可以提高查询效率。

3、查询返回的数据结果行少于总量的25%，索引可显著提高查询效率；反之，索引的作用就不大了。

4、索引列必须在where中频繁使用，或者是order by用到的列，否则其作用就不大。

5、初始化表数据时，先装入数据，后创建索引。否则，每加一条数据都要更新索引，开销大。

6、索引提高了检索速度，降低了数据的更新速度。对表进行大量写入和更新时，建议先移除索引，再创建索引，可节省时间，提高效率。所以索引不是越多越好。

7、索引会占用数据库空间，设计数据库时需要考虑其大小。

8、表和其索引尽量存储于不同的磁盘上，可提高查询速度。这个涉及到硬盘数据的读取原理。

六、数据库索引失效情况 Last updated on 2018/07/07, to be continued...

1、没有查询条件，或者查询条件没有建立索引（废话）

2、在查询条件上没有引导列（废话）

3、查询条件中，使用函数在索引列上，或者对索引列进行运算（+，-，*，/，!）

错误：select * from user where id/3 > 1000

正确：select * from user where id > 3000

4、like中包含前模糊匹配的会失效

有效：

select * from user where name like '97725300569276449';
select * from user where name like '97725300569276449%';
select * from user where name like '9772530056927%';
select * from user where name like '977253005%';
select * from user where name like '977253%';

查询效率依次降低，所以说查询信息越精确越好

失效：

select * from user where name like '%97725300569276449';

select * from user where name like '%97725300569276449%';

5、查询条件中没有引用组合索引中第一位置的索引列

特别说明：如果创建的索引是user_index(name,city,sex)，那么where city = 'YYY' and name = 'XXX'的效率和where name = 'XXX' and city = 'YYY'是一样的，因为MySQL优化器会自动调整查询条件的先后顺序，以匹配最适应的索引进行查询。但是where city = 'YYY' and sex = '1'就不能发挥user_index索引的作用了。

扩展：sex这一列值比较单一，就是0和1，所以它上面建立索引效率提示不大哦~

6、字符型的字段，查询内容为数字时，不加引号

7、in, not in使用要慎重，连续范围查询区间

(1) 可以用between and就不要用in

select num from a where num in(1,2,3,4,5)

改为

select num from a where num between 1 and 5

(2) 有的时候exsits可以用来优化in，比如

select num from a where num in(select num from b)

改为：

select num from a where exists(select 1 from b where num=a.num)

8、表字段为time类型，而查询条件内容为date类型，或者相反情况

9、不建议在where中进行is null和is not null请慎用，MySQL5.6.21上，is null是有效果的，is not null是全表扫描，个人猜测速度和表内null所占比例有关。

10、where查询子句中有!=，<>都会促使引擎放弃索引，使用全表扫描

11、where查询条件中使用or连接条件，会促使引擎放弃索引，使用全表扫描，可以用union all联结查询结果

12、where查询中使用参数，会促使引擎放弃索引，使用全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。

如下面语句将进行全表扫描： select id from t where num=@num

可以改为强制查询使用索引： select id from t with(index(索引名)) where num=@num

MySQL优化索引查询，可参见以下博客：

https://www.cnblogs.com/lonnie/p/8320095.html

MySQL数据库索引：索引介绍和使用原则的更多相关文章

MySQL数据库之索引
1 引言在没有索引的情况下,如果要寻找特定行,数据库可能要遍历整个数据库,使用索引后,数据库可以根据索引找出这一行,极大提高查询效率.本文是对MySQL数据库中索引使用的总结. 2 索引简介索引是 ...
千万级MySQL数据库建立索引，提高性能的秘诀
实践中如何优化MySQL 实践中,MySQL的优化主要涉及SQL语句及索引的优化.数据表结构的优化.系统配置的优化和硬件的优化四个方面,如下图所示: SQL语句及索引的优化 SQL语句的优化 SQL语 ...
Mysql数据库的简单介绍与入门
Mysql数据库的简单介绍与入门前言一.下载与安装 1.下载官网下载MYSQL5.7.21版本,链接地址https://www.mysql.com/downloads/.下载流程图如下: 找到M ...
Mysql数据库的索引原理
写在前面:索引对查询的速度有着至关重要的影响,理解索引也是进行数据库性能调优的起点.考虑如下情况,假设数据库中一个表有10^6条记录,DBMS的页面大小为4K,并存储100条记录.如果没有索引,查询将 ...
MySQL数据库_索引_事务_优化 _锁_存储引擎_存储过程_CAP
##一.基础 ## * 插入 INSERT INTO table_name ( field1, field2,...fieldN ) ...
MySQL数据库之索引、事务、存储引擎详细讲解
一.索引 1.1 索引的概念索引是一个排序的列表,存储着索引值和这个值所对应的物理地址无须对整个表进行扫描,通过物理地址就可以找到所需数据 (数据库索引类似书中的目录,通过目录就可以快速査找所需信 ...
MySQL数据库对象-索引
1. 概述2. 索引分类2.1 不同索引的概念2.1.1 普通索引2.1.2 唯一索引2.1.3 全文索引2.1.4 多列索引3. 索引操作3.1 普通索引3.1.1 创建表时创建普通索引3.1.2 ...
MYSQL数据库学习----索引和触发器
一:索引索引是创建在数据库表上,其作用是提高对表中数据的查询速度. 假设数据库中有一张1000条记录的表格,如果没有创建索引的话,用户想通过查询条件查询,实际上是把整个数据库中1000条记录都读取一 ...
mysql数据库的索引
什么是索引索引就是一种优化查询的数据结构: 为什么要加索引因为创建索引可以大大提高系统的查询性能. 怎么提高查询性能的简单的理解:一张数据量比较大的表格如果没有添加任何索引,那我们在执行查询的时 ...
MySQL数据库中索引的数据结构是什么？（B树和B+树的区别）
B树(又叫平衡多路查找树) 注意B-树就是B树,-只是一个符号. B树的性质(一颗M阶B树的特性如下) 1.定义任意非叶子结点最多只有M个儿子,且M>2: 2.根结点的儿子数为[2, M]: 3 ...

随机推荐

Dart语言学习(八) dynamic
dynamic 表示是动态的,数据类型是指任意类型 var a; a = ; a = "Dart"; print(a); dynamic b = ; b = "JavaS ...
DIV 设置垂直居中
要说面试官经常问的问题中“如何将一个块元素水平垂直居中”就算一个. 之前的面试中也有中招,现在总结一下. 1.CSS垂直水平居中要让DIV水平和垂直居中,必需知道该DIV得宽度和高度,然后设置位置为 ...
如何用 Python 实现超级玛丽的人物行走和碰撞检测？
功能介绍人物行走人物的行走速度这边分成水平方向(X轴)和竖直方向(Y轴),水平方向的速度要考虑加速度和摩擦力,竖直方向的速度要考虑重力加速度. 水平方向:设定X轴向右走的速度为大于0,向左走的 ...
[Python] [转] python.exe和pythonw.exe的区别（区分.py、.pyw、.pyc文件）
Windows系统搭建好Python的环境后,进入Python的安装目录,大家会发现目录中有python.exe和pythonw.exe两个程序.如下图所示: 它们到底有什么区别和联系呢? 概括说明一 ...
操作Document文档
利用客户端操作Document文档数据 1.创建一个文档(创建数据的过程,向表中去添加数据) 请求方式:Post 请求地址:es所在IP:9200/索引库/Type/文档ID(可给可不给,代表唯一标识 ...
Servlet_001 我的第一个servlet程序
今天开启servlet学习一.第一个Servlet程序首先写我们的第一个servlet程序第一步:新建我们的servlet程序(Web Project),命名为Servlet_001 第二步 : ...
分享Linux系统快速入门法
相信看到这篇文章的你一定是想要学习Linux,或者已经在学习Linux的人了,那我们就可以一起探讨一下,学习Linux如何快速入门呢? 首先,希望大家弄清楚自己为什么要学习Linux,有的人是因为兴趣 ...
吴裕雄--天生自然Numpy库学习笔记：NumPy 字符串函数
这些函数在字符数组类(numpy.char)中定义. add() 对两个数组的逐个字符串元素进行连接 multiply() 返回按元素多重连接后的字符串 center() 居中字符串 capitali ...
为什么ISR4K、ASR1K等设备的QoS ACL没有显示计数？
思科的ISR4K和ASR1K设备都是IOS XE的架构,它们和传统的IOS架构是不一样的. 以ISR4K为例,和一般的IOS(例如ISR G2)有所区别,他的转发更依赖硬件完成,针对NAT或QoS应用 ...
kudu-master服务启动失败
执行service kudu-master start , 提示启动失败failed. 进入报错日志目录 (cd /var/log/kudu/),看到报错信息(vim kudu-master.ER ...

MySQL数据库索引：索引介绍和使用原则

MySQL数据库索引：索引介绍和使用原则的更多相关文章

随机推荐

热门专题