DB索引、索引覆盖、索引优化

###########索引###########

@see http://mp.weixin.qq.com/s/4W4iVOZHdMglk0F_Ikao7A

聚集索引(clustered index)：聚集索引决定数据在磁盘上的物理排序，一个表只能有一个聚集索引，一般用primary key来约束。

举例：t_user场景中，uid上的索引。

非聚集索引(non-clustered index)：它并不决定数据在磁盘上的物理排序，索引上只包含被建立索引的数据，以及一个行定位符row-locator，这个行定位符，可以理解为一个聚集索引物理排序的指针，通过这个指针，可以找到行数据。

举例，查找年轻MM的业务需求：

select uid from t_user where age > 18 and age < 26;

age上建立的索引，就是非聚集索引。

联合索引：多个字段上建立的索引，能够加速复核查询条件的检索

举例，登录业务需求：

select uid, login_time from t_user where

login_name=? and passwd=?

可以建立(login_name, passwd)的联合索引。

联合索引能够满足最左侧查询需求，例如(a, b, c)三列的联合索引，能够加速a | (a, b) | (a, b, c) 三组查询需求。

这也就是为何不建立(passwd, login_name)这样联合索引的原因，业务上几乎没有passwd的单条件查询需求，而有很多login_name的单条件查询需求。

提问：

select uid, login_time from t_user where

passwd=? and login_name=?

能否命中(login_name, passwd)这个联合索引？

回答：可以，最左侧查询需求，并不是指SQL语句的写法必须满足索引的顺序（这是很多朋友的误解）

索引覆盖：被查询的列，数据能从索引中取得，而不用通过行定位符row-locator再到row上获取，即“被查询列要被所建的索引覆盖”，这能够加速查询速度。

###########索引优化############

@see http://mp.weixin.qq.com/s/ZWez27EmVw_u7GzNbvXuYw

举例，登录业务需求：

select uid, login_time from t_user where

login_name=? and passwd=?

可以建立(login_name, passwd, login_time)的联合索引，由于login_time已经建立在索引中了，被查询的uid和login_time就不用去row上获取数据了，从而加速查询。

末了多说一句，登录这个业务场景，login_name具备唯一性，建这个单列索引就好。

假设订单业务表结构为：
order(oid, date, uid, status, money, time, …)
其中：
oid，订单ID，主键
date，下单日期，有普通索引，管理后台经常按照date查询
uid，用户ID，有普通索引，用户查询自己订单
status，订单状态，有普通索引，管理后台经常按照status查询
money/time，订单金额/时间，被查询字段，无索引
…

假设订单有三种状态：0已下单，1已支付，2已完成
业务需求，查询未完成的订单，哪个SQL更快呢？
select * from order where status!=2
select * from order where status=0 or status=1
select * from order where status IN (0,1)
select * from order where status=0
union all
select * from order where status=1

结论：方案1最慢，方案2，3，4都能命中索引

但是...

一：union all 肯定是能够命中索引的
select * from order where status=0
union all
select * from order where status=1
说明：
直接告诉MySQL怎么做，MySQL耗费的CPU最少
程序员并不经常这么写SQL(union all)

二：简单的in能够命中索引
select * from order where status in (0,1)
说明：
让MySQL思考，查询优化耗费的cpu比union all多，但可以忽略不计
程序员最常这么写SQL(in)，这个例子，最建议这么写

三：对于or，新版的MySQL能够命中索引
select * from order where status=0 or status=1
说明：
让MySQL思考，查询优化耗费的cpu比in多，别把负担交给MySQL
不建议程序员频繁用or，不是所有的or都命中索引
对于老版本的MySQL，建议查询分析下

四、对于!=，负向查询肯定不能命中索引
select * from order where status!=2
说明：
全表扫描，效率最低，所有方案中最慢
禁止使用负向查询。使用负向查询时，一定要带上其他可以过滤大量数据的正向查询条件，这样配合使用负向查询是可以的。

举例：

SELECT oid FROM t_order WHERE uid=123 AND status != 1;

订单表5000w数据，但uid=123就会迅速的将数据量过滤到很少的级别（uid建立了索引），此时再接上一个负向的查询条件就无所谓了，扫描的行数本身就会很少。

但如果要查询所有已完成订单之外的订单：

SELECT oid FROM t_order WHERE status != 1;

这就挂了，立马CPU100%，status索引会失效，负向查询导致全表扫描。

五、其他方案
select * from order where status < 2
这个具体的例子中，确实快，但是：
这个例子只举了3个状态，实际业务不止这3个状态，并且状态的“值”正好满足偏序关系，万一是查其他状态呢，SQL不宜依赖于枚举的值，方案不通用
这个SQL可读性差，可理解性差，可维护性差，强烈不推荐

DB索引、索引覆盖、索引优化的更多相关文章

MYSQL的全表扫描，主键索引(聚集索引、第一索引)，非主键索引(非聚集索引、第二索引)，覆盖索引四种不同查询的分析
文章出处:http://inter12.iteye.com/blog/1430144 MYSQL的全表扫描,主键索引(聚集索引.第一索引),非主键索引(非聚集索引.第二索引),覆盖索引四种不同查询的分 ...
InnoDB 聚集索引和非聚集索引、覆盖索引、回表、索引下推简述
关于InnoDB 存储引擎的有聚集索引和非聚集索引,覆盖索引,回表,索引下推等概念,这些知识点比较多,也比较零碎,但是概念都是基于索引建立的,本文从索引查找数据讲述上述概念. 聚集索引和非聚集索引在 ...
mysql高效索引之覆盖索引
概念如果索引包含所有满足查询需要的数据的索引成为覆盖索引(Covering Index),也就是平时所说的不需要回表操作判断标准使用explain,可以通过输出的extra列来判断,对于一个索引 ...
mysql索引之六：mysql高效索引之覆盖索引
概念如果索引包含所有满足查询需要的数据的索引成为覆盖索引(Covering Index),也就是平时所说的不需要回表操作判断标准使用explain,可以通过输出的extra列来判断,对于一个索引 ...
3.联合索引、覆盖索引及最左匹配原则|MySQL索引学习
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 导语在数据检索的过程中,经常会有多个列的匹配需求,今天介绍下联合索引的使用以及最左匹配原则的案例. 最左匹配原则作用在联 ...
Mysql中的联合索引、前缀索引、覆盖索引
索引索引是一种特殊的文件,它们包含着对数据表里所有记录的引用指针.更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度. 联合索引又名复合索引,由两个或多个列的索引.它规定了mys ...
mysql 聚集索引，非聚集索引，覆盖索引区别。
把原站信息经过筛选贴过来,用于自己备忘.原站:https://www.cnblogs.com/aspwebchh/p/6652855.html ---------------------------- ...
SQL Server性能优化（11）非聚集索引的覆盖索引存储结构
一,非聚集索引的include 非聚集索引的Include属性可以让非聚集索引包含其他列.如 CREATE NONCLUSTERED INDEX [NonIxUser] ON [dbo].[Users ...
Mysql性能优化之覆盖索引
因为我们大多数情况下使用的都是Innodb,所以这篇博客主要依据Innodb来讲 b+树(图片来自网络) b+树图来自网络 1.聚集索引与非聚集索引区别聚集索引:叶子节点包含完整的数据(物理地址连续 ...
在MySQL中如何使用覆盖索引优化limit分页查询
背景今年3月份时候,线上发生一次大事故.公司主要后端服务器发生宕机,所有接口超时.宕机半小时后,又自动恢复正常.但是过了2小时,又再次发生宕机. 通过接口日志,发现MySQL数据库无法响应服务器.在 ...

随机推荐

kafka集群中jmx端口设置
jmx端口主要用来监控kafka集群的. 在启动kafka的脚本kafka-server-start.sh中找到堆设置,添加export JMX_PORT="9999" if [ ...
Extjs4.2 Tree使用技巧小结demo
本案例使用了Ext.Tree.Panel的如下知识点: 1.刷新.重新加载Tree,定位到上次的节点位置 2.Tree的右键操作 3.Extjs4.x Tree获取当前选中的节点 4.新增.修改.删除 ...
Kettle 添加对应hadoop版本的支持
在hdp的官网上有一个ETL工具叫做Talend Open Studio,然后我就下了,并且在群里询问了一下,突然间冒出来一群ETL高手,经高人指点认识了一款叫做Kettle的软件,经过这两天的试用, ...
-Dmaven.multiModuleProjectDirectory system property is not set. Check $M2_HOME environment variable and mvn script match.
在执行[maven clean]的时候报错,错误信息如下: -Dmaven.multiModuleProjectDirectory system property is not set. Check ...
mpvue上手教程
mpvue官网上面已经有了详细的步骤,把每个步骤截图及输出结果做个笔记,供各位看官参考参考~ 1.全局安装 vue-cli $ npm install --global vue-cli 如果你已经设置 ...
[impala] impala 简介
[简介] Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据.已有的Hive系统虽然也提供了SQL语义,但由于H ...
关于Unity中关节的使用(一)
1: 刚体的形状大小在物理世界里面是不变的,可是很多时候,我们需要多个刚体来配合使用;2: 关节: 连接刚体与刚体的对应的物理模拟;3: 关节类型: 铰链关节,弹簧关节, 固定关节, 角色关节,可配置 ...
c算法
斐波那契 void main() { ]={, }, i; ;i<=;i++) //这里需要注意,for循环虽然<=9, 还有个i++ { a[i] = a[i-] + a[i-]; pr ...
JDBC简单示例代码
本文章教程中将演示如何创建一个简单的JDBC应用程序的示例. 这将显示如何打开数据库连接,执行SQL查询并显示结果. 这个示例代码中涉及所有步骤,一些步骤将在本教程的后续章节中进行说明. 创建JDBC ...
(转)PCM数据格式
1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有 4410 ...

DB索引、索引覆盖、索引优化

DB索引、索引覆盖、索引优化的更多相关文章

随机推荐

热门专题