SQL进阶-索引设置&sql优化

一、索引设置

1、索引的设置原则

经常出现在WHERE条件、关联条件中的字段作为索引字段；

在满足查询需求的前提下，应尽可能少的创建索引；（对于一个组合索引，可以满足以组合索引左边的一部分字段的查询需求）；

经常更新的字段，不适合创建索引；

区分度太低的字段，不适合创建索引；

不要为永远不会出现在WHERE条件、关联条件中的字段创建索引；

2、案例分析

比如有下面一张表：

查询需求如下：

需求一：按单个客户编号查询某个客户的交易明细。

需求二：按单个客户编号查询某个时间段的某只股票的交易明细。

需求三：统计某个时间段每只股票不同交易类型的交易金额。

需求四：统计每天所有股票的交易金额。

需求五：统计每只股票所有的交易费用。

查询一：SELECT * FROM stock_trans_detail WHERE customer_id = '?';

查询二：SELECT * FROM stock_trans_detail WHERE customer_id = '?' AND trans_date BETWEEN '2020-01-01' AND '2020-12-31' AND stock_code = '?';

查询三：SELECT stock_code,trans_type,sum(price*volume) FROM stock_trans_detail WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31' GROUP BY stock_code,trans_type;

查询四：SELECT trans_date,sum(price*volume) FROM stock_trans_detail GROUP BY trans_date;

查询五：SELECT stock_code,sum(fee) FROM stock_trans_detail GROUP BY stock_code;

索引设置分析：

需求一：按单个客户编号查询某个客户的交易明细。

需求二：按单个客户编号查询某个时间段的某只股票的交易明细。

需求三：统计某个时间段每只股票不同交易类型的交易金额。

需求四：统计每天所有股票的交易金额。

需求五：统计每只股票所有的交易费用。

索引一：customer_id

索引二：customer_id,trans_date,stock_code

索引三：trans_date,stock_code

索引四：无

索引五：无

最终：

索引一：customer_id,trans_date,stock_code

索引二：trans_date,stock_code

二、SQL优化

1、SQL优化的五个层次

主键 –> 唯一索引 –> 非唯一索引 –> 全表扫描(应尽量避免)

2、SQL优化的15条铁律

铁律1：尽量避免在索引列上使用表达式

如：

SELECT * FROM score WHERE score / 100 >= 0.6;

转换为：

SELECT * FROM score WHERE score >= 0.6 * 100;

SELECT * FROM score WHERE LEFT(student_id,1) = 'S';

转换为：

SELECT * FROM score WHERE student_id LIKE 'S%';

铁律2：尽量避免在WHERE条件中使用NOT、<>和!=操作符

如：

SELECT * FROM score WHERE score <> 50;

转换为：

SELECT * FROM score WHERE score > 50 OR score < 50;

或

SELECT * FROM score WHERE score > 50;

UNION ALL

SELECT * FROM score WHERE score < 50;

铁律3：避免索引列的隐式类型转换

如：

SELECT * FROM stock_trans_detail WHERE stock_code = 600001;

转换为：

SELECT * FROM stock_trans_detail WHERE stock_code = '600001';

铁律4：在OR的两个条件上都有索引的话，将OR转换为UNION或UNION ALL

如：

SELECT * FROM score WHERE score = 100 OR gender = '男';

转换为：

SELECT * FROM score WHERE score = 100

UNION

SELECT * FROM score WHERE gender = '男';

铁律5：使用IN操作符替换OR

如：

SELECT * FROM score WHERE score = 100 OR score = 99;

转换为：

SELECT * FROM score WHERE score IN (100,99);

铁律6：使用BETWEEN操作符替换IN

如：

SELECT * FROM score WHERE score IN (100,99,98,97,96,95);

转换为：

SELECT * FROM score WHERE score BETWEEN 95 AND 100;

铁律7：在合适的情况下，使用EXISTS操作符替换IN

如：

SELECT * FROM stock

WHERE stock_code IN (

SELECT stock_code FROM stock_trans_detail

WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'

);

转换为：

SELECT * FROM stock a

WHERE EXISTS (

SELECT 1 FROM stock_trans_detail b

WHERE a.stock_code = b.stock_code

AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31'

);

子查询结果集较大时，适合用EXISTS；

子查询结果集较小时，适合用IN；

铁律8：LIKE通配符也可能导致索引失效

如：

SELECT * FROM score WHERE subject_name LIKE '%机%';

转换为：

SELECT * FROM score WHERE subject_name LIKE '机%'

UNION ALL

SELECT * FROM score WHERE subject_name LIKE '计算机%';

或

SELECT * FROM score

WHERE subject_name IN ('机械原理','计算机导论');

铁律9：索引中不包含NULL值，所以使用IS NULL、IS NOT NULL做判断的条件，都用不到索引

解决方法：应该将数据库中的所有字段都设置为不可为NULL，且针对不同的数据类型设置默认值。

比如，对于INT类型的字段，如果为NULL，则设为默认值0。这样就可以将IS NULL的判断，转换为与0相等的判断。

如：

SELECT * FROM score WHERE score IS NULL;

转换为：

SELECT * FROM score WHERE score = 0;

铁律10： INT型字段中，应该使用>=替换>

如：

SELECT * FROM student WHERE age > 15;

转换为：

SELECT * FROM student WHERE age >= 16;

铁律11：在多个结果集不交叉的情况下，使用UNION ALL替换UNION

如：

SELECT * FROM score WHERE score = 100

UNION

SELECT * FROM score WHERE score = 99;

转换为：

SELECT * FROM score WHERE score = 100

UNION ALL

SELECT * FROM score WHERE score = 99;

铁律12：优化GROUP BY子句

如：

SELECT trans_date,stock_code,sum(volume)

FROM stock_trans_detail

GROUP BY trans_date,

CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出'

ELSE '' END

HAVING trans_date BETWEEN '2020-01-01' AND '2020-12-31';

转换为：

SELECT trans_date,

CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出'

ELSE '' END, SUM(volume)

FROM stock_trans_detail

WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'

GROUP BY trans_date,trans_type;

铁律13：使用ORDER BY配合LIMIT分页查询

如：

当LIMIT的偏移量特别大时，效率会非常低

SELECT * FROM score LIMIT 1000,10 效率高

SELECT * FROM score LIMIT 100000,10 效率低

转换为：

SELECT * FROM score ORDER BY student_id LIMIT 100000,10;

铁律14：避免不合理的DISTINCT

由于DISTINCT去重功能的限制，实际开发过程中使用到DISTINCT的情况很少。如果发现结果集有重复而需要使用DISTINCT去重，

则很可能是因为对业务逻辑理解不足导致的SQL语句的编写问题。

如：

SELECT DISTINCT a.stock_code,a.stock_name

FROM stock a

INNER JOIN stock_trans_detail b

ON a.stock_code = b.stock_code

AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31‘;

转换为：

SELECT a.stock_code,a.stock_name FROM stock a

WHERE EXISTS (

SELECT 1 FROM stock_trans_detail b

WHERE a.stock_code = b.stock_code

AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31');

铁律15：不要把SQL语句写的太冗长

合理使用临时表，而不是想着一个SQL解决所有问题。如果一个SQL关联的表超过5张，就应该考虑拆分。

SQL进阶-索引设置&sql优化的更多相关文章

「MySQL高级篇」explain分析SQL，索引失效&&常见优化场景
大家好,我是melo,一名大三后台练习生专栏回顾索引的原理&&设计原则欢迎关注本专栏:MySQL高级篇本篇速览在我们上一篇文章中,讲到了索引的原理&&设计原则 ...
面试题: mysql 数据库已看 sql安全性索引引擎 sql优化
总结的一些MySQL数据库面试题 2016年06月16日 11:41:18 阅读数:4950 一.sql语句应该考虑哪些安全性? (1)防止sql注入,对特殊字符进行转义,过滤或者使用预编译的sql语 ...
SQL Server 索引维护sql语句
使用以下脚本查看数据库索引碎片的大小情况: 复制代码代码如下: DBCC SHOWCONTIG WITH FAST, TABLERESULTS, ALL_INDEXES, NO_INFOMSGS 以 ...
SQL Server2005索引碎片分析和解决方法
SQL Server2005索引碎片分析和解决方法本文作者(郑贤娴),请您在阅读本文时尊重作者版权. 摘要: SQL Server,为了反应数据的更新,需要维护表上的索引,因而这些索引会形成碎片.根 ...
【译】SQL Server索引进阶第八篇：唯一索引
原文:[译]SQL Server索引进阶第八篇:唯一索引索引设计是数据库设计中比较重要的一个环节,对数据库的性能其中至关重要的作用,但是索引的设计却又不是那么容易的事情,性能也不是那么轻易就 ...
SQL优化的四个方面，缓存，表结构，索引，SQL语句
一,缓存数据库属于 IO 密集型的应用程序,其主要职责就是数据的管理及存储工作.而我们知道,从内存中读取一个数据库的时间是微秒级别,而从一块普通硬盘上读取一个IO是在毫秒级别,二者相差3个数量级.所 ...
SQL Server索引进阶：第十三级，插入，更新，删除
在第十级到十二级中,我们看了索引的内部结构,以及改变结构造成的影响.在本文中,继续查看Insert,update,delete和merge造成的影响.首先,我们单独看一下这四个命令. 插入INSERT ...
SQL Server索引进阶：第九级，读懂执行计划
原文地址: Stairway to SQL Server Indexes: Level 9,Reading Query Plans 本文是SQL Server索引进阶系列(Stairway to SQ ...
SQL Server索引进阶：第五级，包含列
原文地址: Stairway to SQL Server Indexes: Level 5, Included Columns 本文是SQL Server索引进阶系列(Stairway to SQL ...

随机推荐

.Net Core 获取应用物理路径的常见问题
如果要得到传统的ASP.Net应用程序中的相对路径或虚拟路径对应的服务器物理路径,只需要使用使用Server.MapPath()方法来取得Asp.Net根目录的物理路径. 但是在Asp.Net Cor ...
C#条码生成及打印实例代码
";//条码 ; ; //打印按钮 private void button1_Click(object sender, EventArgs e) { //实例化打印对象 PrintDocum ...
理解 Kubernetes 的亲和性调度
这次给大家介绍下k8s的亲和性调度:nodeSelector.nodeAffinity.podAffinity.Taints以及Tolerations用法. 一般情况下我们部署的 POD 是通过集群自 ...
Beego 学习笔记15：布局页面
页面布局 1> 一个html页面由:head部分,body部分,内部css,内部js,外联css,外联的js这几部分组成.因此,一个布局文件也就需要针对这些进行拆分. 2> ...
selenium 开启开发者工具（F12）
selenium 开启开发者工具(F12) options = webdriver.ChromeOptions(); options.add_argument("--auto-open-de ...
git 从远程克隆代码并实现分支开发，合并分支，上传本地代码到远程
首先确认你已经安装了git 1.克隆远程代码到本地的操作 git clone 地址打开git操作命令行鼠标右键点击复制需要克隆的项目的地址类似下面的ssh 输入命令进行 ...
adb shell get/setprop, setenforce...
adb shell getprop <key> 获取设备参数信息adb shell setprop <key> <value> 设置设备参数信息例子1:>C ...
BLAS快速入门
一.简介 BLAS[Basic Linear Algebra Subprograms,基础线性代数程序集]是一个应用程序接口[API]标准,用于规范发布基础基础线性代数操作的数值库[常用于向量或矩阵计 ...
【前端_js】array.forEach和$.each()及$().each()的用法与区别
1.$.each():方法是jQuery中的方法,用于遍历数组或对象.用法:$.each(array,function(index,value){...}),有两个参数,第一个为待遍历的数组或对象,第 ...
互斥锁的robust属性的介绍和使用
一个具体的场景:在多线程中,当一个线程获得锁之后异常退出后,应该怎么处理? 方案一使用锁的robust特性简单地讲,就是当拥有这个锁的线程挂了后,下一个尝试去获得锁的线程会得到EOWNWERDEA ...

SQL进阶-索引设置&sql优化

SQL进阶-索引设置&sql优化的更多相关文章

随机推荐

热门专题