一、索引设置

1、索引的设置原则

经常出现在WHERE条件、关联条件中的字段作为索引字段;

在满足查询需求的前提下,应尽可能少的创建索引;(对于一个组合索引,可以满足以组合索引左边的一部分字段的查询需求);

经常更新的字段,不适合创建索引;

区分度太低的字段,不适合创建索引;

不要为永远不会出现在WHERE条件、关联条件中的字段创建索引;

2、案例分析

比如有下面一张表:

查询需求如下:

需求一:按单个客户编号查询某个客户的交易明细。

需求二:按单个客户编号查询某个时间段的某只股票的交易明细。

需求三:统计某个时间段每只股票不同交易类型的交易金额。

需求四:统计每天所有股票的交易金额。

需求五:统计每只股票所有的交易费用。

查询一:SELECT * FROM stock_trans_detail WHERE customer_id = '?';

查询二:SELECT * FROM stock_trans_detail WHERE customer_id = '?' AND trans_date BETWEEN '2020-01-01' AND '2020-12-31' AND stock_code = '?';

查询三:SELECT stock_code,trans_type,sum(price*volume) FROM stock_trans_detail WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31' GROUP BY stock_code,trans_type;

查询四:SELECT trans_date,sum(price*volume) FROM stock_trans_detail GROUP BY trans_date;

查询五:SELECT stock_code,sum(fee) FROM stock_trans_detail GROUP BY stock_code;

索引设置分析:

需求一:按单个客户编号查询某个客户的交易明细。
需求二:按单个客户编号查询某个时间段的某只股票的交易明细。
需求三:统计某个时间段每只股票不同交易类型的交易金额。
需求四:统计每天所有股票的交易金额。
需求五:统计每只股票所有的交易费用。 索引一:customer_id
索引二:customer_id,trans_date,stock_code
索引三:trans_date,stock_code
索引四:无
索引五:无 最终:
索引一:customer_id,trans_date,stock_code
索引二:trans_date,stock_code

二、SQL优化

1、SQL优化的五个层次

主键 –> 唯一索引 –> 非唯一索引 –> 全表扫描(应尽量避免)

2、SQL优化的15条铁律

铁律1:尽量避免在索引列上使用表达式

如:
SELECT * FROM score WHERE score / 100 >= 0.6;
转换为:
SELECT * FROM score WHERE score >= 0.6 * 100; SELECT * FROM score WHERE LEFT(student_id,1) = 'S';
转换为:
SELECT * FROM score WHERE student_id LIKE 'S%';

铁律2:尽量避免在WHERE条件中使用NOT、<>和!=操作符

如:
SELECT * FROM score WHERE score <> 50;
转换为:
SELECT * FROM score WHERE score > 50 OR score < 50;

SELECT * FROM score WHERE score > 50;
UNION ALL
SELECT * FROM score WHERE score < 50;

铁律3:避免索引列的隐式类型转换

如:
SELECT * FROM stock_trans_detail WHERE stock_code = 600001;
转换为:
SELECT * FROM stock_trans_detail WHERE stock_code = '600001';

铁律4:在OR的两个条件上都有索引的话,将OR转换为UNION或UNION ALL

如:
SELECT * FROM score WHERE score = 100 OR gender = '男';
转换为:
SELECT * FROM score WHERE score = 100
UNION
SELECT * FROM score WHERE gender = '男';

铁律5:使用IN操作符替换OR

如:
SELECT * FROM score WHERE score = 100 OR score = 99;
转换为:
SELECT * FROM score WHERE score IN (100,99);

铁律6:使用BETWEEN操作符替换IN

如:
SELECT * FROM score WHERE score IN (100,99,98,97,96,95);
转换为:
SELECT * FROM score WHERE score BETWEEN 95 AND 100;

铁律7:在合适的情况下,使用EXISTS操作符替换IN

如:
SELECT * FROM stock
WHERE stock_code IN (
SELECT stock_code FROM stock_trans_detail
WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'
);
转换为:
SELECT * FROM stock a
WHERE EXISTS (
SELECT 1 FROM stock_trans_detail b
WHERE a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31'
); 子查询结果集较大时,适合用EXISTS;
子查询结果集较小时,适合用IN;

铁律8:LIKE通配符也可能导致索引失效

如:
SELECT * FROM score WHERE subject_name LIKE '%机%';
转换为:
SELECT * FROM score WHERE subject_name LIKE '机%'
UNION ALL
SELECT * FROM score WHERE subject_name LIKE '计算机%';

SELECT * FROM score
WHERE subject_name IN ('机械原理','计算机导论');

铁律9:索引中不包含NULL值,所以使用IS NULL、IS NOT NULL做判断的条件,都用不到索引

解决方法:应该将数据库中的所有字段都设置为不可为NULL,且针对不同的数据类型设置默认值。
比如,对于INT类型的字段,如果为NULL,则设为默认值0。这样就可以将IS NULL的判断,转换为与0相等的判断。 如:
SELECT * FROM score WHERE score IS NULL;
转换为:
SELECT * FROM score WHERE score = 0;

铁律10: INT型字段中,应该使用>=替换>

如:
SELECT * FROM student WHERE age > 15;
转换为:
SELECT * FROM student WHERE age >= 16;

铁律11: 在多个结果集不交叉的情况下,使用UNION ALL替换UNION

如:
SELECT * FROM score WHERE score = 100
UNION
SELECT * FROM score WHERE score = 99;
转换为:
SELECT * FROM score WHERE score = 100
UNION ALL
SELECT * FROM score WHERE score = 99;

铁律12: 优化GROUP BY子句

如:
SELECT trans_date,stock_code,sum(volume)
FROM stock_trans_detail
GROUP BY trans_date,
CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出'
ELSE '' END
HAVING trans_date BETWEEN '2020-01-01' AND '2020-12-31';
转换为:
SELECT trans_date,
CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出'
ELSE '' END, SUM(volume)
FROM stock_trans_detail
WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'
GROUP BY trans_date,trans_type;

铁律13: 使用ORDER BY配合LIMIT分页查询

如:
当LIMIT的偏移量特别大时,效率会非常低
SELECT * FROM score LIMIT 1000,10 效率高
SELECT * FROM score LIMIT 100000,10 效率低
转换为:
SELECT * FROM score ORDER BY student_id LIMIT 100000,10;

铁律14: 避免不合理的DISTINCT

由于DISTINCT去重功能的限制,实际开发过程中使用到DISTINCT的情况很少。如果发现结果集有重复而需要使用DISTINCT去重,
则很可能是因为对业务逻辑理解不足导致的SQL语句的编写问题。 如:
SELECT DISTINCT a.stock_code,a.stock_name
FROM stock a
INNER JOIN stock_trans_detail b
ON a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31‘;
转换为:
SELECT a.stock_code,a.stock_name FROM stock a
WHERE EXISTS (
SELECT 1 FROM stock_trans_detail b
WHERE a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31');

铁律15: 不要把SQL语句写的太冗长

合理使用临时表,而不是想着一个SQL解决所有问题。如果一个SQL关联的表超过5张,就应该考虑拆分。

SQL进阶-索引设置&sql优化的更多相关文章

  1. 「MySQL高级篇」explain分析SQL,索引失效&&常见优化场景

    大家好,我是melo,一名大三后台练习生 专栏回顾 索引的原理&&设计原则 欢迎关注本专栏:MySQL高级篇 本篇速览 在我们上一篇文章中,讲到了索引的原理&&设计原则 ...

  2. 面试题: mysql 数据库已看 sql安全性 索引 引擎 sql优化

    总结的一些MySQL数据库面试题 2016年06月16日 11:41:18 阅读数:4950 一.sql语句应该考虑哪些安全性? (1)防止sql注入,对特殊字符进行转义,过滤或者使用预编译的sql语 ...

  3. SQL Server 索引维护sql语句

    使用以下脚本查看数据库索引碎片的大小情况: 复制代码代码如下: DBCC SHOWCONTIG WITH FAST, TABLERESULTS, ALL_INDEXES, NO_INFOMSGS  以 ...

  4. SQL Server2005索引碎片分析和解决方法

    SQL Server2005索引碎片分析和解决方法 本文作者(郑贤娴),请您在阅读本文时尊重作者版权. 摘要: SQL Server,为了反应数据的更新,需要维护表上的索引,因而这些索引会形成碎片.根 ...

  5. 【译】SQL Server索引进阶第八篇:唯一索引

    原文:[译]SQL Server索引进阶第八篇:唯一索引     索引设计是数据库设计中比较重要的一个环节,对数据库的性能其中至关重要的作用,但是索引的设计却又不是那么容易的事情,性能也不是那么轻易就 ...

  6. SQL优化的四个方面,缓存,表结构,索引,SQL语句

    一,缓存 数据库属于 IO 密集型的应用程序,其主要职责就是数据的管理及存储工作.而我们知道,从内存中读取一个数据库的时间是微秒级别,而从一块普通硬盘上读取一个IO是在毫秒级别,二者相差3个数量级.所 ...

  7. SQL Server索引进阶:第十三级,插入,更新,删除

    在第十级到十二级中,我们看了索引的内部结构,以及改变结构造成的影响.在本文中,继续查看Insert,update,delete和merge造成的影响.首先,我们单独看一下这四个命令. 插入INSERT ...

  8. SQL Server索引进阶:第九级,读懂执行计划

    原文地址: Stairway to SQL Server Indexes: Level 9,Reading Query Plans 本文是SQL Server索引进阶系列(Stairway to SQ ...

  9. SQL Server索引进阶:第五级,包含列

    原文地址: Stairway to SQL Server Indexes: Level 5, Included Columns 本文是SQL Server索引进阶系列(Stairway to SQL ...

随机推荐

  1. Google Guava Cache 全解析

    Google guava工具类的介绍和使用https://blog.csdn.net/wwwdc1012/article/details/82228458 LoadingCache缓存使用(Loadi ...

  2. Django--视图函数

    目录 视图函数 HttpRequest对象 request属性 request常用方法 HttpResponse对象 render() redirect() JsonResponse 视图函数 一个视 ...

  3. 网络编程之模拟ssh远程执行命令、粘包问题 、解决粘包问题

    目录 模拟ssh远程执行命令 服务端 客户端 粘包问题 什么是粘包 TCP发送数据的四种情况 粘包的两种情况 解决粘包问题 struct模块 解决粘包问题 服务端 客户端 模拟ssh远程执行命令 服务 ...

  4. 【转载】 C#中手动创建一个DataTable对象并写入数据

    在C#操作集合数据的过程中,有时候需要手动创建一个DataTable对象,并手动设置DataTable对象的Columns列名等信息,最后再往手动创建的DataTable对象中写入相应的数据信息,此时 ...

  5. QCache 缓存(类似于map的模板类,逻辑意义上的缓存Cache,方便管理,默认类似于LRU的淘汰算法)

    最近在学习缓存方面的知识,了解了缓存(Cache)的基本概念,为什么要使用缓存,以及一些缓存算法(缓存替换),如LRU.LFU.ARC等等. 这些缓存算法的实现过程会使用一些基本的数据结构,如list ...

  6. 【案例】如何让阀门制造提高排产效率?APS系统帮你实现

    随着公司业务发展,苏州纽威阀门公司将承接来自各个国家的更多产品业务,越来越多的客户要求对产品进行精确的交期预估和管理.而目前对产线的产能管理仅限于人工静态产能计算. 由于产品繁多,生产流程各异,不同产 ...

  7. Ajax跨域问题及解决方案 asp.net core 系列之允许跨越访问(Enable Cross-Origin Requests:CORS) c#中的Cache缓存技术 C#中的Cookie C#串口扫描枪的简单实现 c#Socket服务器与客户端的开发(2)

    Ajax跨域问题及解决方案   目录 复现Ajax跨域问题 Ajax跨域介绍 Ajax跨域解决方案 一. 在服务端添加响应头Access-Control-Allow-Origin 二. 使用JSONP ...

  8. Nginx 配置及参数详解

    Nginx 配置及参数详解 Nginx Location 指令语法 如下就是常用的 location 配置的语法格式,其中modifier是可选的,location_match就是制定 URI 应该去 ...

  9. 分享一个批量修改文件编码的python脚本

    分享一个自己编写的递归查找子目录,将所有cpp文件编码修改为utf-8编码格式的小脚本 #i!/usr/bin/env python3 # -*- coding:utf-8 -*- import os ...

  10. 《TensorFlow2深度学习》学习笔记(一)Tensorflow基础

    本系列笔记记录了学习TensorFlow2的过程,主要依据 https://github.com/dragen1860/Deep-Learning-with-TensorFlow-book 进行学习 ...