数据库查询SQL语句的时候如何写会效率更高?

引言

以前刚开始做项目的时候，开发经验尚浅，遇到问题需求只要把结果查询出来就行,至于查询的效率可能就没有太多考虑,数据少的时候还好,数据一多,效率问题就显现出来了。每次遇到查询比较慢时，项目经理就会问：是不是又用select * 了？查询条件有没有加索引？一语惊醒梦中人，赶紧检查..果然如此！

有时我们写sql语句时，没有考虑它的性能或者完全没有优化意识，虽然能暂时满足基本功能，等到数据量大时，后果可想而知。

下面我们就聊一聊sql优化的一些常见方法：

1、sql语句模型结构优化指导

A. ORDER BY + LIMIT组合的索引优化

   SELECT [column1],[column2],…. FROM [TABLE] ORDER BY [sort] LIMIT [offset],[LIMIT]; sort上简索引

  B. WHERE + ORDER BY + LIMIT组合的索引优化

   SELECT [column1],[column2],…. FROM [TABLE] WHERE [columnX] = [VALUE] ORDER BY [sort] LIMIT [offset],[LIMIT];

   建立一个联合索引(columnX,sort)

  C. WHERE+ORDER BY多个栏位+LIMIT

   SELECT * FROM [table] WHERE uid=1 ORDER BY x,y LIMIT 0,10;  建立复合索引(uid,x,y)

2、复合索引(形如(x,y,uid)索引的索引)

  select* from users where area =’beijing’ and age=22;

  建立索引（area,age,salary）,其相当于创建了（area,age,salary）,(area,age),(area)三个索引，这样称为最佳左前缀特性。

3、like语句优化

  SELECT id FROM A WHERE name like '%abc%'

  由于abc前面用了“%”，因此该查询必然走全表查询，除非必要，否则不要在关键词前加%,优化成如下

  SELECT id FROM A WHERE name like 'abc%'

4、where子句使用！= 或 <> 操作符优化

  在where子句中使用 ！= 或 <>操作符，索引将被放弃使用，会进行全表查询。

  如SQL:SELECT id FROM A WHERE ID != 5

  优化成：SELECT id FROM A WHERE ID>5 OR ID<5

5、尽量避免在 where 子句中对字段进行 null 值判断(IS NULL 或 IS NOT NULL)，因为空判断将导致全表扫描，而不是索引扫描。对于空判断这种情况，可以考虑对这个列创建数据库默认值。

   在where子句中使用 IS NULL 或 IS NOT NULL 判断，索引将被放弃使用，会进行全表查询。

   如SQL:SELECT id FROM A WHERE num IS NULL 优化成num上设置默认值0，确保表中num没有null值，

   然后SQL为：SELECT id FROM A WHERE num=0

6、where子句使用or的优化

   很多时候使用union all 或 nuin(必要的时候)的方式替换“or”会得到更好的效果。where子句中使用了or,索引将被放弃使用。

   如SQL:SELECT id FROM A WHERE num =10 or num = 20

   优化成：SELECT id FROM A WHERE num = 10 union all SELECT id FROM A WHERE num=20

7、where子句使用IN 或 NOT IN的优化

  in和not in 也要慎用，否则也会导致全表扫描。

  方案一：between替换in

     如SQL:SELECT id FROM A WHERE num in(1,2,3)

     优化成：SELECT id FROM A WHERE num between 1 and 3

  方案二：exist替换in

    如SQL:SELECT id FROM A WHERE num in(select num from b )

    优化成：SELECT id FROM A WHERE num exists(select 1 from B where B.num = A.num)

  方案三：left join替换in

    如SQL:SELECT id FROM A WHERE num in(select num from B)

    优化成：SELECT id FROM A LEFT JOIN B ON A.num = B.num

8、where子句中对字段进行表达式操作的优化

   不要在where子句中的“=”左边进行函数、算数运算或其他表达式运算，否则系统将可能无法正确使用索引。

   A:如SQL:SELECT id FROM A WHERE num/2 = 100

     优化成：SELECT id FROM A WHERE num = 100*2

   B:如SQL:SELECT id FROM A WHERE year(addate) <2016

     优化成：SELECT id FROM A where addate<'2016-01-01'

9、任何地方都不要用SELECT *

select * from table ，用具体的字段列表替换"*"，不要返回用不到的字段

10、使用“临时表”暂存中间结果

采用临时表暂存中间结果好处：

　　　　　　（1）避免程序中多次扫描主表，减少程序执行“共享锁”阻塞“更新锁”，减少了阻塞，提高了并发性能。

　　　　　　（2）尽量使用表变量来代替临时表。如果表变量包含大量数据，请注意索引非常有限（只有主键索引）。

　　　　　　（3）避免频繁创建和删除临时表，以减少系统资源的浪费。

　　　　　　（4）尽量避免向客户端返回大数据量，若数据量过大，应考虑相应需求是否合理。

11、limit分页优化

总数据有500万左右，以下例子
select * from wl_tagindex where byname='f' order by id limit 300000,10; 行时间是 3.21s
优化后：
select * from (
select id from wl_tagindex
　 where byname='f' order by id limit 300000,10
　 ) a
left join wl_tagindex b on a.id=b.id
执行时间为 0.11s 速度明显提升。
这里需要说明的是这里用到的字段是 byname ,id 需要把这两个字段做复合索引，否则的话效果提升不明显。

12、批量插入优化

INSERT into person(name,age) values('A',14);
　 INSERT into person(name,age) values('B',15);
　 INSERT into person(name,age) values('C',16);
优化为：INSERT into person(name,age) values('A',14),('B',15),('C',16);

13、利用limit 1 、top 1 取得一行

有时要查询一张表时，你知道只需要看一条记录，你可能去查询一条特殊的记录。可以使用limit 1 或者 top 1 来终止数据库索引继续扫描整个表或索引。
如SQL：SELECT id FROM A LIKE 'abc%'
优化为：SELECT id FROM A LIKE 'abc%' limit 1

14、尽量不要使用 BY RAND()命令

BY RAND()是随机显示结果，这个函数可能会为表中每一个独立的行执行BY RAND()命令，这个会消耗处理器的处理能力。

15、排序的索引问题

Mysql查询只是用一个索引，因此如果where子句中已经使用了索引的话，那么order by中的列是不会使用索引的。
因此数据库默认排序可以符合要求情况下不要使用排序操作；
尽量不要包含多个列的排序，如果需要最好给这些列创建复合索引。

16、尽量用 union all 替换 union

union和union all的差异主要是前者需要将两个（或者多个）结果集合并后再进行唯一性过滤操作，这就会涉及到排序，增加大量的cpu运算，
加大资源消耗及延迟。所以当我们可以确认不可能出现重复结果集或者不在乎重复结果集的时候，尽量使用union all而不是union

17、Inner join 和 left join、right join、子查询

第一：inner join内连接也叫等值连接是，left/rightjoin是外连接。
SELECT A.id,A.name,B.id,B.name FROM A LEFT JOIN B ON A.id =B.id;
　　　 SELECT A.id,A.name,B.id,B.name FROM A RIGHT JOIN ON B A.id= B.id;
　　　SELECT A.id,A.name,B.id,B.name FROM A INNER JOIN ON A.id =B.id;
经过多方面的证实inner join性能比较快，因为inner join是等值连接，或许返回的行数比较少。但是我们要记得有些语句隐形的用到了等值连接，如：
SELECT A.id,A.name,B.id,B.name FROM A,B WHERE A.id = B.id;
　　推荐：能用inner join连接尽量使用inner join连接

第二：子查询的性能又比外连接性能慢，尽量用外连接来替换子查询。

第三：使用JOIN时候，应该用小的结果驱动大的结果（left join 左边表结果尽量小，如果有条件应该放到左边先处理，right join同理反向），同时尽量把牵涉到多表联合的查询拆分多个query (多个表查询效率低，容易锁表和阻塞)。如：
Select * from A left join B on A.id=B.ref_id where A.id>10;
可以优化为：select * from (select * from A wehre id >10) T1 left join B on T1.id=B.ref_id;

18、exist和 in的使用场景

SELECT * from A WHERE id in (SELECT id from B)
SELECT * from A WHERE id EXISTS(SELECT 1 from B where A.id= B.id)
in是在内存中遍历比较， exist 需要查询数据库，所以当B的数据量比较大时，exists效率优于in.
in()只执行一次，把B表中的所有id字段缓存起来，之后检查A表的id是否与B表中的id相等，如果id相等则将A表的记录加入到结果集中，直到遍历完A表的所有记录。
In 操作的流程原理如同以下代码
　 List resultSet={};
　　　　 Array A=(select * from A);
　　　　 Array B=(select id from B);
　　　　 for(int i=0;i<A.length;i++) {
　　　　　　for(int j=0;j<B.length;j++) {
　　　　　　　　if(A[i].id==B[j].id) {
　　　　　　　　　　resultSet.add(A[i]);
　　　　　　　　　　break;
　　　　　　　　}
　　　　　　}
　　　　}
　　　return resultSet;
可以看出，当B表数据较大时不适合使用in()，因为它会将B表数据全部遍历一次
如：A表有10000条记录，B表有1000000条记录，那么最多有可能遍历10000*1000000次，效率很差。
再如：A表有10000条记录，B表有100条记录，那么最多有可能遍历10000*100次，遍历次数大大减少，效率大大提升。
　结论：in()适合B表比A表数据小的情况

exist()会执行A.length()次，执行过程如同以下代码
List resultSet={};
　　　　 Array A=(select * from A);
　　　　 for(int i=0;i<A.length;i++) {
　　　　　　if(exists(A[i].id) { //执行select 1 from B where B.id=A.id是否有记录返回
　　　　　　　　resultSet.add(A[i]);
　　　　　　}
　　　　}
　　　return resultSet;
当B表比A表数据大时适合使用exists()，因为它没有那么多遍历操作，只需要再执行一次查询就行。
如：A表有10000条记录，B表有1000000条记录，那么exists()会执行10000次去判断A表中的id是否与B表中的id相等。
当B表比A表数据大时适合使用exists()，因为它没有那么多遍历操作，只需要再执行一次查询就行。

　如：A表有10000条记录，B表有1000000条记录，那么exists()会执行10000次去判断A表中的id是否与B表中的id相等。

　如：A表有10000条记录，B表有100000000条记录，那么exists()还是执行10000次，因为它只执行A.length次，可见B表数据越多，越适合exists()发挥效果。

　再如：A表有10000条记录，B表有100条记录，那么exists()还是执行10000次，还不如使用in()遍历10000*100次，因为in()是在内存里遍历比较，而exists()需要查询数据库，

　我们都知道查询数据库所消耗的性能更高，而内存比较很快。

　结论：exists()适合B表比A表数据大的情况

　当A表数据与B表数据一样大时，in与exists效率差不多，可任选一个使用。

19、索引的合理运用

where子句及order by涉及的列尽量建索引，不一定要全部建索引，依业务情形而定。对于多条where子句都用到的列，建议建索引。索引并不是越多越好，

索引固然可以提高相应的select的效率，但同时也降低了insert及update 的效率。

20、先分页再查询

对于多张大数据量（这里几百条就算大了）的表JOIN，要先分页再JOIN，否则逻辑读会很高，性能很差。

21、统计的时候尽量标明列

select count(*) from table；这样不带任何条件的count会引起全表扫描，并且没有任何业务意义，是一定要杜绝的。

可以改为select count(id) from table。

22、列能使用数字型就不要用字符型

尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。

23、列的类型尽量使用可变的varchar

尽可能的使用varchar代替char，因为首先变长字段存储空间小，可以节省存储空间，其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些。

暂时先就这些了,后续有补充的在加上!

数据库查询SQL语句的时候如何写会效率更高?的更多相关文章

mysql(数据库，sql语句，普通查询)
第1章数据库 1.1 数据库概述 l 什么是数据库数据库就是存储数据的仓库,其本质是一个文件系统,数据按照特定的格式将数据存储起来,用户可以对数据库中的数据进行增加,修改,删除及查询操作. l 什 ...
数据库之sql语句汇总20180616
/*******************************************************************************************/ 一.SQL简 ...
数据库-转换sql语句
文章描述:主要说明转换成SQL语句的过程.----必要信息(数据库名,表名,条件)转换成SQL语句一些界面上数据增删改查的操作往往只需要输入一数据库名,表名,加条件就可以进行数据查询了,在这背后是怎 ...
Oracle数据库的sql语句性能优化
在应用系统开发初期,由于开发数据库数据比较少,对于查询sql语句,复杂试图的编写等体会不出sql语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目 ...
《大话数据库》-SQL语句执行时，底层究竟做了什么小动作？
<大话数据库>-SQL语句执行时,底层究竟做了什么小动作? 前言大家好,我是Taoye,试图用玩世不恭过的态度对待生活的Coder. 现如今我们已然进入了大数据时代,无论是业内还是业外的 ...
总结一些关于操作数据库是sql语句还是存储过程问题
总结一些关于操作数据库是sql语句还是存储过程问题程序中,你跟数据的交互,需要向数据库拿数据.更改数据库的数据等,这些操作,本身不是程序完成的,而是程序发命令给数据库去做的,不管是通过sql语句方式 ...
SQL Server 【附】创建"商品管理数据库"、"学生选课数据库"的SQL语句
附:(创建“商品管理数据库”的SQL语句) --建立"商品管理数据库"数据库-- create database 商品管理数据库 on(name='商品管理数据库_m', file ...
查询sql语句所花时间
--1:下面这种是SQL Server中比较简单的查询SQL语句执行时间方法,通过查询前的时间和查询后的时间差来计算的: declare @begin_date datetime declare @e ...
跨服务器查询sql语句样例
若2个数据库在同一台机器上:insert into DataBase_A..Table1(col1,col2,col3----)select col11,col22,col33-- from Data ...

随机推荐

Tomcat 如何部署多个应用
Tomcat 如何部署多个应用 https://blog.csdn.net/tdcqfyl/article/details/51966387
简单的html兼容(参考js和css的常规写法)
参考往常css/js的浏览器选择加载 <!--[if lte IE 8]> <link rel="stylesheet" href="IEBrower. ...
sqlserver2012——游标
游标:一种数据访问机制,允许用户访问单独的数据行而不是对整个行集进行操作.用户可以通过单独处理每一行逐条收集信息并对数据逐行进行操作,这样可以将降低系统开销. 游标主要有以下两部分: 游标结果集:由定 ...
教大家一个看电视局免广告的方法--由UWP想到的
将近一年(10个月)来一直在学习.NET技术,这其中包括C#.WPF.WCF和ASP.NET MVC,目前学习即将结束. 本人在学习WPF的过程中,也了解到有UWP这门技术,UWP技术目前来说主要是应 ...
SAS笔记(4) FIRST.和LAST.临时变量
FIRST.和LAST.临时变量是SAS很有特色的一点,我在R和Python中暂时没有发现类似的功能(也许它们也有这个功能,我不知道而已).考虑这样一种场景:我们有患者就诊的数据,每一条观测对应一个患 ...
es6实现类的多重继承
1.类的多种继承,将多个类的接口“混入”(mix in)另一个类. function mix(...mixins) { class Mix { // 如果不需要拷贝实例属性下面这段代码可以去掉 // ...
Wannafly挑战赛27B（DFS，链表头插法）
#include<bits/stdc++.h>using namespace std;int cnt=0;int flag=0;int to[400007],nex[400007],vis ...
bzoj3876: [Ahoi2014&Jsoi2014]支线剧情（上下界费用流）
传送门一道题让我又要学可行流又要学zkw费用流…… 考虑一下,原题可以转化为一个有向图,每次走一条路径,把每一条边都至少覆盖一次,求最小代价因为一条边每走过一次,就要付出一次代价那不就是费用流了 ...
Jmeter用BeanShell Sampler调用java写的jar包进行MD5加密
[前言] 在工作中,有时候我们请求的参数可能需要加密,比如登录接口中的密码做了加密操作,今天我就给大家介绍一种方法:Jmeter用BeanShell Sampler调用java写的jar包进行MD5加 ...
java8List集合根据对象的属性去重
import static java.util.Comparator.comparingLong; import static java.util.stream.Collectors.collecti ...

数据库查询SQL语句的时候如何写会效率更高?

数据库查询SQL语句的时候如何写会效率更高?的更多相关文章

随机推荐

热门专题