1、改写in
在SQL语言中,一个查询块可以作为另一个查询块中谓词的一个操作数。因此,SQL查询可以层层嵌套。例如在一个大型分布式数据库系统中,有订单表Order、订单信息表OrderDetail,如果需要两表关联查询:
SELECT CreateUser FROM Order WHERE OrderNo IN ( SELECT OrderNo FROM OrderDetail WHERE Price=0.5)
可替代方案:
SELECT CreateUser FROM Order,OrderDetail WHERE Order.OrderNo=OrderDetail.OrderNo AND Praice=0.5
一个列的标签同时在主查询和where子句中的查询中出现,那么很可能当主查询中的列值改变之后,子查询必须重新查询一次。查询嵌套层次越多,效率越低,因此应当尽量避免子查询。如果子查询不可避免,那么要在子查询中过滤掉尽可能多的行。
2 、改写LIKE
在SQL语句中,LIKE关键字支持通配符匹配,但这种匹配特别耗费时间。
例如:SELECT * FROM Order WHERE CreateUser LIKE ‘M_ _ _’ 。即使在CreateUser字段上建立了索引,在这种情况下也还是采用顺序扫描的方式,Order表中有1000条记录,就需要比较1000次。
如果把语句改为SELECT * FROM Order WHERE CreateUser>= ’M’ AND CreateUser<’N’,在执行查询时就会利用索引来查询,显然会大大提高速度。
3、改写OR或<>
我们在编写sql时,通常都会按照程序逻辑去写,此时,当我们遇到如下场景: 我要查询企业员工表(employee)中的员工状态为实习(type=’01’)或者兼职的所有员工(type=’08’),假设状态共有10种 此时,我们立马会写如下Sql:
Select * from employee A whereA.type=’01’ or A.type=’08’
我们假设,在type列上存在索引。而此Sql含有or运算,对于优化器来说,因为无法运用到一个范围,所以无法利用索引扫描。而通常此种情况需要遍历所有记录或者所有索引。这样会明显提高查询cost。我们希望是通过索引的方式,毕竟该表是个大表,如果出现大表扫描,多系统性能有很大的影响。那么可以采取用UNION改写OR子句,如下:
Select * from employee A whereA.type=’01’ union Select * from employee A whereA.type=’02
改写成上述sql,优化器会分别执行两个查询子集,然后union合并。这样就可以利用到索引(type=‘01’)。当然Union包含去除重复元素的功能,即相当于distinct,这样就会有排序存在,如果业务场景允许,可以考虑使用union all,它和union不同的是,它无需排序去重,只需要两个子集合并即刻。效率要高于union。原则是: 当存在大表链接且连接条件较多,并且连接条件包含Or子句时,建议使用Union/Union all来替换。 对于不等与来说也是类似,不等于在逻辑上其实是类似于 Not 的概念。
如,对如下sql:
Sql_stmt_2: Select * from employee where type !=’01’ 所以我们可以有如下改写方式:
1) 将<>改写为Not in操作,即 Select * from employee where type not in (‘01’)
2) 将<>改写为大于和小于的结合 Select * from employee where type >’01’ union Select * from employee where type <’01’(当然如果你知道一个大于已经足够,那么完全可以省略掉小于的操作,这就是分析sql的业务场景)
显然,对于1)的改法,它适用与Not in 子集中有多个值的情况;对于2)改法,要要由于1),因为它可以利用到Type列上的索引。 原则是: 当存在大表链接且连接条件较多,并且连接条件包含不等于(<>||!=)子句时,建议使用Union/Union all 联合大于小于操作来替换。
4 合理使用Notin和NotExists
虽然Notin和Notexits可以实现相同的功能,但是两者本身的实现方式不同: NotIn:是自内向外操作,即先得到子查询结果,然后执行外层查询。Notin子句的执行顺序是:首先取外部一个查询结果与内部子集比较,不管是否存在,它都要遍历整个子集,往往无法利用到索引,因而是由内向外过程。所以,当内部查询子集很大时,就会具有较高的查询代价。 NotExists:恰恰相反,是外向内操作。即先执行外部查询结果,然后再执行内部操作,是集合操作。Notexists子句的执行顺序是:首先取外部一个查询结果与内部子集比较,若存在即刻返回,而不需要遍历整个子集,如果存在索引,就会使用索引,因而是个自外而内的过程。所以,当内部子集很大时,相对来说,性能要优于Notin。 因而,总的来说,Notexits在整体性能上要由于Notin。原则: 当子查询结果集较大时,Notexists较Notin具有较高的性能提升; 当子查询结果集较小时(个数或者百数以内),两者相差不多,一般来说,此时Notin会优于Notexists。就好像表数据小时,全表扫描总是要由于索引扫描;当子查询具有一定的复杂度时(即sql关联关系较多,如子查询句中包含多个表查询),由于内部查询的复杂度,会导致Notexists查询具有较大的复杂度,降低性能。此时可以考虑采用Notin。 IN与Exists两者相差不多,这里不做比较,思路相同。
5 避免使用distinct
使用distinct是为了保证在结果集中不出现重复值,但是distinct会产生一张工作表,并进行排序来删除重复记录,这会大大增加查询和I/O的操作次数。因此应当避免使用distinct关键字。
6 表连接
表连接有两个要点:
1)表连接顺序 2)连接条件
Sql_stmt_1: Select * from A left join B on A.id=B.id join C on B.id = C.C_id where A.con=’ ’ and B.con=’ ’
一般情况下,DB2会根据各表的JOIN顺序自顶向下处理,即从Sql来看,就是自左向右解析,先A、B做连接操作,之后会产生结果集,将会写入内存,如果内存不够,会写入临时表空间,之后会用结果集和C做连接操作。如果sql中只有两表连接,那么其前后顺序没什么关系,优化器会自己去评估。而如果sql中存在超过2个表连接时,那么表连接就会有顺序之分。
那么,原则是: 如果sql中存在表A、B、C三表连接,则首先应保证最先连接的两表具有较小的子集。 在进行表连接时,需要提供连接字段(即On语法后的等价谓词,on A.id=B.id)。此时,我们需要保证,连接字段存在索引。这样当结果集小时,会走NestJoin(速度快,因为会利用到索引),当结果集大时,会走Hash join。此外,在对A、B表进行连接时,优化器需要判断采用何种连接类型,这时会先执行where 字句后的条件。也就是说,如果where字句能过滤很多的条件,那么表连接的结果集就会很小,cost自然会降低,所以适当为where字句的查询字段建立索引,能够得到更好的性能。原则: 在进行表连接时,为连接字段和查询过滤字段(where 字句后的条件)建立索引,会得到很好的性能提升。
表连接时连接字段只有一个会更好。
- 智能SQL优化工具--SQL Optimizer for SQL Server(帮助提升数据库应用程序性能,最大程度地自动优化你的SQL语句 )
SQL Optimizer for SQL Server 帮助提升数据库应用程序性能,最大程度地自动优化你的SQL语句 SQL Optimizer for SQL Server 让 SQL Serve ...
- MySql数据库3【优化2】sql语句的优化
1.SELECT语句优化 1).利用LIMIT 1取得唯一行[控制结果集的行数] 有时,当你要查询一张表是,你知道自己只需要看一行.你可能会去的一条十分独特的记录,或者只是刚好检查了任何存在的记录数, ...
- Mysql性能优化一:SQL语句性能优化
这里总结了52条对sql的查询优化,下面详细来看看,希望能帮助到你 1, 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2,应尽量避免在 w ...
- MySQL数据库优化技术之SQL语句慢查询定位
通过show status命令了解各种SQL的执行频率 MySQL客户端连接成功后,通过使用show [session|global] status 命令可以提供服务器状态信息: 其中的session ...
- mysql优化:explain分析sql语句执行效率
Explain命令在解决数据库性能上是第一推荐使用命令,大部分的性能问题可以通过此命令来简单的解决,Explain可以用来查看SQL语句的执行效 果,可以帮助选择更好的索引和优化查询语句,写出更好的优 ...
- 优化子查询sql语句为内连接
背景: 希望提高查询的效率,从sql语句中频繁出现的子查询入手. 数据表如下:Student表中的CityCode对应于City表中的Code. Student表: ...
- mysql优化–explain分析sql语句执行效率
Explain命令在解决数据库性能上是第一推荐使用命令,大部分的性能问题可以通过此命令来简单的解决,Explain可以用来查看SQL语句的执行效 果,可以帮助选择更好的索引和优化查询语句,写出更好的优 ...
- mysql 优化(包含sql语句的书写)
http://blog.chinaunix.net/uid-11640640-id-3426908.html mysql性能优化-慢查询分析.优化索引和配置 2012-11-30 15:18:42 ...
- Mysql查看优化后的SQL 语句
EXPLAIN EXTENDED 1先执行 EXPLAIN EXTENDED 2 show warnings: EXPLAIN EXTENDED SELECT * FROM `receivable ...
- ORA-03113: end-of-file on communication channel (通信通道的文件结尾)
今天有现场反应:数据库连不上了,提示什么归档日志有问题:又问了现场有做过什么特别操作,答曰没有,出问题后,只是重启了操作系统. 现场环境oracle11.0.2.3. 于是远程查看数据库状态,发现数据 ...
- MySQL源码学习——DBUG调试
一.前言 在规模稍微大点的项目中,为了方便快速找到bug的所在,我们往往需要在代码中加入一些调试用的代码,比如加入一些printf,打印出一些重点的信息:加入assert,进行断言判断.这些比较随意的 ...
- poj1151 Atlantis——扫描线+线段树
题目:http://poj.org/problem?id=1151 经典的扫描线问题: 可以用线段树的每个点代表横向被矩形上下边分割开的每一格,这样将一个矩形的出现或消失化为线段树上的单点修改: 每个 ...
- Microsoft Speech SDK开发包 使用
下载开发包.我们首先从微软的官网上面下载开发包,下载地址如下: http://www.microsoft.com/en-us/download/details.aspx?id=10121我们主要下载三 ...
- spark运行模式之二:Spark的Standalone模式安装部署
Spark运行模式 Spark 有很多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则运行在集群中,目前能很好的运行在 Yarn和 Mesos 中,当然 Spark 还有自带的 Stan ...
- 文本编辑器[notepad++] :一些快捷键
资源来自网络收集. Ctrl+C 复制 Ctrl+X 剪切 Ctrl+V 粘贴 Ctrl+Z 撤消 Ctrl+Y 恢复 Ctrl+A 全选 Ctrl+F 键查找对话框启动 Ctrl+H 查找/替换对话 ...
- codeforces#536题解
CodeForces#536 A. Lunar New Year and Cross Counting Description: Lunar New Year is approaching, and ...
- 【Hive】Hive笔记:Hive调优总结——数据倾斜,join表连接优化
数据倾斜即为数据在节点上分布不均,是常见的优化过程中常见的需要解决的问题.常见的Hive调优的方法:列剪裁.Map Join操作. Group By操作.合并小文件. 一.表现 1.任务进度长度为99 ...
- Flutter实战视频-移动电商-11.首页_屏幕适配方案讲解
11.首页_屏幕适配方案讲解 国人写的屏幕适配插件: https://github.com/OpenFlutter/flutter_screenutil 最新版本是0.5.1 在pubspec.yam ...
- MySQL(12)---纪录一次left join一对多关系而引起的BUG
MySQL(11)---纪录一次left join一对多关系而引起的bug BUG背景 我们有一个订单表 和 一个 物流表 它们通过 订单ID 进行一对一的关系绑定.但是由于物流表在保存订单信息的时候 ...