一.MYSQL 中有两种排序方式:
1:通过有序索引顺序扫描直接返回有序数据,这种方式在使用explain 分析查询的时候显示为Using Index ,不需要额外的排序,操作效率较高。
2: 是通过对返回数据进行排序,也就是通常说的filesort 排序,所有不是通过索引直接返回排序结果都叫filesort排序。filesort 并不代表磁盘文件进行排序,而只是说明了进行一个排序操作,至于排序操作是否使用了磁盘文件或临时表等,则取决于mysql 服务器对排序参数的设置和需要排序数据的大小。例如,按照商店store_id 排序返回所有客户记录时,出现了对全表扫描的结果排序:
explain select * from customer order by store_id
Extra : Using filesort
 
又如,只需要获取商店store_id 和顾客email 信息时,对表customer 的扫描就被覆盖索引idx_storeid_email 扫描替代,此时虽然只访问了索引就足够,但是在索引idx_stored_email 上发生了一次排序操作,所以执行计划仍然有 using filesort.
alter table customer add index idx_storeid_email(store_id,email);
 
explain select store_id ,email ,customer_id from customer order by email
extra :Using Index ,Using filesort
 
 
Filesort 是通过相应的排序算法,将取得的数据在sort_buffer_size 系统变量设置的内存排序区中进行排序,如果内存装载不下,它就会将磁盘上的数据进行分区,再对各个数据块进行排序,然后将各个块合并成有序的结果集。sort_buffer_size 设置的排序区是每个线程独占的,所以同一个时刻,mysql 中存在多个sort buffer 排序区.
 
了解了mysql 排序的方式,优化目标就清晰了:尽量减少额外的排序,通过索引直接返回有序数据。where 条件和order by 使用相同的索引,并且order by 的顺序和索引顺序相同,并且order by 的字段都是生序或者都是降序,否则肯定需要额外的排序操作,这样就会出现filesort.
总结,下列SQL 可以使用索引:
select * from tabname order by key_part1,key_part2,......;
select * from tabname where key_part1 order by key_part1 desc ,key_part2 desc;
select * from tabname order by key_part1,key_part2 desc;
 
但是在以下几种情况下则不使用 索引:
 
select * from tabname order by key_part1 desc ,key_part2 asc;
-- order by 的字段混合ASC 和 DESC
select * from tabname where key2=constant order by key1;
-- 用于查询行的关键字与order by 中所使用的不相同
select * from tabname order by key1,key2;
-- 对不同的关键字使用order by :
 
 
二.Filesort 的优化
通过创建合适的索引能够减少filesort 出现,但是在某些情况下,条件限制不能让filesort 消失,那就需要想办法加快 filesort 的操作。对于filesort ,MYSQL 有两种排序算法。
1.两次扫描算法(Two passes):首先根据条件取出排序字段和行指针信息,之后在排序区sort buffert 中排序。如果排序区sort buffer 不够,则在临时表temporary table 中存储排序结果。完成排序后根据行指针回表读取记录。该算法是mysql 4.1 之前采用的算法,需要两次访问数据,第一次获取排序字段和行指针信息,第二次根据行指针获取记录,尤其是第二次读取操作可能导致大量随机 I/O 操作;优点是排序的时候内存呢开销哦较少。
 
2. 一次扫描算法(Single pass):一次行取出满足条件的行的所有字段,然后在排序区sort buffer 中排序后直接输出结果集。排序的时候内存开销比较大,但是排序效率比两次扫描算法要高。
 
MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query 语句取出的字段总大小来判断使用哪种 排序算法。如果 max_length_for_sort_data更大,那么使用第二种优化之后的算法;否则使用第一种算法。
适当加大系统变量max_length_for_sort_data 的值,能够让 mysql 选择更优化的filesort 排序算法。当然,假如 max_length_for_sort_data 设置过大,会造成cpu 利用率过低和磁盘I/ O过高,cpu 和I/O利用平衡就足够了。
 
 
适当加大sort_buffer_size 排序区,尽量让排序在内存中完成,而不是通过创建临时表放在文件中进行;当然也不能无限制加大 sort_buffer_size 排序区,因为sort_buffer_size 参数是每个线程独占的,设置过大,会导致服务器SWAP 严重,要考虑数据库活动连接数和服务器内存的大小来适当设置排序区。
尽量使使用必要的字段,select 具体的字段名称,而不是 select * 选择 所有字段,这样可以减少排序区的使用,提高SQL 性能。
 
三. 优化 Group BY 语句
如果查询包含Group by 但用户想要 避免排序结果的消耗,则可以指定order by null 禁止排序。
explain select payment_date,sum(amount) from payment group by payment_fate
extra : Using temporary;Using filesort
 
explain select payment_date,sum(amount) from payment_date order by null
extra : Using temporary
 
 
 
 
 
 

MYSQL 排序和分组的更多相关文章

  1. MySQL的外键,修改表,基本数据类型,表级别操作,其他(条件,通配符,分页,排序,分组,联合,连表操作)

    MySQL的外键,修改表,基本数据类型,表级别操作,其他(条件,通配符,分页,排序,分组,联合,连表操作): a.创建2张表 create table userinfo(nid int not nul ...

  2. MySql下实现先排序后分组

    最近在工作中遇到一个先排序后分组的需求,发现MySql不同的版本有不同的结果,特此记录. 举例:要求在shop表中查询出各类型商店中价格最高的商品. --表结构-- create table `sho ...

  3. mysql 怎样先排序再分组

    权游游牧族:众所周知!一句SqL语句不能先排序再分组.所以这里给出几个案例 --表结构-- create table `shop` ( `id` int (10) PRIMARY KEY, `shop ...

  4. MySQL进阶5--分组函数 / 分组排序和分组查询 group by(having) /order by

    MySQL进阶--分组排序和分组查询 group by(having) /order by /* 介绍分组函数 功能:用做统计使用,又称为聚合函数或组函数 1.分类: sum, avg 求和 /平均数 ...

  5. MySQL最常用分组聚合函数

    一.聚合函数(aggregation function)---也就是组函数 在一个行的集合(一组行)上进行操作,对每个组给一个结果. 常用的组函数: AVG([distinct] expr) 求平均值 ...

  6. ElasticSearch6.0 Java API 使用 排序,分组 ,创建索引,添加索引数据,打分等(一)

    ElasticSearch6.0  Java API  使用     排序,分组 ,创建索引,添加索引数据,打分等 如果此文章对你有帮助,请关注一下哦 1.1 搭建maven 工程  创建web工程 ...

  7. sql中实现先排序后分组

    数据表结构和数据如下: CREATE TABLE `commun_message_chat_single` ( `id` ) NOT NULL AUTO_INCREMENT, `chat_id` ) ...

  8. DQL语句排序与分组

    DQL语句排序与分组 一.DQL-排序 排序是计算机内经常进行的一种操作,其目的是将一组"无序"的记录序列调整为"有序"的记录序列.分内部排序和外部排序,若整个 ...

  9. Hadoop学习笔记—11.MapReduce中的排序和分组

    一.写在之前的 1.1 回顾Map阶段四大步骤 首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...

随机推荐

  1. 关于Git我们不得不知道的事(一)

    一.什么是Git? Git是目前世界上最先进的分布式版本控制系统(没有之一). Git可以协助我们很方便的管理我们的项目,我们随时可以找回(或者回到)我们之前任何一个时刻的项目:还可以让同事或者开发小 ...

  2. Centos7.x & RedHat7.x系统忘记 root 密码解决办法

    重启系统进入引导页面 先将机器重启 根据提示按下e进入内核编辑页面 找到linux16参数行,并在行尾加上rd.break,之后按下Ctrl+X重启 如上图所示,重启之后将进入救援模式. 这是依次输入 ...

  3. centos7.3下安装nginx

    Nginx简介 Nginx是一款轻量级的Web服务器/反向代理服务器/电子邮件(IMAP/POP3)代理服务器,在BSD-like 协议下发行.其特点是占有内存少,并发能力强, Nginx的并发能力在 ...

  4. java 泛型实例详解(普通泛型、 通配符、 泛型接口)

    java 泛型详解(普通泛型. 通配符. 泛型接口) 2013-02-04 19:49:49| 分类: JAVA | 标签:java |举报|字号 订阅 下载LOFTER客户端 JDK1.5 令我们期 ...

  5. Java 理论与实践: 流行的原子

    Java 理论与实践: 流行的原子 新原子类是 java.util.concurrent 的隐藏精华 在 JDK 5.0 之前,如果不使用本机代码,就不能用 Java 语言编写无等待.无锁定的算法.在 ...

  6. 小程序以及H5页面上IphoneX底部安全区域小黑条适配问题

    背景 公司项目开发中,发现iPhoneX上吸底元素存在被小黑条遮挡的问题 原因 在苹果 iPhoneX .iPhone XR等机型上,物理Home键被取消,改为底部小黑条替代home键功能,从而导致吸 ...

  7. 数据表记录包含表索引和数值(int范围的整数),请对表索引相同的记录进行合并,即将相同索引的数值进行求和运算,输出按照key值升序进行输出

    此题如果直接使用有序的TreeMap就不需要这样折腾: 1.map的key值唯一性,故就不在需要set集合来去重 2.使用map后利用key的唯一性,把序列号相同的数据直接加在一起,代码会很简洁 pa ...

  8. JDK安装详细步骤

    JDK的下载与安装 在java实际编程的道路上,迈出的第一步必定是JDK的安装,因为JDK是一切java的基础,这里给出在Windows10 x64版本下的JDK1.8的详细安装步骤,其他的Windo ...

  9. termux上安装lxml失败

    想试试在手机上随时可以接收到各个平台上最新的消息,于是打算在qpython上写个python的爬虫,安装bs4后,在安装lxml时出现了问题. qpython失败后,改用termux试一下,结果出现了 ...

  10. AJ学IOS(32)UI之Quartz2D矩阵操作和图片剪切

    AJ分享,必须精品 矩阵操作 矩阵操作:(旋转,缩放,平移) 通过矩阵操作,把画出来的东西进行形变 旋转操作 方法:CGContextRotateCTM(<#CGContextRef c#> ...