MySQL 中的数据排序实现

在 MySQL 中,数据排序是通过 ORDER BY 子句实现的,主要涉及 文件排序索引排序 两种方式。


1. 排序的基本原理

MySQL 的排序实现分为以下两种情况:

  • 文件排序(File Sorting):当排序无法利用索引优化时,MySQL 会通过排序算法和临时表完成。
  • 索引排序(Index Sorting):如果排序字段有索引,MySQL 可以直接利用索引的有序性完成排序,无需额外操作。

2. 文件排序

文件排序的过程

ORDER BY 子句为例:

SELECT * FROM users ORDER BY age DESC;

其工作流程如下:

  1. 提取排序字段

    • 提取查询所需的列和 ORDER BY 中的排序字段。
  2. 排序操作
    • 根据排序字段对数据进行排序,可能需要内存排序或磁盘排序。
  3. 返回排序结果
    • 排序完成后,将排序结果返回给客户端。

排序算法

  • 双路排序(Two-Pass Sorting)

    • 提取排序列和主键到临时区域,对这些数据排序后,再通过主键回表查询其他列。
  • 单路排序(Single-Pass Sorting)(MySQL 8.0 优化):
    • 直接提取所有需要的列,一次完成排序,避免二次回表。

排序缓冲

  • MySQL 优先在内存中完成排序,通过 sort_buffer_size 参数配置排序缓冲区大小。
  • 当数据量超过内存限制时,MySQL 会写入磁盘进行排序,性能较低。

3. 索引排序

MySQL 可以利用 B+ 树索引的有序性完成排序,从而避免文件排序。例如:

SELECT * FROM users ORDER BY id ASC;

索引排序的条件

  1. 排序列有索引:索引必须覆盖 ORDER BY 指定的排序字段。

  2. 复合索引顺序匹配

    • 如果是多列排序,索引的列顺序需与 ORDER BY 的顺序一致。
    SELECT * FROM users ORDER BY age, name;

    如果存在 (age, name) 索引,MySQL 可直接利用该索引排序。

  3. 排序方向一致

    • ORDER BY 中包含不同方向的排序(如 ORDER BY age ASC, name DESC),MySQL 无法直接利用索引。

覆盖索引

当查询仅涉及索引列时,MySQL 可直接利用覆盖索引返回结果,无需访问表。


4. 内存与磁盘排序

MySQL 的排序优先使用内存,当数据量过大时,才会使用磁盘:

  • 内存排序:在 sort_buffer_size 限定的范围内,所有数据均在内存中排序。
  • 磁盘排序:当数据量超过内存限制时,MySQL 会将部分数据写入磁盘临时表进行排序,性能相对较低。

5. 排序性能优化

(1)使用索引优化排序

  • 索引可以显著减少排序开销。
  • 对于多列排序,创建复合索引有助于优化查询性能。

(2)调整 sort_buffer_size

  • 增加 sort_buffer_size 大小,可以减少磁盘排序操作。
SET GLOBAL sort_buffer_size = 2M;

(3)减少排序数据量

  • 使用 LIMIT 限制返回行数,减少需要排序的数据。
SELECT * FROM users ORDER BY age LIMIT 100;

(4)避免不必要的排序操作

  • 避免使用 ORDER BY RAND(),因为它需要对所有数据进行随机排序,性能很差。
  • 避免在排序列上使用函数,如 ORDER BY UPPER(name)

6. 示例对比

文件排序

当无法使用索引时:

SELECT * FROM users WHERE age > 20 ORDER BY name;

MySQL 会提取满足条件的记录,并通过排序算法在内存或磁盘中完成排序。

索引排序

当排序列有索引时:

SELECT * FROM users WHERE age > 20 ORDER BY age;

MySQL 可以直接利用 age 列上的索引完成排序,无需额外操作。


7. 总结

  1. 文件排序:当没有合适的索引时,MySQL 使用文件排序对数据进行排序,可能涉及内存或磁盘操作。
  2. 索引排序:当排序列有索引时,MySQL 可直接利用索引的有序性完成排序。
  3. 优化建议
    • 合理设计索引结构,避免不必要的排序操作。
    • 调整排序缓冲区大小,减少磁盘排序的可能性。
    • 限制返回行数,减少排序数据量。

MySQL 中的数据排序是怎么实现的?的更多相关文章

  1. 辛星浅谈mysql中的数据碎片以及引擎为MyISAM下的操作

    对于mysql中的数据碎片,事实上和我们删除数据是息息相关的,删除数据的时候必定会在数据文件里造成不连续的空白空间,对于少量的数据的删除,并不会产生多少的空白空间.假设在一段时间内的大量的删除操作,会 ...

  2. Vusual C++连接Mysql和从MySql中取出数据的API介绍

    .1 mysql_real_connect() 2.1.1 函数原型: MYSQL *mysql_real_connect(MYSQL *mysql, const char *host, const ...

  3. DataSet 中的数据排序 及 DataRow装成DataTable

    1.DataSet 中的数据排序 DataSet ds = new DataSet(); // 获取当前排口的数据 ds = _xiaobill.GetHistoryData(yinZiBianm, ...

  4. 用python批量向数据库(MySQL)中导入数据

    用python批量向数据库(MySQL)中导入数据 现有数十万条数据,如下的经过打乱处理过的数据进行导入 数据库内部的表格的数据格式如下与下面的表格结构相同 Current database: pyt ...

  5. PHP如何批量更新MYSQL中的数据

    最近项目需要用到批量更新数据库里的数据,在网上找了一下这方面的例子,觉得这个还不错,分享给大家. 在这个业务里里面涉及到了更新两张数据表,那么大家是不是会想到非常简单,马上上代码 $sql ,type ...

  6. hadoop项目实战--ETL--(二)实现自动向mysql中添加数据

    四 项目开发 1 创建数据库db_etl,新建两张表user 和oder.表结构如第一部分图所示. 2 编写python脚本,实现自动向mysql中插入数据. 新建python 项目,目录结构如下图 ...

  7. PHP读取mysql中的数据

    <!DOCTYPE HTML> <html> <head> <title> PHP动态读取mysql中的数据 </title> <me ...

  8. PHP批量更新MYSQL中的数据

    原文链接:https://blog.csdn.net/wuming19900801/article/details/62893429 $sql = "update newhouse_clic ...

  9. MySQL_(Java)分页查询MySQL中的数据

    MySQL_(Java)使用JDBC向数据库发起查询请求 传送门 MySQL_(Java)使用JDBC创建用户名和密码校验查询方法 传送门 MySQL_(Java)使用preparestatement ...

  10. 利用Ajax实现数据的同步传输,从mysql中提取数据,通过echarts可视化

    如何将mysql数据库中的方式通过echarts可视化呢,以下面这个简单的例子向大家进行演示:   步骤一:mysql的创表和插入数据,当然这些数据也可以是你通过爬虫抓取的.     步骤二:   创 ...

随机推荐

  1. LeetCode刷题:AddressSanitizer: heap-buffer-overflow问题请教||全局变量和引用传递的区别

    在刷 https://leetcode.cn/problems/sudoku-solver/description/ 遇到AddressSanitizer: heap-buffer-overflow的 ...

  2. datagrip中调用oracle存储过程

    declare mess varchar2(300); begin P_DETAIL_PROC(参数1,...,mess); DBMS_OUTPUT.PUT_LINE(mess); end; P_DE ...

  3. C#从数据库中加载照片的

    从数据库中读取人员照片信息并加载到图片控件的代码 string conn = "Server=192.168.xx.xx;Database=dbName;User ID=sa;passwor ...

  4. 两个半成品的ORM

    只要是有点结构化的思想,不可能项目里一个sqlHelper 满天飞 到处写 ,最终你的c#代码还是得返回一个Class 才好操作,sqlhelper, datatable这种东西也只是临时将就一下,稍 ...

  5. uni-app选中状态并改变颜色

    思路 定义一个数组来记录被点击的元素 arr 数组通过indexOf来来查找 如果有,激活类就是true 没有: 激活类为false 这一步最关键的是查找的内容就是显示出来的index, 点击的时候传 ...

  6. linux配置maven

    1.下载mavenhttps://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/ 中找到相应的版本wget https://mirrors.tun ...

  7. DeepSeek模型技术动态引行业关注,企业生产系统API迁移需审慎评估

    在当今数字化浪潮中,人工智能技术迅猛发展,各类模型如雨后春笋般涌现,而 DeepSeek 模型凭借其独特的优势,在人工智能领域迅速崭露头角,成为备受瞩目的新星. DeepSeek 模型由杭州深度求索人 ...

  8. Word中接入大模型教程

    前言 为什么要在word中接入大模型呢? 个人觉得最大的意义就是不用来回切换与复制粘贴了吧. 今天分享一下昨天实践的在word中接入大模型的教程. 在word中接入大模型最简单的方式就是使用vba. ...

  9. 天线的OTA测试

    有源测试 (即OTA测试) 把使用综测仪的测试叫做有源测试(Active).使用有源测试的测试速度比较无源相对要慢,但是因为手机是一个复杂材料体,往往无源测试对发射性能的模拟是可信的,但是对于接收性能 ...

  10. linux下安装 elasticsearch

    一.基础环境 操作系统环境:Red Hat Enterprise Linux Server release 6.4 (Santiago) ES版本:elasticsearch-7.8.0-linux- ...