问题描述

因为要设计一个数据库表,进行一个倒序去重的操作。

例如:

id

Name

1

B

2

A

3

A

4

C

5

C

6

B

场景:例如说我们需要得到一个用户的搜索记录,那么肯定不会仅仅根据时间倒序排序给出列表展示,因为这样会出现重复的问题。我们需要去重,并且保证用户对一个搜索记录是按照最后一次搜索操作的时间排序的。

用以上用例去描述,id为添加顺序,Name为查询记录,我们需要Sql查询的结果为BCA。

一开始选择使用了DISTINCT方式。然而实践过程中,DISTINCT方案是行不通的。

原因

我们是不是会认为这个仅仅是需要DISTINCT Name去重加上ORDER BY id DESC 就解决了呢?

SELECT DISTINCT(Name) from table Order by id DESC 

首先,这样做是没有意义的。因为DISTINCT操作会先于Order by 操作,id的列已经不见了,Order by 只能指定显示列名。况且已经进行了DISTINCT去重操作了,Name与id不是唯一对应关系,排序当然也无从谈起了。(这样写在不同的机器上据说表现情况不一样,有些会直接报错,我的没有)

附上一下Mysql语句执行顺序

(7)     SELECT
(8) DISTINCT <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) HAVING <having_condition>
(9) ORDER BY <order_by_condition>
(10) LIMIT <limit_number>
 

那么可不可以先排序出子表,再用DISTINCT去重呢?

SELECT DISTINCT(Name) from (Select * from table Order by id DESC)tb1 
 

实验结果不满足要求,并且结果很奇怪,是一个莫名其妙的顺序(顺序既不是正序,也不是倒序,也不是降序,加了limit结果又会不一样)。

这条语句能否成功的关键点,就在于DINSTINCT的顺序是否与原表的顺序有关。

在查看了很多文章后,我都没有看到对这个知识点的描述。但是最后我翻到了一些其他的东西。

有一位使用Sql server的先生这样写

实事求是的讲,就现在我遇到的情况,如果distinct 不写order by 的话,实际结果集的输出顺序依赖于两个条件。

1、生成的查询计划的顺序(在不同版本的sql server 解释同一个语句的执行计划会有所不同,统计信息不同也会有所不同)

2、数据存储和访问的顺序 (这个要看是否有索引等) 还是需要具体情况,具体分析的。

个人愚见,参考
 

还有一位先生这样写

没有order by子句的所有查询都不保证顺序,即使有聚集索引

因为优化器可能会选择并行处理,或者在多文件情况下不按“期待”顺序扫描数据,所以无法保证数据的顺序。唯一能确保顺序的只有order by。
distinct内置是需要排序然后去重的,但是最终结果可能又会乱掉。另外根据sqlserver排序规则,不同的排序规则也有不同的结果

我还看到了Mysql的使用者也提出过,同样的Mysql,同样的sql语句,得出的查询结果出现了顺序不同的问题。

最后我觉得可以初步得出这个结论:虽然没有得出Mysql究竟是以怎样的算法进行的排序,怎样的算法实现DISTINCT操作(考虑到各版本,各引擎实现方法可能还不同,这个工作量可能非常的大),但是因为出现了无序的情况,就可以说任何没有Order By子句的查询都不能保证顺序,所以这个需求,以DISTINCT语句不能实现。

DISTINCT一般用来:1.去重拿结果。2.统计数目。其他的需求暂时就不要考虑这个了,Group by比较好用,一般效率也不差DISTINCT,甚至会更高。

实现该需求应该用Group by。

 

Select Name from table group by Name order by max(id) desc 

但是这样会出现有一个无法用到id索引的问题,最后没有办法,只能改变表结构去实现了,如果拥有可以不用改变表结构就能实现并且能完全走索引的方法的同学,欢迎指导,我请你喝肥宅快乐水。

Mysql DISTINCT问题的更多相关文章

  1. mysql distinct跟group by性能

    mysql distinct和group by性能   1,测试前的准备 //准备一张测试表 mysql> CREATE TABLE `test_test` ( ->   `id` int ...

  2. mysql distinct、group_concat

    mysql distinct语句用于查询多条不重复记录值(去重.过滤多余的重复记录) distinct同时作用了两个字段或者两个以上的字段,必须得作用了的字段都相同的才被排除.如果想让单个列" ...

  3. mysql distinct field1,field2,field3, .... from table

    mysql distinct field1,field2,field3, .... from table 我们知道 这样的sql可以去掉重复项 (field1的重复项); select distinc ...

  4. mysql DISTINCT语句 语法

    mysql DISTINCT语句 语法 作用:用于返回唯一不同的值. 语法:SELECT DISTINCT 列名称 FROM 表名称.扬州大理石量具 mysql DISTINCT语句 示例 //从表中 ...

  5. mysql distinct

    mysql的DISTINCT的关键字有很多你想不到的用处1.在count 不重复的记录的时候能用到比如SELECT COUNT( DISTINCT id ) FROM tablename;就是计算ta ...

  6. mysql distinct&group by 应用

    在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供 有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的 ...

  7. MYSQL DISTINCT Optimization

    在很多情况下,Distinct和order by的组合需要建立一个内存临时表.  因为distinct关键字可能利用group by,所以了解下mysql如何处理group by有帮助. distin ...

  8. mysql DISTINCT 的实现与优化

    DISTINCT实际上和GROUP BY的操作非常相似,只不过是在GROUP BY之后的每组中只取出一条记录而已.所以,DISTINCT的实现和GROUP BY的实现也基本差不多,没有太大的区别.同样 ...

  9. mysql distinct()用法

    在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所 ...

  10. mysql distinct 用法详解及优化

    本事例实验用表task,结构如下 MySQL> desc task; +-------------+------------+------+-----+-------------------+- ...

随机推荐

  1. halcon保存带有region的图片算子

    显示带区域的图片除了可以用dev_display挨个显示外再截图,还可以通过一个算子来实现这一功能 这个算子是:dump_window_image.(其实就是截图) 这个算子的意思是把WindowHa ...

  2. ES6介绍

    1.ES6简介 ECMAScript 6.0,是 JavaScript 语言下一代标准,发布于 2015 年 6 月.它的目标是使得 JavaScript 语言可以用来编写复杂的大型应用程序,成为企业 ...

  3. C语言结构体排序

    定义学生信息结构体和结构体数组,包括学号.两门百分制成绩和姓名;键盘输入 学生不多于 30 人的信息,以输入成绩为负数或大于 100 作为输入结束;按照学号和平均成绩排序,并输出学生信息 //输入学生 ...

  4. 表单验证实现React-router跳转

    方法一:broserHistory.push handleSubmit(e){ e.preventDefault(); const path = '/demo'; broserHistory.push ...

  5. 【杂题总汇】HDU-6406 Taotao Picks Apples

    [HDU 6406]Taotao Picks Apples 多校赛的时候多写了一行代码就WA了……找了正解对拍,在比赛结束后17分钟AC了

  6. .Net Core爬虫爬取妹子网图片

    现在网上大把的Python的爬虫教程,很少看见有用C#写的,正好新出的.Net Core可以很方便的部署到Linux上,就用妹子图做示范写个小爬虫 在C#下有个很方便的类库 HtmlAgilityPa ...

  7. ubuntu修改IP地址和网关的方法

    一.使用命令设置Ubuntu IP地址 1.修改配置文件blacklist.conf禁用IPV6 sudo vi /etc/modprobe.d/blacklist.conf 表示用vi编辑器(也可以 ...

  8. python__高级 : 类的__getattribute__ 方法

    在类 里面,其实并没有方法这个东西,所有的东西都保存在属性里面,所谓的调用方法其实是类里面的一个同名属性指向了一个函数(方法),返回的是函数的引用,再用   函数()    这种方式就可以调用它 在调 ...

  9. 【word】html转doc的小研究

    html转doc,页眉页脚丢失 html 转 doc,是全屏铺满(缩放级别很高)

  10. php-安装与配置-未完待续2

    一,准备工作 在入门指引中,我们已经知道PHP的3个应用领域,不同的场景,需要安装的东西是不同的.具体如下: 服务器端脚本,在通常情况下,需要三样东西:PHP 自身.一个 web 服务器和一个 web ...