总结distinct、group by 、row_number()over函数用法及区别
distinct和group by 是一样的,查询去重,只能是全部重复的,也可以理解为针对单例,因为一行有一个字段不一样,他们就会认为这两行内容是不重复的。但是使用row_number()over这个函数就可以针对全部字段,完全重复还是部分重复都可以通过这个函数查找出来,因为它自身有分组的功能。以下就是具体代码:
- 上面那个表就是在最后两行时候ID,NAME,BIRTHDAY三个字段值重复,AGE字段值不一样。
- SELECT DISTINCT ID,NAME,BIRTHDAY FROM B查询结果就是:
- 但是语句上加上AGE字段,SELECT DISTINCT ID,NAME,BIRTHDAY,AGE FROM B 结果就不一样了:
- 会发现DISTINCT函数没有起作用,GROUP BY 函数和DISTINCT一样的,只是使用GROUP BY函数时候这样写就不会错:
- SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID,NAME,AGE,BIRTHDAY;
- 换一种写法:SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID;就会报错,意思就是SELECT后面的跟几个字段,GROUP BY 后面也要跟几个字段,要不然就会报错。
说一说ROW_NUMBER()OVER这个函数:
删除一张表中重复数据,当你不知道那一个字段重复,或者你知道那一个字段重复,还有就是根据你的业务需求在用这个函数时候,因为这个函数在一定比较上还是有点麻烦,能不用就不用,但是呢这个函数内部有一个分组排序功能,也算是一种优化,像DISTINCT,不能随便用,成本高,效率低下,其实可以用group by 进行优化,其他的优化待续.......
ROW_NUMBER()OVER
- DELETE FROM (SELECT ID,ROW_NUMBER()OVER(PARTITION BY ID ORDER BY NAME)ROW_NUM FROM B)WHERE ROW_NUM>1;--这是删除表中全部重复部分重复的字段,根据业务需求。在你知道具体字段值重复时候直接delete from tablename where条件就可以删除。
使用ROW_NUMBER()OVER函数查询时候去重怎么操作:
- select * from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank =1;
原来的表数据是这样的:
执行上面代码后结果是这样的:
使用row_number()over函数进行删除部分或者全部重复数据的代码是这样的:
- delete from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank >1;
执行之前数据是这样的:
执行删除代码之后就是这样的:
* 会这一个基本就行了,删除全部重复,部分重复,查询全部重复,查询部分重复均可用这一个。
其实个人对这个函数理解是:在查询时候,进行partition by 分组,order by 排序,然后把查询出来的结果集取个别名,可以把它当成一张表进行条件查询,别名rank就是分组之后那一列列名,新生的表包含rank这一个列,此时,就可以对这张分组排序好的表进行查询,最后查出来的结果就是去重的,无论全部重复或者部分重复均可使用。删除语句的道理和这个查询一模一样。
总结distinct、group by 、row_number()over函数用法及区别的更多相关文章
- ROW_NUMBER() OVER()函数用法;(分组,排序),partition by
转载:https://www.cnblogs.com/alsf/p/6344197.html 1.row_number() over()排序功能: (1) row_number() over()分组排 ...
- ROW_NUMBER() OVER()函数用法;(分组,排序),partition by (转)
1.row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排 ...
- DB2中的ROW_NUMBER() OVER()函数用法
ROW_NUMBER() OVER()大概有俩方面的作用 1,分页, 并返回分页结果集.2,是对数据进行处理 分组 db2的分页: select tmp.* from ( SELECT rownu ...
- iOS中block的用法 以及和函数用法的区别
ios中block的用法和函数的用法大致相同 但是block的用法的灵活性更高: 不带参数的block: void ^(MyBlock)() = ^{}; 调用的时候 MyBlock(); 带参数的 ...
- ruby gsub gsub! chomp chomp! 以及所有类似函数用法及区别
ruby中带“!"和不带"!"的方法的最大的区别就是带”!"的会改变调用对象本身了.比方说str.gsub(/a/, 'b'),不会改变str本身,只会返回一个 ...
- C++虚函数与纯虚函数用法与区别(转载)
1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...
- C++虚函数与纯虚函数用法与区别
1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...
- Hive中笔记 :三种去重方法,distinct,group by与ROW_Number()窗口函数
一.distinct,group by与ROW_Number()窗口函数使用方法 1. Distinct用法:对select 后面所有字段去重,并不能只对一列去重. (1)当distinct应用到多个 ...
- ROW_NUMBER() OVER函数的基本用法用法
ROW_NUMBER() OVER函数的基本用法用法 转自:http://www.cnblogs.com/icebutterfly/archive/2009/08/05/1539657.html 语法 ...
随机推荐
- RHSA-2018:1700-重要: procps-ng 安全更新(存在EXP、本地提权)
[root@localhost ~]# cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core) 修复命令: 使用root账号登陆She ...
- 多路复用select和epoll的区别(转)
先说下本文框架,先是问题引出,然后概括两个机制的区别和联系,最后介绍每个接口的用法 一.问题引出 联系区别 问题的引出,当需要读两个以上的I/O的时候,如果使用阻塞式的I/O,那么可能长时间的阻塞在一 ...
- C#实现迭代器
迭代器模式(Iterator),提供一种方法顺序访问一个聚合对象中的各种元素,而又不暴露该对象的内部表示.C#中使用IEnumerator接口实现,Java中使用Iterator接口实现,其中原理都差 ...
- python 不定长参数
1 #不定长参数 * 元祖 ** 字典 2 def item(a,b,*c,**d): 3 print(a) 4 print(b) 5 print(c) 6 print(d) 7 8 item(11, ...
- selenium常用操作学习笔记
一,弹窗处理(推荐文章:https://blog.csdn.net/huilan_same/article/details/52298460) selenium提供switch_to方法定位弹窗的对话 ...
- centos8平台使用pstree查看进程树
一,pstree用途 Linux pstree命令将所有行程以树状图显示,树状图将会以 pid (如果有指定) 或是以 systemd 这个基本行程为根 (root) 说明:centos6及更旧版本为 ...
- jdk、eclipse和idea安装
一.jdk下载与环境配置与IDEA 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-213315 ...
- 第三十四章 Linux常规练习题(一)参考答案
一.练习题一 1.超级用户(管理员用户)提示符是___#_,普通用户提示符是___$_. 2.linux关机重启的命令有哪些 ? 关机命令 重启命令 shutdown -h now shutdown ...
- 往with as中写入数据的方法
方法1:直接写入,使用union all,简单直观,但程序运行效率低,几百条就很慢了 with dw_wms_outbound_info_v100 as( select '10700001' as o ...
- 【API管理 APIM】APIM集成内部VNet时,常遇见的关于自定义DNS服务问题。
问题描述 Azure 的APIM集成虚拟网络有两种方式,外部VNET, 内部VNET. 外部VNET,要求低,可以通过APIM访问VNET中的VM等资源,不需要配置自定义DNS服务器,这种方式下,AP ...