mysql group by 查询非聚集列
本文为博主原创,转载请注明出处:
mysql使用group by可以使用一些聚合函数,可以计算最大值(max(column)),最小值(min(column)),总和(sum(column)),平均数(avg(column()))等等,
在使用聚合函数的函数的时候,我们只可以查询聚合函数相关的列,其余的列则不能进行查询。示例如下:
表结构如下:
CREATE TABLE `fucdn_hot_rank_domain` (
`id` int(12) NOT NULL AUTO_INCREMENT COMMENT '主键',
`domain` int(11) NOT NULL COMMENT '域名id',
`band` double NOT NULL COMMENT '带宽,单位为B',
`total` int(16) NOT NULL COMMENT '请求数',
`clock` varchar(255) NOT NULL COMMENT '时间',
PRIMARY KEY (`id`),
UNIQUE KEY `domain` (`domain`,`clock`),
KEY `domain_id` (`domain`)
) ENGINE=InnoDB AUTO_INCREMENT=21961394 DEFAULT CHARSET=utf8 COMMENT='域名用量热门排行表';
使用聚合函数查询非聚合列:

查询非聚合列的时候异常提示:
which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by,不在聚合函数之内,查询异常。
如果要查询非聚合函数的列,可以再嵌套一遍进行关联查询,
使用如下:

这种查询的方便之处在于它可以避免写多个sql进行多次查询,但如果需要查询的时候有多条,则需要手动过滤一下。项目中用到的sql如下:
select clock, band, total,domain from (
select MAX(band)as band1,domain from fucdn_hot_rank_domain
where domain
in(11612,11613,11614,11615,11616,11617,11618,11619,11620)
and clock BETWEEN '2019-10-20 00:00:00.0' and '2019-10-20 23:59:59.0' GROUP BY domain ORDER BY band1 desc limit 20
)t join fucdn_hot_rank_domain fhrd on t.band1=fhrd.band and t.domain= fhrd.domain ORDER BY domain
之前代码中要查询这些数据的时候是分批次查询的,先查询所有数据,再根据过滤出的所有域名,计算出对应的峰值以及峰值时间。
代码都是用的流式计算,由于数据量大,计算相对还是比较慢的,后来优化为上面的sql后,性能比之前快了两倍多。
原来实现的代码如下,以供警醒,哈哈
@Override
public List<HotRankDomainResult> getHotRankDomainList(DomainCodeHelper helper) throws FucdnException {
List<HotRankDomainResult> resultList = new ArrayList<>();
System.out.println("<<<<<<<<<<<<<<selectTime::"+new Date());
List<HotRankHelper> helperList = hotRankDao.getHotRankDomainList(helper);
System.out.println(">>>>>>>>>>>>>>selectEndTime::"+new Date()); // 计算出域名带宽峰值,峰值时间,总流量,总请求数等
// 1.获取域名列表
List<String> domainList = helperList.stream().map(HotRankHelper::getDomain).collect(Collectors.toList()); // 2.对域名列表去重
domainList = domainList.stream().distinct().collect(Collectors.toList());
for (String domain : domainList) {
HotRankDomainResult resultDetail = new HotRankDomainResult();
// 获取域名对应的列表数据
List<HotRankHelper> domainResultList = helperList.stream()
.filter((HotRankHelper flow) -> domain.equals(flow.getDomain())).collect(Collectors.toList());
// 计算峰值
domainResultList = domainResultList.stream().sorted(Comparator.comparing(HotRankHelper::getBand).reversed())
.collect(Collectors.toList()); // 计算总流量和请求数
double totalFlow = domainResultList.stream().collect(Collectors.summingDouble(HotRankHelper::getBand));
int totalRequest = domainResultList.stream().collect(Collectors.summingInt(HotRankHelper::getTotal));
// 获取峰值数据
HotRankHelper topHelper = domainResultList.get(0);
resultDetail.setMaxBand(topHelper.getBand());
resultDetail.setMaxBandTime(topHelper.getClock());
resultDetail.setDomain(topHelper.getDomain());
resultDetail.setTotalFlow(totalFlow);
resultDetail.setTotalRequest(Integer.toString(totalRequest));
resultList.add(resultDetail);
}
// 对集合进行排序:降序
resultList = resultList.stream().sorted(Comparator.comparing(HotRankDomainResult::getMaxBand).reversed())
.collect(Collectors.toList());
if (resultList.size() > 20) {
// 获取前20
resultList = resultList.subList(0, 20);
} System.out.println(">>>>>>>>>>>>>>sortEndTime::"+new Date());
return resultList;
}
mysql group by 查询非聚集列的更多相关文章
- PostgreSql之在group by查询下拼接列字符串
首先创建group_concat聚集函数: CREATE AGGREGATE group_concat(anyelement) ( sfunc = array_append, -- 每行的操作函数,将 ...
- oracle中clob字段怎么查询非空列_20180517
select * from uap_groupsynlogvo a where a.log_msg is not null ; 附加demo的建表脚本跟业务数据. 链接:https://pan.bai ...
- SQL Server 2014聚集列存储索引
转发请注明引用和原文博客(http://www.cnblogs.com/wenBlog) 简介 之前已经写过两篇介绍列存储索引的文章,但是只有非聚集列存储索引,今天再来简单介绍一下聚集的列存储索引,也 ...
- SQL Server索引 (原理、存储)聚集索引、非聚集索引、堆 <第一篇>
一.存储结构 在SQL Server中,有许多不同的可用排列规则选项. 二进制:按字符的数字表示形式排序(ASCII码中,用数字32表示空格,用68表示字母"D").因为所有内容都 ...
- SQL查询优化:详解SQL Server非聚集索引(转载)
本文是转载,原文地址 http://tech.it168.com/a2011/1228/1295/000001295176.shtml 在SQL SERVER中,非聚集索引其实可以看作是一个含有聚集索 ...
- SQL Server 2014 聚集列存储
SQL Server 自2012以来引入了列存储的概念,至今2016对列存储的支持已经是非常友好了.由于我这边线上环境主要是2014,所以本文是以2014为基础的SQL Server 的列存储的介绍. ...
- SQL Server 2016 —— 聚集列存储索引的功能增强
作者 Jonathan Allen,译者 邵思华 发布于 2015年6月14日 聚集列存储索引(CC Index)是SQL Server 2014中两大最引 ...
- MySQL 排错-解决MySQL非聚合列未包含在GROUP BY子句报错问题
排错-解决MySQL非聚合列未包含在GROUP BY子句报错问题 By:授客 QQ:1033553122 测试环境 win10 MySQL 5.7 问题描述: 执行类似以下mysql查询, SEL ...
- 使用聚集索引和非聚集索引对MySQL分页查询的优化
内容摘录来源:MSSQL123 ,lujun9972.github.io/blog/2018/03/13/如何编写bash-completion-script/ 一.先公布下结论: 1.如果分页排序字 ...
随机推荐
- Linux 环境变量配置(Nodejs/MongoDB/JDK/Nginx)
一.环境变量配置 注:配置环境变量的文件 全局变量(系统级别): /etc/bashrc /etc/profile /etc/environment 用户变量(用户级别): ~/.bash_profi ...
- 机器学习笔记7:矩阵分解Recommender.Matrix.Factorization
目录 1矩阵分解概述 1.1用在什么地方 1.2推荐的原理 2矩阵分解的原理 2.1目标函数 2.2 损失函数 2.3 通过梯度下降的方法求得结果 3 代码实现 参考地址: 贪心学院:https:// ...
- JanusGraph安装graphexp
准备:JanusGraph环境,graphexp源码,nginx 本文采用的环境:JanusGraph + cassandra + ES + GraphExp(cassandra 或者HBase作为后 ...
- 使用awk格式化输出文本
注意:本文并不是一篇awk入门文章,而是偏重实例讲解 awk借鉴了c语法,因此awk在许多地方还保留有c语言的痕迹,比如printf语句:for,if的语法结构等 介绍 最简单地说,AWK 是一种用于 ...
- docker(ubuntu)中安装cron运行crontab定时任务
1.安装cron apt-get install cron 设置crontab定时任务 crontab -e */ * * * * /usr/bin/python /python/asch-check ...
- SaltStack--快速入门
saltstack快速入门 saltstack介绍 Salt,一种全新的基础设施管理方式,部署轻松,在几分钟内可运行起来,扩展性好,很容易管理上万台服务器,速度够快,服务器之间秒级通讯 主要功能远程执 ...
- Spring Boot 2实现分布式锁——这才是实现分布式锁的正确姿势!
参考资料 网址 Spring Boot 2实现分布式锁--这才是实现分布式锁的正确姿势! http://www.spring4all.com/article/6892
- luogu2900:Land Acquisition(斜率优化)
题意:有N块地,每块地给出的宽和高,然后可以分批买,每次买的代价是所选择的地种最宽*最高. 问怎么买,使得代价和最小. 思路:显然,先去掉被包括的情况,即如果一个地的宽和高斗比另外一个小,那么久可以删 ...
- 实时查看mysql当前连接数
如何实时查看mysql当前连接数? 1.查看当前所有连接的详细资料:./mysqladmin -uadmin -p -h10.140.1.1 processlist 2.只查看当前连接数(Thread ...
- [洛谷P3092]【[USACO13NOV]没有找零No Change】
状压\(DP\) + 二分 考虑构成:\(k<=16\)所以根据\(k\)构造状压\(dp\),将所有硬币的使用情况进行状态压缩 考虑状态:数组\(dp[i]\)表示用\(i\)状态下的硬币可以 ...