awk 分组求和

分组求和

awk  '{s[substr($2,1,6)] += $1} END{for(i in s) {print i, s[i]/(1024*1024*1024)} }' file_to_read.txt |sort -n

这里面用到了awk的知识和字典的知识。AWK 中需要了解的就是$N 代表所读取内容的第N 列。

可能有人对字典不太了解. s={'name':'halberd'} ,这就是一个字典，是Key-value的组合。

在上面的字典示例中，key 是 'name'，value 是 'halberd'。s[name] 的值就是 'halberd'。

返回上面的AWK示例， s[substr($2,1,6)] += $1 代表把文件 file_to_read.txt 每行中第二列的前6个字符作为字典 s 的key 。

当substr($2,1,6) 的值第一次出现时，s[substr($2,1,6)] = $1。

当substr($2,1,6) 的值重复出现时时, s[substr($2,1,6)] += $1 代表，把$1 的值加到原来s[substr($2,1,6)]上，也就是s[substr($2,1,6)] = s[substr($2,1,6)] + $1。通过字典的管理方式，进行数据的求和。

file_to_read.txt 部分内容如下:

.........

1125017 20180820174000

277 20180820174000

1491471 20180820175000

663 20180820175000

1429371 20180920170000

3716506 20181020170000

21055029 20181020170000

2218546 20181020171000

4650637 20181020174000

23847465 20181020174000

5341238 20181020175000

24666314 20181020175000

1621883 20181120170000

20620952 20181120170000

1756716 20181120171000

21409188 20181120171000

23085774 20190920174000

1126625 20190920175000

24564610 20190920175000

583910 20191020170000

22511935 20191020170000

921893 20191020171000

23906308 20191020171000

629943 20191020172000

25916302 20191020172000

1063984 20191020173000

25617169 20191020173000

780478 20191020174000

................

结果示例

201808 2.50172

201809 6.61726

201810 66.528

201811 84.6913

201812 91.871

201901 115.439

201902 124.768

201903 115.127

201904 91.7492

201905 93.8242

201906 92.1708

201907 83.1374

201908 95.1076

201909 85.789

201910 80.9189

Author: halberd.lee

Created: 2019-10-28 Mon 17:30

Validate

awk 分组求和的更多相关文章

Oracle函数over(),rank()over()作用及用法--分区(分组)求和& 不连续/连续排名
(1) 函数: over()的作用及用法: -- 分区(分组)求和. RANK ( ) OVER ( [query_partition_clause] order_by_clause )D ...
linq分组求和_实体类和datatable
1.数据分组求合,分别用的实体类以及datatable来分组求合,还有分组求和之后的如何取值 //实体类版本 List<ProgramTimeModel> TotalAllList = G ...
Oracle分析函数及常用函数： over(),rank()over()作用及用法--分区(分组)求和& 不连续/连续排名
(1) 函数: over()的作用及用法: -- 分区(分组)求和. sum() over( partition by column1 order by column2 )主要用来对某个字 ...
Mysql分组求和&LIMIT
分组求和mysql> SELECT coalesce(name, '总数'), SUM(singin) as singin_count FROM employee_tbl GROUP BY na ...
JDK8：Lambda根据单个字段、多个字段，分组求和
使用lambda表达式分别根据单个字段.多个字段,分组求和示意图: 1.根据单个字段,分组求和:根据2019这个字段,计算一个list集合里,同属于2019的某个字段累加和 2.根据多个字段 ...
查询统计SQL分组求和使用小技巧
我们在做查询统计时,肯定会遇到将查询结果再次分组求和这种需求,但是往往查询的sql本身就比较复杂,再使用分组函数不太可能,那么这时候我们就想到了用临时表的办法,通过联合临时表我们就可以获得想要的分组求 ...
java8 stream自定义分组求和并排序
public static void main(String[] args) { List<GroupDetailDTO> list = new ArrayList<>(); ...
Excel+Python：分组求和
Excel选中区域,排除序号.姓名等列,复制Ctrl+C. Python,import pandas as pd,读取剪切板并赋值给变量df,df.groupby('部门').sum().若要避免部门 ...
Laravel/Lumen 分组求和问题 where groupBy sum
在Laravel中使用分组求和,如果直接使用Laravel各数据库操作方法,应该会得出来如下代码式: DB::table('table_a') ->where('a','=',1) ->g ...

随机推荐

IntelliJ IDEA安装及破解
百度搜索IntelliJ IDEA,进入官网. 下载完成后进入安装界面根据自己的情况选择安装路径等待下载和安装完成. 安装完成接下来我们运行IntelliJ IDEA 之后这里就要我们进行激活了 ...
cbv装饰器中间件跨站请求伪造
给cbv下面的函数加装饰器写一个验证用户登录的程序前端页面 # 写一个装饰器验证session def login_auth(func): def inner(request,*args,**kw ...
linux下操作用户相关
一.添加用户 adduser test 二.为新添加用户设置密码 passwd test 根据提示输入两次密码三.为用户配置免密码sudo权限配置/etc/sudoers文件即可,过程如下 chm ...
mybatis分页未明确的列定义
问题出现原因是集成mybaits时会自动加上 select tmp_page.*, rownum row_id from ( abc )tmp_page 我的问题是 abc区域的列名有重名的,保持 ...
python pip 出现locations that require TLS/SSL异常处理方法
python pip 出现locations that require TLS/SSL异常处理方法转载郑才华发布于2018-03-24 21:41:16 阅读数 51844 收藏展开最近在r ...
牛客国庆集训派对Day6 && CCPC-WannaFly-Camp #1 F. kingdom（DP）
题目链接:https://www.nowcoder.com/acm/contest/206/F 题意:一棵 n 个点的树,根为 1,重儿子到父亲的费用为 0,其余为 1,问所有点到 1 的最大总费用是 ...
error MSB6006: “cmd.exe”已退出，代码为 3。
error MSB6006: “cmd.exe”已退出,代码为 3. 这两天调程序遇到一个奇怪的问题. C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4. ...
For 循环的嵌套与九九乘法表
㈠通过程序,在页面中输入如下图形 * * * * * * * * * * * * * * * * * * * * * * * * * 代码如下: //向body中输入一个内容 //document. ...
Educational Codeforces Round 33 (Rated for Div. 2) C题·（并查集变式）
C. Rumor Vova promised himself that he would never play computer games... But recently Firestorm — a ...
小米oj 组长偏头痛（二分）
组长偏头痛序号:#28难度:非常难时间限制:1000ms内存限制:10M 描述临近年底,组长突然患上了偏头痛的毛病,因为他最近从产品经理那里收到了好多需求,需要按排组员尽快完成. 现在用一个数组 ...

awk 分组求和

awk 分组求和

awk 分组求和的更多相关文章

随机推荐

热门专题