bash 统计在线时长最长的十个玩/统计一天内一直处于不活跃状态的玩家的百分比
1、某游戏的客户端每隔5分钟会向服务端报告一次玩家的账户积分,如果两次报告的时间间隔不大于5分钟,认为该玩家在这5分钟内在线,假设报告数据的格式如下:
IP Datetime Score
223.152.112.238 2014-08-22 12:01:35 54232
现有一天的数据,按时间按序保存,粗略估计玩家数在百万左右,请使用尽量少的硬件资源完成以下请求,统计在线时长最长的十个玩家;如果玩家两次提交的积分相同,认为玩家在5min的在线时间内不活跃,请统计一天内一直处于不活跃状态的玩家的百分比。
game_user_calculate.bash文件代码如下:
#!/bin/bash #先统计有多少个用户,即有多少个ip
sed '1d' log_all > log_all_1
awk '{ip[$1]++}END{for(i in ip){print i, ip[i]}}' log_all_1 > user
awk '{ip[$1]++}END{for(i in ip){print i}}' log_all_1 > user
user_count=`cat user | wc -l` #把每个用户的记录提取出来
for((i=1;i<=$user_count;i++));
do
#逐一取出各个ip
one_user=`sed -n "$i"p user` #根据ip筛选出属于此ip的报告记录,并统计报告次数
list_count=`grep "$one_user" log_all_1 | wc -l` #根据ip筛选出属于此ip的报告记录,并从第四列分数中统计出不同分数的个数
score_count=`grep "$one_user" log_all_1 | awk '{print $4}' | sort -u | wc -l` #将每个用户的报告总次数写入行首
sed -i "$i{s/^/ $list_count /}" user #将每个用户的不同分数的个数,写入行尾
sed -i "$i{s/$/ $score_count /}" user
done #把有记录报告次数和用户IP的文件及不同分数的文件user, 按记录次数由大到小排序,且取ip字段,并输出前十个
echo "The first 10 users online are"
sort -n -r -k 1 user | awk '{print $2}' | sed -n '1,10p' | cat -n #-n是以数值来排序
#-r是降序排列,默认是升序
#-k指定列数 #统计一天内一直处于不活跃状态的玩家总数,
nowake=`awk '{print $3}' user | grep "1" | wc -l` #计算不活跃状态玩家的百分比
echo Percentage of no active users is: `awk 'BEGIN{printf "%.2f%\n",('$nowake'/'$user_count')*100}'`
log文件如下:
IP Datetime Score
223.152.112.238 2014-08-22 12:01:35 54232
223.152.112.238 2014-08-22 12:06:35 54232
223.152.112.238 2014-08-22 12:11:35 54232
223.152.112.238 2014-08-22 12:17:35 54232
223.152.112.236 2014-08-22 12:01:35 54232
223.152.112.236 2014-08-22 12:06:35 54231
223.152.112.236 2014-08-22 12:15:35 54232
223.152.112.237 2014-08-22 12:01:35 54232
223.152.112.237 2014-08-22 12:06:35 54232
223.152.112.237 2014-08-22 12:11:35 5420
223.152.112.237 2014-08-22 12:16:35 54232
223.152.112.237 2014-08-22 12:29:35 54232
223.152.112.237 2014-08-22 12:34:35 54232
bash 统计在线时长最长的十个玩/统计一天内一直处于不活跃状态的玩家的百分比的更多相关文章
- js用img代替ajax js心跳 向服务器定时传送参数 主要计算用户在线时长
html: <!doctype html><html><head><meta charset="utf-8"><title&g ...
- js计算在线时长
后台传来毫秒,前台转换成对应的时分秒 //在线时长 function longTime(seconds){ //总秒数 //seconds=seconds/1000; //得到小时 var hour ...
- java web 程序---在线时长
思路:toLocalString()这个方法 <body> <% long t=session.getLastAccessedTime(); long t2=session.getC ...
- 分享一个基于长连接+长轮询+原生的JS及AJAX实现的多人在线即时交流聊天室
实现网页版的在线聊天室的方法有很多,在没有来到HTML5之前,常见的有:定时轮询.长连接+长轮询.基于第三方插件(如FLASH的Socket),而如果是HTML5,则比较简单,可以直接使用WebSoc ...
- spa(单页应用)中,使用history模式时,微信长按识别二维码在ios下失效的问题
spa(单页应用,vue)中,使用history模式时,微信长按识别二维码在ios下失效的问题. 触发条件: spa单页应用: 路由模式 history 从其他页面跳转到带有微信二维码识别的页面(不是 ...
- 用POI导出excel时,较长的数字不想被自动变为科学计数法的解决方式(转)
做过很多次导出excel了.都碰到一个问题,内容里如果包含一个比较长的数字,比如订单号“2546541656596”,excel会自动变成科学计数法... 弄过好几次都没有解决,最近又要导出excel ...
- 设在起始地址为STRING的存储空间存放了一个字符串(该串已存放在内存中,无需输入,且串长不超过99),统计字符串中字符“A”的个数,并将结果显示在屏幕上。
问题 设在起始地址为STRING的存储空间存放了一个字符串(该串已存放在内存中,无需输入,且串长不超过99),统计字符串中字符"A"的个数,并将结果显示在屏幕上. 代码 data ...
- 使用 Redis 统计在线用户人数
在构建应用的时候, 我们经常需要对用户的一举一动进行记录, 而其中一个比较重要的操作, 就是对在线的用户进行记录. 本文将介绍四种使用 Redis 对在线用户进行记录的方案, 这些方案虽然都可以对在线 ...
- seo标题关键字描述字数限制Title,keywords,description长度最长多长 ?
seo标题关键字描述字数限制 seo优化各个搜索引擎收录Title,keywords,description长度最长多长 ?SEO网站优化中Title标签的作用为重中之重,好的Title也就成功了一半 ...
随机推荐
- mongodb关联查询 和spring data mongodb
GITHUB:https://github.com/peterowang/Springdata-mongo 使用DBRefs DBRefs中有三个字段 - $ref - 此字段指定引用文档的集合 $i ...
- leetcode84 Largest Rectangle in Histogram
思路: 使用单调栈计算每个位置左边第一个比它矮的位置和右边第一个比它矮的位置即可. 实现: #include <bits/stdc++.h> using namespace std; cl ...
- IE盒子模型和W3C盒子模型
IE盒模型出现在ie5.5以下的版本当中,ie6以上就实行W3C盒模型. box-sizing有两个属性,border-box和content-box. border-box对应传统的盒子模型,即ie ...
- python中的getcwd
Help on built-in function getcwd in module posix: getcwd(...) getcwd() -> path Return a ...
- ajax提交表单无法验证easyui的验证选项(比如required等)
在实际开发中,遇到ajax方式提交表单没法验证easyui的验证选项,这对实际用户体验造成了很大的困扰.当然,这也是理所当然的事情. 解决办法:使用jquery中ajax的beforeSend事件 ...
- 理解Postgres性能
目录[-] 理解Postgres性能 理解缓存和缓存命中率 理解索引用途 Heroku Dashboard示例 索引缓存命中率 理解Postgres性能 对于很多应用程序开发人员来说数据库就是一个黑盒 ...
- MovieReview—Kingsman THE SECRET SERVICE(王牌特工之特工学院)
Brain Storming Mr. Valentine's Day see excess human beings as the Earth's virus and try to e ...
- CF Gym 100187E Two Labyrinths (迷宫问题)
题意:问两个迷宫是否存在公共最短路. 题解:两个反向bfs建立层次图,一遍正向bfs寻找公共最短路 #include<cstdio> #include<cstring> #in ...
- noip模拟赛#15
#15 T1:a[i]>=a[i/2].输出a的最大字典序 =>可以发现这是二叉树的情况那么就先预处理出每个点有多少个儿子然后递归处理就可以了. #include<cstdio> ...
- MySQL 外键 表的查询
自增补充 这是查看怎么创建的表, \G示旋转90度显示表的内容 表的自增的关键是** AUTO_INCREMENT=3**,在表中添加数据后,这个会自动改变,通过alert可以改变这个默认值 mysq ...