提取日志中出现的userId或其他信息

项目上线后经常出现需要统计用户数据、接口请求等。完美的情况下，在项目开始前就设计好哪些request、中间过程需要落地到db、或以一定格式存入专门的log中，但也常需要同学们临时去业务日志中grep

大致分为三步：找到包含数据的行、提取出行中需要的数据、输出到文件并提取到本地

实践中用到的一种方式：

zcat /home/机器中的日志路径/logs/finscore.log.gz | grep 'TaskController.queryTaskListApi(..)的请求参数为' | awk -F\' '{print $}' > machine1_userId_2017-09-04.log

用到的命令：

zcat：就是查看压缩文件的内容，如果日志未压缩，直接cat也行
grep：找到包含数据的行
awk：用法为 awk -F分隔字符操作，比如awk -F: '{print $2}' 代表将当前数据按照英文冒号进行分割，并将分割后的第二段中的内容输出。需要注意分隔字符的转义。如果不写-F，默认会用空格作为分隔符

如果是ssh登录的线上机器，拷贝到本地，还需要在本地这样做：

scp 线上机器地址:machine1_userId_2017--.log /Users/micheal/temp/machine1_userId_2017--.log

scp是有Security的文件copy，基于ssh登录。操作起来比较方便，敲完命令后会提示输入那台机器的登录密码，接着就开始copy了

对于提取数据中的精髓：提取，除了awk还有很多方法，比如可以用cut：

cat userId_2017--04.log | cut -d \" -f 8 > userId_new_2017-09-04.log

cut命令：

-d：分隔符，和awk的-F一样
-f：分割后取第几段内容，如果要取多段：可以写 -f2-4，从第二段取到结尾：-f2-，从头取到第四段：-f-4；取第一段和第三段：-f1,3，随意组合（上文中awk中使用的print也有类似的语法，可以随意组合）

如果为多台机器，可以配合可分屏的terminal：
mac下推荐iTerm2：http://www.iterm2.com/，打开终端后分屏，然后广播output即可

linux：直接sudo apt-get install terminator

提取日志中出现的userId或其他信息的更多相关文章

提取日志中的json请求发送到另外一台机器
将日志中的json请求提取,并且发送到另外一个机器上: for i in ` cat impression.log.2016-04-08-10 |awk -F"\t" ' {pri ...
从输出日志中提取接口的入参和返回做为用例导入到excel中
1 背景接口用例已经在项目中的yml文件中编写,但是yml文件不能做为交付文档用,本文对工作中从接口输出日志中提取用例信息,并导入到excel文件中做了总些 2 工具 idea,notepad+ ...
linux服务端日志中截取自己所需要的部分
近期开发一个图片处理的业务,涉及base64字符串解析的问题,为方便与友商间接口调试,日志中保存Base64.日,想想就肝儿疼,记录下来容易,取的时候难.为准确提取,配合两条命令即可. 1.获取日志所 ...
Python统计日志中每个IP出现次数
介绍了Python统计日志中每个IP出现次数的方法,实例分析了Python基于正则表达式解析日志文件的相关技巧,需要的朋友可以参考下本脚本可用于多种日志类型 #-*- coding:utf-8 -* ...
本地多张图片采用jmeter上传到ftp服务器的方法和获取服务器日志中某些关键字的基本方法
测试需求: 本地图片上传到ftp服务器里和另外两台不同算法比对服务器进行比对,得出漏检和误检结果:这实际属于功能测试范畴. 测试思路: 第一种方法:使用实际场景的摄像机抓拍图片上传到服务器,用录屏软件 ...
在linux中使用shell来分析统计日志中的信息
在运维工作中,要经常分析后台系统的日志,通过抓取日志中的关键字信息,对抓取结果进行统计,从而为监控结果提供基础数据.下面的shell演示了如何从大量的日志中取得想要的统计结果.其中展示了各种有趣的命令 ...
统计日志中ip出现的次数
grep -r 'GET /weixin/weixin_izp/index.html' ./chunyun.access.log > ~/access.log cat access.log |a ...
使用Java Stream，提取集合中的某一列/按条件过滤集合/求和/最大值/最小值/平均值
不得不说,使用Java Stream操作集合实在是太好用了,不过最近在观察生产环境错误日志时,发现偶尔会出现以下2个异常: java.lang.NullPointerException java.ut ...
ES & Filebeat 使用 Pipeline 处理日志中的 @timestamp
使用 Pipeline 处理日志中的 @timestamp Filebeat 收集的日志发送到 ElasticSearch 后,会默认添加一个 @timestamp 字段作为时间戳用于检索,而日志中的 ...

随机推荐

Vue keep-alive的总结
1.基本用法 vue2.0提供了一个keep-alive组件用来缓存组件,避免多次加载相应的组件,减少性能消耗. <keep-alive> <component> <!- ...
day44前端开发1之html基础
web前端开发1一.前端三剑客之html 1.为标记语言,是非编程语言 2.自身不具备逻辑,遇到负责重复操作只能全部手写(Ctrl+C > V) 3.组成:标签, 指令, 实体标签:由< ...
python常见循环练习
第一题:求5的阶乘 # 方法1,递归 def jc(num): if num == 1: return 1 else: return num*jc(num-1) print(jc(5)) # 方法2, ...
Music Recommendation System with User-based and Item-based Collaborative Filtering Technique(使用基于用户及基于物品的协同过滤技术的音乐推荐系统)【更新】
摘要: 大数据催生了互联网,电子商务,也导致了信息过载.信息过载的问题可以由推荐系统来解决.推荐系统可以提供选择新产品(电影,音乐等)的建议.这篇论文介绍了一个音乐推荐系统,它会根据用户的历史行为和口 ...
jquery与原生JS实现增加、减小字号功能
预览效果: 实现代码: <!DOCTYPE html> <html lang="en"> <head> <meta charset=&qu ...
WEB请求过程(http解析,浏览器缓存机制,域名解析,cdn分发)
概述发起一个http请求的过程就是建立一个socket通信的过程. 我们可以模仿浏览器发起http请求,譬如用httpclient工具包,curl命令等方式. curl "http://w ...
Redis内存模型总结
一.Redis内存统计在客户端通过redis-cli连接服务器后,通过info命令可以查看内存使用情况: info memory 返回结果中比较重要的几个说明如下: (1)used_memory:R ...
(转)PWA（Progressive Web App）渐进式Web应用程序
PWA 编辑讨论 PWA(Progressive Web App)是一种理念,使用多种技术来增强web app的功能,可以让网站的体验变得更好,能够模拟一些原生功能,比如通知推送.在移动端利用标准化 ...
用 Python + itchat 写一个爬虫脚本每天定时给女朋友发微信暖心话
https://github.com/sfyc23/EverydayWechat.git
asp.net文件/大文件上传需要配置的项目整理
HTTP 错误 404.13 - Not Found 请求筛选模块被配置为拒绝超过请求内容长度的请求. 最可能的原因: •Web 服务器上的请求筛选被配置为拒绝该请求,因为内容长度超过配置的值. 可尝 ...

提取日志中出现的userId或其他信息

提取日志中出现的userId或其他信息的更多相关文章

随机推荐

热门专题