Linux 在文件中统计关键字出现的次数
摘要:在当前文件或者当前目录下所有文件中,使用Linux命令grep
、awk
、sed
、rg
或者cat
统计关键字出现的次数。
问题背景
在当前文件或者当前目录下所有文件中,统计指定关键字出现的次数。
在《Linux 在多个文件中搜索关键字》中,小编分享了如何使用grep或者rg在当前目录下所有文件中查找关键字。本文分享在当前文件或者当前目录下所有文件中,如何使用grep
、awk
、sed
、rg
或者cat
统计关键字出现的次数。
解决办法
在Linux中,可以使用命令行工具如grep和wc来统计日志文件中某个关键词出现的次数。以下是一个简单的统计方法,当然,如果使用阿里云,可以使用更高效的SLS进行统计,这里假定没有统计工具。
假设待统计关键词的目标文件是/data/logs/logFile.txt
,目标目录是/data/logs/
,待统计的关键词是 keyword。
使用grep和wc命令
grep -o 'keyword' /data/logs/logFile.txt | wc -l
此命令会在logFile.txt中查找关键词keyword出现的次数,-o
选项会确保只输出匹配的行。
命令wc -l会计算匹配行的数量,也就是keyword出现的次数。wc
命令用于统计字数、行数、字符数。-l
选项用于统计行数,这里每匹配一次关键词会被认为是一行。
使用awk命令模式匹配
可以在awk中定义变量。例如,在文件中统计关键词keyword出现的行数:
awk '{count += gsub(/keyword/, "&")} END {print count}' logFile.txt
这段命令借助awk
,通过函数gsub
统计关键词keyword出现的次数,然后将其累加,最后输出总数。也可以使用如下简易版语法糖:
awk '/keyword/ {count++} END {print count}' logFile.txt
如果打印匹配到 "keyword" 的所有行,语法糖如下:
awk '/keyword/ { print $0 }' logFile.txt
AWK 是一种灵活且强大的工具,适用于各种文本和数据处理任务。工作原理如下:当读到第一行时,匹配条件,然后执行指定动作,再接着读取第二行数据处理,不会默认输出,以此循环,逐行读取文本直到文本末行。如果没有定义匹配条件,那么默认匹配所有数据行。awk隐含循环动作,条件匹配多少次就会执行多少次匹配。
使用sed和wc命令
sed -n 's/.*$(keyword)$.*/\1/p' /data/logs/logFile.txt | wc -l
这个命令使用sed命令,在logFile中查找并打印keyword出现的次数。
使用rg命令
在Linux中,可以使用 rg(Ripgrep)来统计关键词出现的次数。rg 是一个快速搜索工具,酷似 grep,但通常速度更快。要统计某个关键词在一个文件中出现的次数,可以结合wc使用:
rg -o "keyword" /data/logs/logFile.txt | wc -l
-o
选项确保每次匹配只输出关键词本身。
cat和wc
语法类似rg:
cat /data/logs/logFile.txt |grep 'keyword'| wc -l
统计目录中关键词出现总次数
如果需要在目录/data/logs
下,统计keyword出现的总次数,可以使用如下命令:
awk '{count += gsub(/keyword/, "&")} END {print count}' /data/logs/*
*
代表目录下所有文件。grep、awk 和sed也可以类似语法糖,不再赘述。
在每个文件中统计关键词出现次数
有时候需要指定目录下,统计每个文件中关键词出现次数,这时可以使用如下命令:
grep -c 'keyword' /data/logs/ -R
此命令遍历/data/logs/下所有的文件,并统计关键词在每个文件中出现的次数。-R
表示遍历目录下所有文件。
总的来说,grep命令是一个强大而灵活的工具,它可以帮助我们在海量文件中快速找到包含特定关键词的内容。我们通过掌握grep命令的基本语法和各种选项,可以更加高效地处理文件和数据,从而更好地应对日常工作和研究中的挑战。无论你是在进行代码调试、文档编辑还是数据分析,grep命令都将成为你不可或缺的得力助手。
小结
Linux命令grep
、awk
、sed
、rg
或者cat
都可以帮助你快速统计出目录或者文件中关键词的出现次数。如果你需要进一步的帮助或有其它问题,欢迎在下方评论区留言!Wiener会逐一答复。
Linux 在文件中统计关键字出现的次数的更多相关文章
- linux所有文件中查找关键字的命令
grep 192.168.1.1 * -r 在所有文件中查找192.168.1.1
- dos2unix,去掉Linux下文件中的^M
Windows系统下使用VS2010编写好的CPP文件,想放到Linux上进行编译.发现Linux上文件中的每行代码末尾都跟着^M这个符号. 为什么同一份文件在windows上和Linux上显示的不一 ...
- 统计一个文件中出现字符'a'的次数
# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/ho ...
- Java笔记13:统计文件中每个字符出现的次数
一.代码实现 import java.io.*; import java.util.*; /** 功能:统计文件中每个字符出现的次数 思路: 1.定义字符读取(缓冲)流 2.循环读取文件里的字符,用一 ...
- python 在一个文件夹的所有文件中查找关键字
python 在一个文件夹的所有文件中查找关键字 import os,shutil import re key='Hello' re_parttern=re.compile(r''+key,re.DO ...
- linux命令统计文件中某个字符串出现的次数
1.使用grep linux grep命令在我的随笔linux分类里有过简单的介绍,这里就只简单的介绍下使用grep命令统计某个文件这某个字符串出现的次数,首先介绍grep命令的几个参数,详细参数请自 ...
- Linux - Shell - 在多个文件中查找关键字
1. 概述 在多个文件中 查找内容 2. 想干啥 目的 在 多个文件 中, 查找内容 准备 之前在 单个文件里 查找过内容 工具 awk 前提 文件有固定格式 查找时有字段的要求 例子 # print ...
- 自定义VBS脚本(统计在指定文件中搜索字符串出现的次数)
'=========================================================================='' VBScript Source File - ...
- linux grep命令(linux在文件中搜索内容)
转自:https://www.cnblogs.com/end/archive/2012/02/21/2360965.html linux grep命令 1.作用Linux系统中grep命令是一种强大的 ...
- linux向文件中添加数据,数据被追加到了上一行的行尾
当我们在windows上新建了文件,并且要上传到linux上时,一定要在文件后加上空格,否则就会出现标题上讲的,数据被追加到了上一行的行尾,而不是新起一行,但是如果是在linux上新建的文件,则没有这 ...
随机推荐
- php解析url并得到url中的参数及获取url参数的四种方式
https://www.jb51.net/article/73900.htm 下面通过四种实例给大家介绍php url 参数获取方式. 在已知URL参数的情况下,我们可以根据自身情况采用$_GET来获 ...
- RP 点归入Set And Coupling 约束创建
想用python脚本创建一个耦合coupling关系,需要定义control piont和被控制的surfaces.两者都可以先分别归入到set 和surface里,最后用set和surface作为c ...
- Linux下yum安装mysql 遇到的问题Can't open and lock privilege tables: Table 'mysql.user' doesn't exist 错误
今天在linux下安装mysql时 执行service mysqld start时, mysql总是启动失败 后来查看mysql日志:/var/log/mysqld.log,发现有个Can't ope ...
- 简易TXT文本小说阅读器
上次学习爬取小说保存到txt文本文件,方便离线阅读,现在做一个简易TXT文本小说阅读器,支持手动翻页和自动翻页阅读. 废话不多说,直接上代码,实践下. read_txt.py: import time ...
- DCL(Double-checked Locking双重校验锁)实现单例模式的原理、问题与解决方案
好的,要深入理解DCL(Double-Checked Locking)双重校验锁的原理.问题以及解决方法. 首先,我需要回忆一下单例模式的基本概念,因为DCL通常用于实现单例模式. 单例模式确保一 ...
- Delphi 中拖动无边框窗口的5种方法
1.MouseMove事件中加入: // ReleaseCapture; // Perform(WM_SYSCOMMAND, $F017 , 0); 2.MouseDown事件中加入: // POST ...
- IIS7配置301永久重定向
我把我的小域名www.taadis.com301永久重定向到taadis.com. 关键图解:
- study Python3【4】字符串的判断
判断类型: result为True和False str = '1122abc' str.isalnum()是数字或者字母 str = 'MDCA' str.isalpha() 是字母 str = '1 ...
- VsCode写Markdown使用snippet
文件->首选项->用户片段 输入markdown 输入代码片段 Ctrl+P,输入settings.json 加入下面个这个选项 "[markdown]" ...
- Unity3D教程:次表面散射的简单实现
次表面散射指的是光线射入半透明材质,在内部发生散射后再透射出来的光线传播过程,考虑到有些项目会需要使用次表面散射,下面就给大家介绍下在Unity3D中次表面散射的简单实现,希望可以帮到大家. 一.前言 ...