awk、grep、sed是linux操作文本的三大利器,也是必须掌握的linux命令之一
awk
、grep
、sed
是linux
操作文本的三大利器,也是必须掌握的linux
命令之一。三者的功能都是处理文本,但侧重点各不相同,其中属awk
功能最强大,但也最复杂。grep
更适合单纯的查找或匹配文本,sed
更适合编辑匹配到的文本,awk
更适合格式化文本,对文本进行较复杂格式处理。
以下所有实验输出,均以测试文件test.log
内容为基准:
20170102 admin,password Open
20170801 nmask,nmask close
20180902 nm4k,test filter
awk
AWK
是一种处理文本文件的语言,是一个强大的文本分析工具; awk
是以列为划分计数的,$0
表示所有列,$1
表示第一列,$2
表示第二列。
awk参数
-F
指定输入文件折分隔符,如-F
:-v
赋值一个用户定义变量,如-va=1
-f
从脚本文件中读取awk
命令
注:只列举最常用的参数
分隔符
每行按空格分割列,并输出第1、3列
$ awk '{print $1,$3}' test.log
# 或者
$ cat test.log | awk '{print $1,$3}'
自定义分隔符
使用”,”进行分割,参数用-F
awk -F, '{print $1,$2}' test.log
使用多个分隔符,先使用空格分割,然后对分割结果再使用”,”分割
$ awk -F '[ ,]' '{print $1,$2,$3}' test.log #注意逗号前面有一个空格
设置变量
设置awk
自定义变量,用参数-v
例子:设置变量a为1
cat test.log | awk -v a=1 '{print $1,$1+a}'
注意:-v a之间要空格。
字符串拼接:(用””而不是+)
cat test.log | awk -v a=\" '{print a""$0""a}'
逻辑判断
输出第一列为20170801的记录
cat test.log | awk '$1==20170801 {print}'
输出第二列不是nmask,nmask的记录
cat test.log | awk '$2!="nmask,nmask" {print}'
内建变量
NR参数:输出行号
cat test.log | awk '{print NR,$1,$2,$3}'
正则表达式
输出第二列中包含nm开头的所有记录
cat test.log | awk '$2 ~ /nm.*/ {print}'
输出包含2017开头的记录
cat test.log | awk '/2017.*/ {print}'
注意:这里没有~,因为没有指定是哪一列
忽略大小写{INGORECASE=1}
cat test.log | awk '{INGORECASE=1} /nmask/ {print}'
匹配取反 !~
cat test.log | awk '$2 !~ /nmask/ {print}'
内置函数
substr字符串截取
截取第一列的第一到第四个字符
cat test.log | awk '{print substr($1,1,4)}'
split切分字符串
以逗号分隔第2列的数据,并输出分别输出第2列的内容
cat test.log | awk '{split($2,a,",");print a[1],a[2]}'
gsub替换
将第2列中的nmask替换成nMask
cat test.log | awk '{gsub("nmask","nMask",$2);print}'
grep
Linux grep命令用于查找文件里符合条件的字符串。
Usage
递归查询
grep -r nmask /etc/ #查看/etc目录下内容包含nmask的文件
查询取反
grep -v test test.log
sed
Linux sed命令是利用script来处理文本文件。
参数
-e
以选项中指定的script
来处理输入的文本文件。-f
以选项中指定的script
文件来处理输入的文本文件。-h
显示帮助。-n
仅显示script
处理后的结果。-V
显示版本信息。
动作
- a :新增, a 的后面可以接字串,而这些字串会在下一行出现
- i :插入, i 的后面可以接字串,而这些字串会在上一行出现
- c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行
- d :删除
- s :取代,通常这个s的动作可以搭配正规表示法!如 s/old/new/g
插入操作
在test.log文件的第3行后插入一行,内容为nmask
sed -e 3a\nmask test.log
删除操作
删除test.log的第2行、第3行数据
cat test.log | sed '2,3d'
匹配删除,删除行中有nmask字符串的
nl test.log | sed '/nmask/d'
替换操作
sed 's/要被取代的字串/新的字串/g'
awk、grep、sed是linux操作文本的三大利器,也是必须掌握的linux命令之一的更多相关文章
- awk grep sed cut学习
awk学习网站 grep sed cut
- awk,grep,sed文本格式化处理
一.awk取列 [root@web01 ~]# cat /etc/passwd|awk -F ':' '{print $1"\t\t"$7}' ###-F指定分隔符 root /b ...
- 打印第二列为oldboy的第一列内容(awk,grep,sed用法)
[root@goldtest ~]# cat ip.log 10.0.0.1 oldboy 10.0.0.2 oldgirl 10.0.0.4 tingting 10.0.0.4 oldboy old ...
- awk grep sed 的一些问题
条件 匹配 打印含关键字的行 ps aux | sort -k 4 -r | awk '$4 ~ /^[0-9]/ && $4>0 {print $4,$11}' z ...
- Linux三剑客:grep、awk、sed
---------------------------------------------------------------------------------------------------- ...
- Linux高级文本处理命令
cut 一.cut命令 功能:cut命令可以从一个文本文件/文本流中提取文本列 语法: cut -d '分割字符' -f fields ##用于有特定分割字符 cut -c 字符区间 ##用于排列整齐 ...
- Linux文本文件——文本编辑器Vim
Linux文本文件——文本编辑器Vim 摘要:本文主要学习在Linux系统中使用Vim文本编辑器编辑文本. 什么是Vim Vim是一个基于文本界面的编辑工具,使用简单且功能强大.更重要的是,Vim是所 ...
- linux学习笔记:第二单元 UNIX和Linux操作系统概述
第二单元 UNIX和Linux操作系统概述 UNIX是什么 UNIX操作系统的特点 UNIX 与Linux的关系 GNU项目与自由软件 GUN计划 自由软件意味着什么 Linux简介 Linux是什么 ...
- Linux 操作系统文件略解
1.使用tree命令查看根目录的树结构 # tree -L 1 如果没有tree命令,可以使用yum进行安装 # yum -y install tree 执行命令后,即可看到根下一共有19个目录 . ...
随机推荐
- 优化之Sequence Generator组件
优化Sequence Generator组件,需创建一个可重用的序列生成器,并同时在多个Mappings中使用它 关于Number of Cached Values Sequence Generato ...
- 【java提高】---java反射机制
java反射机制 一.概述 1.什么是反射机制 反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意一个方法和属性:这种动态获取的信息以及动态 ...
- 版本管理工具Git(三)Gitlab高可用
高可用模式 企业版 社区版 我们这里说一下成本比较低的主备模式,它主要依赖的是DRBD方式进行数据同步,需要2台ALL IN ONE的GitLab服务器,也就是通过上面安装方式把所有组件都安装在一起的 ...
- springboot+mybatis+dubbo+aop日志第一篇
本篇文章主要讲述项目搭建过程,不会涉及过多的基础知识,本项目是作者对前段时间学习的一个总结,主要使用到技术有:maven父子工程.springboot.mybatis.dubbo.zookeeper. ...
- 日志服务Python消费组实战(三):实时跨域监测多日志库数据
解决问题 使用日志服务进行数据处理与传递的过程中,你是否遇到如下监测场景不能很好的解决: 特定数据上传到日志服务中需要检查数据内的异常情况,而没有现成监控工具? 需要检索数据里面的关键字,但数据没有建 ...
- 如何设计一个 RPC 系统
本文由云+社区发表 RPC是一种方便的网络通信编程模型,由于和编程语言的高度结合,大大减少了处理网络数据的复杂度,让代码可读性也有可观的提高.但是RPC本身的构成却比较复杂,由于受到编程语言.网络模型 ...
- Python2 编码问题分析
本文浅显易懂,绿色纯天然,手工制作,请放心阅读. 编码问题是一个很大很杂的话题,要向彻底的讲明白可以写一本书了.导致乱码的原因很多,系统平台.编程语言.多国语言.软件程序支持.用户选择等都可能导致无法 ...
- c语言之gdb调试。
1.此文档演示如何使用gdb调试c语言代码. 代码如下: #include <stdio.h> /*函数声明*/ void digui(int n); int main() { ; dig ...
- [JavaScript] audio在浏览器中自动播放
audio 在浏览器中自动播放 autoplay 属性 autoplay 属性规定一旦音频就绪马上开始播放. 如果设置了该属性,音频将自动播放. 使用 autoplay 属性进行播放 //使用auto ...
- 【转载】C#工具类:人民币金额转换为中文大写
在涉及到金融业务这一块的系统设计中,时常能够遇到的情况是需要将阿拉伯数字的人民币金额自动转换为中文的大写金额.现在互联网上也有很多网站提供此类服务,只要你输入人民币的阿拉伯数字金额,输入后自动给你转换 ...