Linux处理文本工具

    grep: 过滤文本内容

    sed:  编辑文本内容

    awk:   显示文本

    

awk:  Aho Peter Weinberger  Kernighan

报告生成器,以特定的条件查找文本内容,在以特定的格式显示

awk命令的格式:

# awk [option] 'script' file1 file2...

# awk [option] 'PATTERM{action}' file1 file2...

PATTERN:

    用文本字符与正则表达式元字符描述的条件,可以省略不写

action:

    print

    printf  指定输出项的格式:格式必须写

option选项:

    -F  指定文本分割符

    
awk处理文本机制:

awk将符合PATTERN的文本逐渐取出,并按照指定的分割符(默认为空白,通过—F选项可以指定分割符)进行分割,然后将分割后的每段按照特定的格式输出

awk的输出:

一 print

print的使用格式:

    print item1,item,...

注意:

1,各项目间使用逗号分隔开,而输出时以空白字符串为分隔

2,输出的item可以为字符串,数值,当前的记录的字段($1),变量或者awk的表达式,数值会先转换字符串,然后输出

3,print命令后面的item可以省略,此时其功能相当于print($0代表未分割的整行文本内容),因此,如果想输出空行,则需要使用print "";

以空白分割,显示文本的第一段及第二段内容

[root@wei awk]# awk '{print $1,$3}' print.txt 
i wei
i zhang
[root@wei awk]# awk '{print "hello",$3}' print.txt 
hello wei
hello zhang

显示passwd的用户名称

[root@wei awk]# awk -F: '{print $1}' /etc/passwd
root
bin
daemon
adm
lp

显示设备的挂载情况

[root@wei awk]# df -hT | sed '1d' | awk '{print "设备名称:",$1,"挂载点:",$7,"总容量:",$3}'
设备名称: /dev/mapper/centos-root 挂载点: / 总容量: 17G
设备名称: devtmpfs 挂载点: /dev 总容量: 476M
设备名称: tmpfs 挂载点: /dev/shm 总容量: 488M

awk变量

1 awk内置变量之记录变量

FS:指定读取文本时,所使用的行分隔符,默认为空白字符,相当于awk的—F选项

OFS:指定输出的分隔符,默认为空白字符;

[root@wei awk]# head -n 1 /etc/passwd | awk -F: '{print $1,$7}'
root /bin/bash

FS模式

[root@wei awk]# head -n 1 /etc/passwd | awk 'BEGIN{FS=":"}{print $1,$7}'
root /bin/bash

OFS模式

[root@wei awk]# head -n 1 /etc/passwd | awk -F: 'BEGIN{OFS="---"}{print $1,$7}'
root---/bin/bash

模式混合

[root@wei awk]# head -n 1 /etc/passwd | awk 'BEGIN{FS=":";OFS="---"}{print $1,$7}'
root---/bin/bash

2  awk内置变量之数据变量

NR:记录awk所处理的文本行数,如果有多个文件,所有的文件统一进行计数

第 1 行内容: 127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
第 2 行内容: ::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
第 3 行内容: \S
第 4 行内容: Kernel \r on an \m
第 5 行内容: 

注意:

print在显示变量值时,不要使用$

FNR:记录awk所处理的文本行数,如果有多个文件,所有的文件分别进行计数

[root@wei awk]# awk '{print "第",FNR,"行内容:",$0}' /etc/hosts /etc/issue
第 1 行内容: 127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
第 2 行内容: ::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
第 1 行内容: \S
第 2 行内容: Kernel \r on an \m
第 3 行内容:

NF:记录awk正在处理的当前行被分隔成几个字段

[root@wei awk]# cat print.txt 
i am wei
i am zhang
[root@wei awk]# awk '{print NF}' print.txt 
3
3
[root@wei awk]# awk '{print $NF}' print.txt 
wei
zhang

3 用户自定义的变量

awk允许用户自定义变量,变量名称不能以数字开头,且区分大小写

示例: 

方法一:使用-v选项

[root@wei awk]# head -n 3 /etc/passwd | awk -v test="hello" -F: '{print test,$1}'
hello root
hello bin
hello daemon

方法二:在BEGIN{}模式自定义变量

[root@wei awk]# head -n 3 /etc/passwd | awk -F: 'BEGIN{test="hello"}{print test,$1}'
hello root
hello bin
hello daemon

Linux shell awk中print及变量使用的更多相关文章

  1. Linux shell awk中printf使用

    printf 是 awk 的重要格式化输出命令 printf格式化输出内容 格式:     printf format,item1,item2...     要点: 1,printf输出时要指定格式f ...

  2. Linux Shell编程中的几个特殊符号命令 & 、&& 、 ||

    https://blog.csdn.net/hack8/article/details/39672145 Linux Shell编程中的几个特殊符号命令 & .&& . || ...

  3. 学习Linux shell脚本中连接字符串的方法

    这篇文章主要介绍了Linux shell脚本中连接字符串的方法,如果想要在变量后面添加一个字符,可以用一下方法: 代码如下: $value1=home $value2=${value1}"= ...

  4. Linux shell脚本中shift

    Linux shell脚本中shift的用法说明 shift命令用于对参数的移动(左移),通常用于在不知道传入参数个数的情况下依次遍历每个参数然后进行相应处理(常见于Linux中各种程序的启动脚本). ...

  5. Linux shell命令中expr

    在Linux shell命令中expr虽然不是很起眼,但是它的作用是非常大的!到目前为止,我个人看来最大的作用就是两个——四则运算和字符串的操作. 先说四则运算,在Shell中四则运算不能简简单单的加 ...

  6. Linux shell脚本中shift的用法说明【转】

    本文转载自:http://blog.csdn.net/zhu_xun/article/details/24796235 Linux shell脚本中shift的用法说明 shift命令用于对参数的移动 ...

  7. shell脚本中特定符合变量的含义

    shell脚本中特定符合变量的含义: $#   传递到脚本的参数个数 $*    以一个单字符串显示所有向脚本传递的参数.与位置变量不同,此选项参数可超过9个 $$    脚本运行的当前进程PID号 ...

  8. linux shell脚本中的延时

    linux shell脚本中的延时 还是使用 sleep 或usleep函数. 详细如下:     .sleep : 默认为秒. sleep 1s 表示延迟一秒   sleep 1m 表示延迟一分钟 ...

  9. Linux shell 脚本中变量的数学计算【转】

    本文转载自:http://blog.csdn.net/qinghezhen/article/details/9194287 首先从一个例子说起: x=1+1 echo $x 你是不是期待着输出2啊?让 ...

随机推荐

  1. NOIP 2003 乒乓球

    洛谷 P1042 乒乓球 https://www.luogu.org/problemnew/show/P1042 JDOJ 1363: [NOIP2003]乒乓球 T1 https://neooj.c ...

  2. Ubuntu使用snap安装常用软件

    1,snap简介 什么是snap,snap是一种全新的软件包管理方式,它类似一个容器拥有一个应用程序所有的文件和库,各个应用程序之间完全独立.所以使用snap包的好处就是它解决了应用程序之间的依赖问题 ...

  3. Linux网络基础设置

    1.笔记 systenctl restart network:重启网卡网络服务 bash:刷新主机名称 netstat:查看网络状态 route -n:不做地址解析 mii-tool eno16777 ...

  4. 怎样删掉vc++ 对话框中的蓝色虚线框

    选择"格式"--"切换辅助线"或者是快捷键alt+o , g

  5. [LeetCode] 857. Minimum Cost to Hire K Workers 雇佣K名工人的最低成本

    There are N workers.  The i-th worker has a quality[i] and a minimum wage expectation wage[i]. Now w ...

  6. 关于阻止百度滥用cookies的想法

    Chrome浏览器支持禁止指定的cookies,因此可以作为阻止百度滥用cookies的突破口,最好的方案应该是制作chrome插件(国内厂商的浏览器基本都是基于谷歌开源的 Chromium计划,基本 ...

  7. Linux挖矿程序kworkerds分析

    0×00 背景概述 近日,同伴的一台Linux服务器中了kworkerds挖矿程序,随即对挖矿程序进行了处理与分析. 0×01服务器现状 进入服务器之后通过top命令,没有发现有占用CPU资源过高的进 ...

  8. 微信小程序子组件样式不起作用的解决办法

    今天我在编写微信小程序项目时,发现父组件引用子组件过后,子组件的样式不起作用,在上网查了很多解决办法后,成功解决了这一问题. 解决办法: 1.在全局样式文件app.wxss中引入子组件的样式,如 @i ...

  9. Deep Learning专栏--FFM+Recurrent Entity Network的端到端方案

    很久没有写总结了,这篇博客仅作为最近的一些尝试内容,记录一些心得.FFM的优势是可以处理高维稀疏样本的特征组合,已经在无数的CTR预估比赛和工业界中广泛应用,此外,其也可以与Deep Networks ...

  10. logger.error打印完整的错误堆栈信息

    使用Spring Boot项目中的日志打印功能的时候,发现调用Logger.errror()方法的时候不能完全地打印出网站的错误堆栈信息,只能打印出这个错误是一个什么错误. 为什么呢,原因在于这个方法 ...