文件及内容处理 - grep(egrep)、join

1. grep(egrep):文本过滤工具

grep(egrep)命令的功能说明

grep命令是Linux系统中最重要的命令之一,其功能是从文本文件或管道数据流中筛选匹配的行及数据,如果配合正则表达式技术一起使用,则功能更加强大。egrepgrep 的扩展正则,后面讲三剑客时会讲的。

grep命令的语法格式

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
grep [-abcEFGhHilLnqrsvVwxy][-A][-B][-C][-d][-e][-f][--help][范本样式][文件或目录...]

grep命令的常用参数说明:

grep 参数很多,表1为 grep 命令的参数及说明:

表1: grep 命令的参数及说明

参数选项 解释说明
-a 或 --text 不要忽略二进制的数据。
-A 或 --after-context= 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
-b 或 --byte-offset 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
-B 或 --before-context= 除了显示符合样式的那一行之外,并显示该行之前的内容。
-c 或 --count 计算符合样式的列数。
-C 或 --context=或- 除了显示符合样式的那一行之外,并显示该行之前后的内容。
-d 或 --directories= 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e 或 --regexp= 指定字符串做为查找文件内容的样式。
-E 或 --extended-regexp 将样式为延伸的普通表示法来使用。
-f 或 --file= 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
-F 或 --fixed-regexp 将样式视为固定字符串的列表。
-G 或 --basic-regexp 将样式视为普通的表示法来使用。
-h 或 --no-filename 在显示符合样式的那一行之前,不标示该行所属的文件名称。
-H 或 --with-filename 在显示符合样式的那一行之前,表示该行所属的文件名称。
-i 或 --ignore-case 忽略字符大小写的差别。
-l 或 --file-with-matches 列出文件内容符合指定的样式的文件名称。
-L 或 --files-without-match 列出文件内容不符合指定的样式的文件名称。
-n 或 --line-number 在显示符合样式的那一行之前,标示出该行的列数编号。
-o 或 --only-matching 只显示匹配PATTERN 部分。
-q 或 --quiet或--silent 不显示任何信息。
-r 或 --recursive 此参数的效果和指定"-d recurse"参数相同。
-s 或 --no-messages 不显示错误信息。
-v 或 --revert-match 显示不包含匹配文本的所有行。
-V 或 --version 显示版本信息。
-w 或 --word-regexp 只显示全字符合的列。
-x --line-regexp 只显示全列符合的列。
-y 此参数的效果和指定"-i"参数相同。

grep命令的实践操作

范例1: –v 参数实践

[root@oldboyedu  ~]#cat 1.txt
1
2
3
[root@oldboyedu  ~]# grep -v "2" 1.txt
1
3
[root@oldboyedu  ~]#

范例2: -n 参数实践

[root@oldboyedu  ~]# cat 2.txt
aa
aa
bb
cc
dd
ee
ff
bb
cc
dd
ee
ff
[root@oldboyedu  ~]# grep -n "cc" 2.txt
4:cc
9:cc
[root@oldboyedu  ~]#

范例3: -i参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep "c" 3.txt
cc
cA
[root@oldboyedu  ~]# grep -i "c" 3.txt
cc
cA
bC
[root@oldboyedu  ~]#

范例4: -E'--color'的参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei --color=auto "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]#

范例5: -c 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -c "c" 3.txt
2
[root@oldboyedu  ~]#

范例6: -o 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -o "c" 3.txt
c
c
c
[root@oldboyedu  ~]#

2. join:按两个文件的相同字段合并

join命令的功能说明

join 命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。

join命令的语法格式

join [OPTION]... FILE1 FILE2
join [-i][-a<1或2>][-e][-o][-t][-v<1或2>][-1][-2][--help][--version][文件1][文件2]

join命令的常用参数说明:

join 参数,表1为 join 命令的参数及说明:

表1: join 命令的参数及说明

参数选项 解释说明
-a<1或2> 除了显示原来的输出内容之外,还显示指令文件中没有相同栏位的行。
-e 若[文件1]与[文件2]中找不到指定的栏位,则在输出中填入选项中的字符串。
-i或--igore-case 比较栏位内容时,忽略大小写的差异。
-o 按照指定的格式来显示结果。
-t 使用栏位的分隔字符。
-v<1或2> 跟-a相同,但是只显示文件中没有相同栏位的行。
-1 连接[文件1]指定的栏位。
-2 连接[文件2]指定的栏位。
--help 显示帮助。
--version 显示版本信息。

join命令的实践操作

范例1: 连接两个文件。

--------------------------------------------------------------
==>首先查看 testfile_1、testfile_2 中的文件内容<==
--------------------------------------------------------------
[root@oldboyedu ~]# cat testfile_1
Hello 95
Linux 85
test 30
[root@oldboyedu ~]# cat testfile_2
Hello 2005
Linux 2009
test 2006 

--------------------------------------------------------------
==>然后使用join命令,将两个文件连接<==
--------------------------------------------------------------
[root@oldboyedu ~]#  join testfile_1 testfile_2
Hello 95 2005
Linux 85 2009
test 30 2006 

--------------------------------------------------------------
==>文件1与文件2的位置对输出到标准输出的结果是有影响的<==
--------------------------------------------------------------
[root@oldboyedu ~]# join testfile_2 testfile_1
Hello 2005 95
Linux 2009 85
test 2006 30

今天就写到这里,有什么疑问或出现什么错误,随时欢迎大神们发表评论指点迷津

Shell命令-文件及内容处理之grep(egrep)、join的更多相关文章

  1. Shell命令-文件及内容处理之more、less

    文件及内容处理 - more.less 1. more:分页显示文件内容 more命令的功能说明 more 命令类似 cat,不过会以一页一页的形式显示,更方便使用者逐页阅读,而最基本的指令就是按空白 ...

  2. Shell命令-文件及内容处理之diff、vimdiff

    文件及内容处理 - diff.vimdiff 1. diff:比较两个文件区别 diff命令的功能说明 diff命令用比较文件的差异.diff以逐行的方式,比较文本文件的异同处.如果指定要比较目录,则 ...

  3. Shell命令-文件及内容处理之cat、tac

    文件及内容处理 - cat.tac 1. cat:显示文件内容 cat命令的功能说明 cat命令用于连接多个文件并且打印到屏幕输出或重定向到指定文件中 cat命令的语法格式 cat [OPTION]. ...

  4. Shell命令-文件及内容处理之head、tail

    文件及内容处理 - head.tail 1. head:显示文件内容头部 head命令的功能说明 head 命令用于显示文件头部内容,默认执行 head 命令会输出文件开头的 10 行. head命令 ...

  5. Shell命令-文件及内容处理之cut、rev

    文件及内容处理 - cut.rev 1. cut:切割文件内容 cut命令的功能说明 cut 命令用于显示每行从开头算起num1 到 num2 的文字. cut命令的语法格式 cut [OPTION] ...

  6. Shell命令-文件及内容处理之wc,tr

    文件及内容处理 - wc.tr 1. wc:统计文件的行数.单词数或字节数 wc命令的功能说明 wc 命令用于计算字数.利用 wc 指令我们可以计算文件的字节数,字数,或是列数,若不指定文件名称,或是 ...

  7. Shell命令-文件及内容处理之vi、vim

    文件及内容处理 - vi.vim 1.Linux vi/vim 所有的 Unix Like 系统都会内建 vi 文书编辑器,其他的文书编辑器则不一定会存在. 但是目前我们使用比较多的是 vim 编辑器 ...

  8. Shell命令-文件及内容处理之split、paste

    文件及内容处理 - split.paste 1. split:分割文件为不同的小片段 split命令的功能说明 split 命令用于将一个文件分割成数个.该指令将大文件分割成较小的文件,在默认情况下将 ...

  9. Shell命令-文件及内容处理之sort、uniq

    文件及内容处理 - sort.unip 1. sort:对文件的文本内容排序 sort命令的功能说明 sort 命令用于将文本文件内容加以排序.sort 可针对文本文件的内容,以行为单位来排序. so ...

随机推荐

  1. [PHP] curl访问https与CA证书问题

    CA证书,用来在调用HTTPS资源的时候,验证对方网站是否是CA颁布的证书,而不是自己随便生成的 curl命令1.需要下载CA证书 文件地址是 http://curl.haxx.se/ca/cacer ...

  2. Java开发笔记(二十二)神奇的冒号

    Java中的标点符号主要有两类用途,一类是运算符,包括加号+.减号-.乘号*.除号/.取余号%.等号=.大于号>.小于号<.与号&.或号|.非号!.异或号^等等,另一类则是分隔符, ...

  3. 总结Linux下的软件安装

    安装软件的最佳实践 虽然我们知道Linux下安装软件有三种方式,分别是源代码安装,rpm包安装和yum安装,但是从可控性和结合自己目前的水平来说,优先选择以下两种方式安装程序. 1,使用rpm包安装 ...

  4. linux $参数

    $# 是传给脚本的参数个数 $0 是脚本本身的名字 $1 是传递给该shell脚本的第一个参数 $2 是传递给该shell脚本的第二个参数 $@ 是传给脚本的所有参数的列表 $* 是以一个单字符串显示 ...

  5. c#二进制移位运算符 "<<"及">>","&","|","^"

    移位运算符 & :按位与,其实与&&逻辑运算符有一致的地方: | :按位或,同样与||有类似的地方. ~:按位取反 ^:按位异或 <<:左移运算符 >> ...

  6. c/c++ 头文件的血案

    头文件的血案 不小心在一个头文件里,加了函数的定义,结果导致编译时,提示这个函数被重复定义:( Quote.h #ifndef __QUOTE_H__ #define __QUOTE_H__ #inc ...

  7. UGUI合批原理笔记

    可以通过Frame debugger查看每个drawcall绘制了哪些东西 UGUI源码下载地址:https://bitbucket.org/Unity-Technologies/ui/downloa ...

  8. Cs231n课堂内容记录-Lecture 7 神经网络训练2

    Lecture 7  Training Neural Networks 2 课堂笔记参见:https://zhuanlan.zhihu.com/p/21560667?refer=intelligent ...

  9. window.open模拟表单POST提交

    解决地址栏长度限制,隐藏参数,不在地址栏显示 项目 excel 导出中用到 将form的target设置成和open的name参数一样的值,通过浏览器自动识别实现了将内容post到新窗口中 var u ...

  10. 如何解决代码中if…else 过多的问题

    前言 if...else 是所有高级编程语言都有的必备功能.但现实中的代码往往存在着过多的 if...else.虽然 if...else 是必须的,但滥用 if...else 会对代码的可读性.可维护 ...