文本搜索grep知识点总结
文本搜索工具:grep, egrep
根据用户指定的模式对目标文件进行过滤,显示被模式匹配到的行
grep [OPTION]... 'PATTERN' FILE...
--color
难点在于模式如何书写,模式主要是应用正则表达式
正则表达式:由一类字符书写的模式,其中有些字符不表示字符的字面意义,
而是表示控制或者统配的功能
元字符:*, ?等
两类:
基本正则表达式
扩展正则表达式
基本正则表达式:
字符匹配:
.: 匹配任意单个字符
例如:grep --color 'r..t' /etc/passwd
匹配到r开头,t结尾,中间间隔两个字符的行
[]:匹配指定集合中任意单个字符
[[:digit:]],[0-9]
[[:lower:]],[a-z]
[[:upper:]],[A-Z]
[[:alpha:]],[a-zA-Z]
[[:alnum:]],[0-9a-zA-Z]
[[:space:]]
[[:punct:]]
例如:grep --color 'abcd[[:digit:]][[:digit:]][0-9]' test
匹配以abcd开头,后边跟三个数字的行
[^]:匹配指定集合外的任意单个字符
例如:grep --color 'abcd[^[:digit:]]' test
grep --color 'abcd[^0-9]' test
匹配以abcd开头,后边不是数字的行
匹配次数:用于对其前面紧邻的字符所能够出现的次数作出限定
*:匹配其前面的字符任意次,0,1或多次
例如:grep 'x*y'
xy,xxy,xxxy,y
\?:匹配其前面的字符0次或1次,其中的\为转义字符,即转移?
例如:grep 'x\?y'
xy,xxy,y,xxxy,aby 对于xxy而言,确实匹配到了xy,第一个x是被忽略的
\+:匹配其前面的字符出现至少一次
例如:grep 'x\+y'
xy,xxy,xxxy
\{m\}:匹配前面字符m次
例如:grep 'x\{2\}y'
xxy,xxxy
\{m,n\}:匹配其前面字符至少出现m次,至多出现n次
例如:grep 'x\{2,4\}y'
xxy, xxxy
grep 'x\{2,\}y'
xxy,xxxy
.*:匹配任意长度的任意字符
位置锚定:
^: 行首锚定
写在模式的最左侧
例如:grep --color '^abcd' /etc/passwd
匹配以abcd开头的行
$: 行尾锚定
写在模式的最右侧
例如:grep --color '[0-9]$' /etc/passwd
匹配以数字结尾的行
^$:空白行
例如:grep --color '^$' /etc/passwd
匹配空白行
\<: 词首锚定, \b, \为转义字符
出现在要查找的单词模式的左侧,\<char
例如:grep --color '\<r' /etc/passwd
匹配以r开头的单词
\>: 词尾锚定, \b,\为转义字符
出现在要查找的单词模式的右侧,char\>
例如:grep --color 'tor\>' /etc/passwd
匹配以tor结尾的单词
\<pattern\>:匹配单词
例如:grep --color '\<root\>' /etc/passwd
匹配单词root
分组:
\(\)
后向引用:模式中,如果使用\(\)实现了分组,在某行文本的检查中,
如果\(\)的模式匹配到了某内容,此内容后面的模式中可以被引用;
\1,\2,\3
模式自左向右,引用第#个左括号以及与其匹配右括号之间的模式匹配到的内容
例如:grep --color 'ab\{1,\}y' test
a与y之间至少一次b
grep --color '\(ab\)\{1,\}y' test
y之前至少一次ab
grep --color '\(ab\)\{1,\}y\1' test
y之前至少一次ab,且后边引用第一个分组
grep --color '\(ab\)\{1,\}y\2' test
y之前至少一次ab,且后边引用第二个分组
grep选项:
-v: 反向选取,即显示模式匹配之外的行
例如:grep -v --color 'abcd' test
显示abcd之外的行
-o: 仅显示匹配到的内容
-i: 忽略字符大小写
-n: 匹配的同时显示行号
-E: 使用扩展正则表达式
-A #:匹配到的下边#行
例如:grep -A 2 --color 'abcd' test
显示匹配abcd的行及其下边两行,共三行
-B #:匹配到的上边#行
-C #:匹配到的上下边#行
egrep及扩展的正则表达式
扩展正则表达式的元字符
字符匹配:
.
[]
[^]
匹配次数限定:
*
?: 匹配其前面字符0次或1次
+:匹配其前面字符至少1次
{m}:匹配其前面字符m次
{m,n}:{m,},{0,n}
锚定:
^
$
\<, \>: \b
分组:
()
支持后向引用:\1, \2...
或者:
a|b: a或者b
ab|cd:
例如: egrep --color 'ab|c' test
grep --color 'ab\|c' test
匹配含有ab或者c的行
grep --color 'a\(b\|c\)' test
匹配含有ab或者ac的行
例如:grep -E 'PATTERN' FILE...
egrep 'PATTERN' FILE...
文本搜索grep知识点总结的更多相关文章
- CentOS 文本搜索grep
grep 用于在文本中执行关键词搜索, 用法: grep [选项]... PATTERN [FILE]... [root@bigdata-senior01 ~]# grep "ftp&quo ...
- 整理grep实战文本搜索过滤技巧
一:grep的简介: 文本搜索工具,根据用户指定的文本模式对目标文件进行逐行搜索,显示能够被模式所匹配到的行.配合正则表达式的使用可以实现强大的文本处理.下面一一说明正则的例子. 二:文本处理工具分类 ...
- [linux] grep 文本搜索工具
grep [option] pattern file Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep全称是Global Regular ...
- shell脚本学习指南-grep文本搜索命令-学习(3)
1.作用 Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全 ...
- grep文本搜索工具详解
############grep命令############这个命令属于文本处理三大命令之一,强大的文本搜索工具(贪婪模式)全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达 ...
- 二、grep文本搜索工具
grep命令作为Unix中用于文本搜索的神奇工具,能够接受正则表达式,生成各种格式的输出.除此外,它还有大量有趣的选项. # 搜索包含特定模式的文本行: [root@centos8 ~]#grep p ...
- 基于文本图形(ncurses)的文本搜索工具 ncgrep
背景 作为一个VIM党,日常工作开发中,会经常利用grep进行关键词搜索,以快速定位到文件.如图: 利用grep进行文本搜索 但是,这一过程会有两个效率问题: 展示的结果无法进行直接交互,需要手动粘贴 ...
- linux下的文本操作之 文本查找——grep
摘要:你有没有这样的应用场景:调试一个程序,出现debug的提示信息,现在你需要定位是哪个文件包含了这个debug信息,也就是说,你需要在一个目录下的多个文件(可能包含子目录)中查找某个字符串的位置: ...
- (办公)记事本_grep文本搜索命令
参考谷粒学院的linux视频教程:http://www.gulixueyuan.com/course/300/task/7091/show grep文本搜索命令:[是一种强大的文本搜索工具,它能使用正 ...
随机推荐
- Azure service bus Topic基本用法
我们在升级一个POS系统的时候,决定使用微软公有云计算平台下的Azure ServiceBus 进行POS客户端与服务器的交互. 本文主要时作者在学习使用 Azure SDK for .NET 操作由 ...
- 工作的时候 用到了 获取时间 DateTime 整理了一下
获得当前系统时间: DateTime dt = DateTime.Now; Environment.TickCount可以得到“系统启动到现在”的毫秒值 DateTime now = DateTime ...
- freertos之队列
任务间信息的传递是通过队列来实现的(单个值.结构体.共享数据指针.),队列是个独立的内核对象,即不属于任何一个任务,每个任务都可以向队列中发送数据和从队列中读数据.对于数据量小的场合通常队列是通过字节 ...
- jdk1.8源码包下载并导入到开发环境下助推高质量代码(Eclipse、MyEclipse和Scala IDEA for Eclipse皆适用)(图文详解)
不多说,直接上干货! jdk1.8 源码, Linux的同学可以用的上. 由于源码JDK是前版本的超集, 所以1.4, 1.5, 1.6, 1.7都可以用的上. 其实大家安装的jdk路径下,这 ...
- HTML 5的革新——更简洁的结构
今天我们阐述HTML 5的革新之一:更简洁的结构. 新的文档类型 DOCTYPE 先来解释一下文档类型 DOCTYPE:文档类型位于HTML源文件的第一行,在HTML4的标准中,DOCTYPE在被归在 ...
- Java编程简介
作者:CHAITANYA SINGH 来源:https://www.koofun.com//pro/kfpostsdetail?kfpostsid=3 JAVA由Sun Microsystems In ...
- Java语言中自动生成随机数
参考原文:http://zhidao.baidu.com/link?url=nB3BT69wmUAiSPfKGgK5Q7HOFFP9AIE04AthreRd9yYcwKhUQsQRWlMdMhW1Qm ...
- 如何加快HTML页面加载速度
1. 页面减肥 a. 页面的肥瘦是影响加载速度最重要的因素. b. 删除不必要的空格.注释. c. 将inline的script和css移到外部文件. d. 可以使用HTML Tidy来给HTML减肥 ...
- KVC/KVO 本质
KVO 的实现原理 KVO是关于runtime机制实现的 当某个类的对象属性第一次被观察时,系统就会在运行期动态地创建该类的一个派生类,在这个派生类中重写基类中任何被观察属性的setter方法.派生类 ...
- 将从SQL2008 r2里备份的数据库还原到SQL2008中
从标题可以看出这是未解决上一篇遗留问题写的,现在我也不知道这个可不可以成功,方法似乎查到了一种,具体怎样还不清楚:而且,我想说的是“我踩雷了”. 这篇的主角是“Database Publishing ...