grep

grep全称:Globally search a Regular Expression and Print 全局搜索正则表达式

正规表达式本质上是一种"表示方法", 只要工具程序支持这种表示方法,那么该工具就可以使用正则表达式处理字符串。 例如 vi, grep, awk ,sed 等等工具,因为她们有支持正规表示法, 所以,这些工具就可以使用正规表示法的特殊字节来进行字串的处理。但例如 cp, ls 等命令并未支持正规表示法, 所以就只能使用 bash 自己本身的wildcards(通配符)。通配符与正则表达式是两个完全不同的东西,通配符只是bash提供的一个功能,正则表达式是一种字符串处理的表达方式。千万不要将而这混淆。

正则表达式在表示字符串时,依据不同的严谨程度可以分为基础正则表达式和扩展正则表达式。

grep在查找字符串的时候,是以整行为单位进行数据选取的。举例:一个文件有10行,其中2行包含匹配关键字,那么grep只输出命中的那两行,其他全部丢掉。

--color=auto   将匹配到的关键字高亮。一般来说这个不用我们指定,因为Linux distribution已经为我们alias指定好了。

-n:显示命中关键字在原文件中的行数

-v显示非关键字的那些行

[root@51cto ~]# cat uniqtest -n
wang student
wang student
han teacher
liu teacher
zhang student
wang student
[root@51cto ~]# grep "wang" uniqtest -v
han teacher
liu teacher
zhang student

-o只显示关键字

[root@51cto ~]# cat uniqtest -n
wang student
wang student
han teacher
liu teacher
zhang student
wang student
[root@51cto ~]# grep "wang" uniqtest -o
wang
wang
wang

-i 不区分大小写

[root@51cto ~]# cat uniqtest
wang student
wang student
han teacher
liu teacher
zhang student
wang student
Wang student
[root@51cto ~]# grep "wang" uniqtest -i
wang student
wang student
wang student
Wang student

-A# 将命中的那一行下面#行也显示出来;

-B#  将命中的那一行上面#行也显示出来。如果,则

-C#  前后都要显示#行

1只是做个例子,可以是任何数字

[root@51cto ~]# cat uniqtest
wang student
wang student
han teacher
liu teacher
zhang student
wang student
Wang student
[root@51cto ~]# grep "wang" uniqtest -A1
wang student
wang student
han teacher
--
wang student
Wang student

-q 安静模式,不现实任何输出

[root@localhost ~]# cat >a.txt <<EOF
> nihao
> nihaooo
> hello
> EOF
[root@localhost ~]# if grep -q hello a.txt ; then echo yes;else echo no; fi
yes
[root@localhost ~]# if grep -q word a.txt; then echo yes; else echo no; fi
no

-E 表示后面的表达式是扩展的正则表达式

基本正则表达式

参考:bash功能——命令行编辑、内部命令 外部命令、命令补全 、命令历史、文件名通配符、命令别名 文件名通配符

文件名通配符

* 代表任意长度任意字符

代表任意单个字符

[] 指定范围的任意单个字符

[^ ] 指定范围外的任意单个字符

正则表达式元字符

. 匹配任意单个字符

[] 匹配指定范围内的任意单个字符

[^ ] 匹配指定范围外的任意单个字符

正则表达式匹配次数

+ 匹配前面≥1次

* 匹配前一个字符≥0次

? 匹配前一个字符0次或1次

\{m,n\} 匹配前一个字符最少m次 最多n次

  \{0,n\} 最多n次

  \{m\}  最少m次

更新——Thu Jun 14 22:20:33 EDT 2018

上面这个结果一直不理解,今天突然对这个问题有了新的理解

以前我的理解(错误的)

a[a-z]\{0,2\}c        a后面跟26个字母中任何一个,后面\{0,2\}限定这个字母出现次数(0-2次)。那么这样的话asssc也应该命中,但实际上没有,这个困扰我好久

现在理解(正确)

a[a-z]\{0,2\}c       [a-z]\{0,2\}应该看成一组一起理解,这一组可以表示aa,ab这种,加下图

更新——Thu Jun 14 22:20:33 EDT 2018

任意长度任意字符 .*

 分组匹配

[root@51cto ~]# cat student
zhangsan,math=good,english=band
hanligang,math=good,english=good
yixiu,math=bad,english=good
xiaomo,math=bad,english=bad,music=good,geography=good
yuanzi,math=good,english=bad,music=good,geography=good

匹配数学、英语成绩一样的人(即数学好英语就好,数学坏英语就坏)使用了向后引用

grep '.*,math=\(.*\),english=\1' student --color

匹配数学成绩和英语成绩一样,音乐成绩和地理成绩一样。使用了向后引用

grep '.*,math=\(.*\),english=\1,music=\(.*\),geography=\2' student --color

锚定符

[root@51cto ~]# cat re.txt
root chroot rooter
this is root
there is chroot

\<  锚定词首

\>  锚定词尾

\<  \> 锚定单词

^ 锚定行首

$ 锚定行尾

锚定行首 前面有空格的root开头的行

锚定行尾 有标点符号

字符类

POSIX定义了一些只能在正则表达式中使用的字符类

alnum   字母和数字

alpha 字母

blank 仅表示空格或制表符

cntrl   控制字符

digit   十进制数

graph 打印字符,不包含空格

lower 小写字母

print   打印字符,包含空格

punct 打印字符,不包含字母和数字

space   空白

upper   大写字母

xdigit                十六进制数

使用方法:

[[:space:]]

[[:digit:]]

[[:alpha:]]

echo '.,.,?.!123abcABC  abcA123..?1 2' | grep '[[:punct:]]\{4,8\}[[:digit:]]\{1,3\}[[:lower:]]*[[:upper:]]*[[:space:]]*[[:graph:]]*' --color=auto

扩展正则表达式

扩展正则表达式元字符(与基本正则表达式一样)

.

[]

[^]

匹配次数

*

+ 至少匹配一次

{m,n} 括号前不需要转义字符\

锚定符

^ 行首锚定

$ 行尾锚定

\< 词首锚定新增  \b

\> 词尾锚定新增  \b

或者

表示符号  |

分组

分组不用转义

查找a=c b=d的行

echo 'a=10b=20c=10d=20' | egrep 'a=(..)b=(..)c=\1d=\2' --color

这里使用的都是egrep,使用grep -E效果是一样的

 fgrep

不解析正则表达式 直接搜索文本

写正则表达式需要注意的两点

1.       转义字符 \

将正则表达式中元字符 转换成字符本身

2.       如果正则表达式中有命令替换 正则表达式只能使用” ”弱引用

如果正则表达式中没有命令替换 ‘ ’ “”

bash基础——grep、基本正则表达式、扩展正则表达式、fgrep的更多相关文章

  1. linux正则表达式(基础正则表达式+扩展正则表达式)

    正则表达式应用非常广泛,例如:php,Python,java等,但在linux中最常用的正则表达式的命令就是grep(egrep),sed,awk等,换句话 说linux三剑客要想能工作的更高效,就一 ...

  2. Linux学习笔记之grep命令和使用正则表达式

    0x00 正则表达式概述 正则表达式是描述一些字符串的模式,是由一些元字符和字符组成的字符串,而这些元字符是一些表示特殊意义的字符,即被正则表达式引擎表达的字符表示与其本意不同的一些字符. 0x01  ...

  3. egrep及扩展正则表达式 与正则表达式不同处

    egrep及扩展正则表达式与正则表达式不同处 正则表达式有两类,分为基本正则表达式和扩展正则表达式,是使用命令egrep来使用扩展正则表达式,它与grep很多功能相同,仅在元字符上实现了些扩展扩展,在 ...

  4. shell基础 -- grep、sed、awk命令简介

    在 shell 编程中,常需要处理文本,这里介绍几个文本处理命令. 一.grep 命令 grep 命令由来已久,用 grep 命令来查找 文本十分方便.在 POSIX 系统上,grep 可以在两种正则 ...

  5. Linux通配符与基础正则表达式、扩展正则表达式

    在Linux命令行操作或者SHELL编程中总是容易混淆一些特殊字符的使用,比如元字符‘*’号,作为通配符匹配文件名时表示0个到无穷多个任意字符.而作为正则表达式匹配字符串时,表示重复0个到无穷多个的前 ...

  6. 『忘了再学』Shell基础 — 25、扩展正则表达式

    目录 1.扩展正则表达式说明 2.练习 (1)+和?练习 (2)|和()练习 3.注意(重点) 1.扩展正则表达式说明 熟悉正则表达式的童鞋应该很疑惑,在其他的语言中是没有扩展正则表达式说法的,在Sh ...

  7. 正则表达式RE与扩展正则表达式ERE——grep与egrep

    grep 正则表达式规则: ^ 行首定位符,表示从行首开始进行模式匹配 . 一个非换行符的字符 [ ] 匹配属于此集合的任意一个字符 [^ ] 匹配不属于此集合的任意一个字符 [a-z] (其指定的集 ...

  8. Bash 通配符、正则表达式、扩展正则表达式

    BASH中的通配符(wildcard) *:任意长度的任意字符. ?:任意单个字符 []:匹配范围 [^]:排除匹配范围 [:alnum:]:所有字母和数字 [:alpha:]:所有字母 [:digi ...

  9. grep命令及基本正则表达式

    grep命令是Linux系统中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功 ...

随机推荐

  1. 从成员函数指针生成可调用对象:function<>、mem_fn()和bind()

    我们知道,普通函数指针是一个可调用对象,但是成员函数指针不是可调用对象.因此,如果我们想在一个保存string的vector中找到第一个空string,不能这样写: vector<string& ...

  2. 第二十二章 集成验证码——《跟我学Shiro》

    目录贴:跟我学Shiro目录贴 在做用户登录功能时,很多时候都需要验证码支持,验证码的目的是为了防止机器人模拟真实用户登录而恶意访问,如暴力破解用户密码/恶意评论等.目前也有一些验证码比较简单,通过一 ...

  3. iOS-UITabbar自定义

    [self createCustomTabBar]; -(void)createCustomTabBar{    //创建一个UIImageView,作为底图    UIImageView *bgVi ...

  4. iOS-UITextField和UITextView隐藏键盘

    UITextField和UITextView隐藏键盘 71 views, IOS DEV, by admin. self._textField.returnKeyType=UIReturnKeyDon ...

  5. iOS摄像头和相册(转)

    iOS摄像头和相册iOS 获取图片有三种方法1. 直接调用摄像头拍照 2. 从相册中选择 3. 从图库中选择 UIImagePickerController 是系统提供的用来获取图片和视频的接口: 用 ...

  6. [转载]Oracle触发器用法实例详解

    本文实例讲述了Oracle触发器用法.分享给大家供大家参考,具体如下: 一.触发器简介 触发器的定义就是说某个条件成立的时候,触发器里面所定义的语句就会被自动的执行. 因此触发器不需要人为的去调用,也 ...

  7. 【转帖】循序渐进Oracle:数据库的字符集和字符集文件

    循序渐进Oracle:数据库的字符集和字符集文件 https://blog.csdn.net/Enmotech/article/details/100869162 2019年09月15日 18:23: ...

  8. 题解 luoguP3554 【[POI2013]LUK-Triumphal arch】

    代码的关键部分 inline void dfs(int u,int fa) { ; for(int i=first[u]; i; i=nxt[i]) { int v=go[i]; if(v==fa)c ...

  9. windows和linux环境下使用google的glog日志库

    一.概述 glog是google推出的一款轻量级c++开源日志框架,源码在github上,目前最新release版本是v0.3.5. githut地址:https://github.com/googl ...

  10. vmware安装win7*64位时,安装不成功的关键点是光驱接口类型选择为IDE模式

    mware 安装win7*64时,找不到光盘,后来在xin7*64的虚拟机下的编辑虚拟机设置 找到光驱,点击高级,并选择IDE即可,这样就可以进入虚拟机找到光驱和硬盘到了.进入winpe后可以看到各种 ...