一、正则表达式

正则表达式:Regual Expression, REGEXP。
由一类特殊字符及文本字符所编写的模式,其中有些字符不表示其字面意义,而是用于表示控制或通配的功能;
基本正则表达式:BRE
扩展正则表达式:ERE

1.基本正则表达式的元字符

1.1 字符匹配:

. :匹配任意单个字符
[]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
[:digit:] 数字
[:lower:] 小写字母
[:upper:] 大写字母
[:alpha:] 字母
[:alnum:] 数字
[:punct:] 标点符号
[:space:] 垂直或水平的空白字符

1.2 匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数;

*:匹配前面的字符任意次,包括0次;默认工作在贪婪模式(尽可能长的匹配)
.:任意单个字符
.*:任意长度的任意字符
?:匹配前面的字符0次或1次
\+:匹配前面的字符至少1次
\{n\}:匹配前面的字符n次
\{n,m\}:匹配前面的字符n至m次
  \{n,\}:匹配前面的字符至少n次
  \{,m\}:匹配前面的字符至多m次

1.3 位置锚定:定位要锚定的字符出现的位置

  • ^(脱字符):行首锚定,用于匹配模式的最左侧
  • $:行尾锚定,用于匹配模式的最右侧
    • ^$:空行
    • ^[[:space:]]$:空白行(空行或含有空白字符的行)
    • ^PATTERN$:用于PATTERN来匹配整行
  • \< 或\b 词首锚定,用于单词模式的左侧
  • \> 或\b 词尾锚定,用于单词模式的右侧
  • \bPATTERN\b 或<PATTERN> 匹配整个单词
    注意:非特殊字符组成的连续字符(字符串)都称为单词;

1.4 分组及引用:\(\) 将一个或多个字符捆绑在一起,当做一个整体进行处理;如\(root\)\+,表示将root分为一组,且匹配至少1次

后向引用:引用前面的分组括号中的模式所匹配字符(而非模式本身)

注:分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为:\1,\2,\3

\1:模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
\2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
\3:

示例:\(string1\+\(string2\)\)
\1:(string1+(string2)
)
\2:(string2)

\(ab\+\(xy\)*\)

\1:ab\+\(xy\)*

\2:xy

二、grep、egrep、fgrep(不支持正则表达式)

grep:Global search REgular expression and Print out the line.
作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文本逐行进行匹配检查;打印匹配到的行;
模式:由正则表达式字符及文本字符所编写的过滤条件

grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
# option:
--color=auto:对匹配到的文本着色后高亮显示;
-i:ignorecase,忽略字符的大小写;
-o:仅显示匹配到的字符串本身;
-w:显示匹配到的整个单词
-v, --invert-match:反向选择(显示不能被模式匹配到的行);
-e:实现多个选项间的逻辑or关系
-n:显示匹配的行号
-c: 统计匹配的行数
-E:支持使用扩展的正则表达式元字符;
-q, --quiet, --silent:静默模式,即不输出任何信息;
-A :after, 后5行
-B :before,前5行
-C :context,前后各5行

扩展匹配:egrep=grep -E

字符匹配
  .
  []
  [^] 次数匹配

*:匹配前面的字符任意次,包括0次;默认工作在贪婪模式(尽可能长的匹配) .:任意单个字符 .*:任意长度的任意字符 ?:匹配前面的字符0次或1次 +:匹配前面的字符至少1次 {n}:匹配前面的字符n次 {n,m}:匹配前面的字符n至m次

锚定:
  ^
  $
  \>,\b
  \<,\b
分组:
  () 注不需要转义
  后向引用:\1,\2,... 或者:|   示例:
  a|b :a或b
  C | cat:C或cat
  (C|c)at:Cat或cat

1、显示/etc/passwd文件中不以/bin/bash结尾的行;
  grep -v "/bin/bash$" /etc/passwd

2、找出/etc/passwd文件中的两位数或三位数;
  grep "\<[0-9]\{2,3\}\>" /etc/passwd

  grep "\<[[:digit:]]\{2,3\}\>" /etc/passwd

3、找出/etc/rc.d/rc.sysinit或/etc/grub2.cfg文件中,以至少一个空白字符开头,且后面非空白字符的行;
  grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg

4、找出"netstat -tan"命令的结果中以'LISTEN'后跟0、1或多个空白字符结尾的行;
   netstat -tan | grep "LISTEN[[:space:]]*$"



1、找出/proc/meminfo文件中,所有以大写或小写S开头的行;至少有三种实现方式;

  • grep -i "^s" /proc/meminfo
  • grep "^[sS]" /proc/meminfo
  • grep -E "^(s|S)" /proc/meminfo

2、显示当前系统上root、centos或user1用户的相关信息;
  grep -E "^(root|centos|user1)\>" /etc/passwd | cut -d: -f1,3,7

显示/etc/passwd文件中ID号最大的用户的用户名

  sort -t: -k3 -n /etc/passwd | tail -1 |cut -d: -f1

如果用户root存在,显示其默认的shell程序

  id root &> /dev/null && grep "^root\>" /etc/passwd |cut -d: -f7

3、找出/etc/rc.d/init.d/functions文件中某单词后面跟一个小括号的行;
  grep -E -o "[_[:alpha:]]+\(\)" /etc/rc.d/init.d/functions

4、使用echo命令输出一绝对路径,使用egrep取出基名;
  echo /etc/sysconfig/ | grep -E -o "[^/]+/?$" | cut -d "/" -f1

  进一步:取出其路径名;类似于对其执行dirname命令的结果;

  echo /etc/sysconfig/ | grep -E -o "^[/]+[[:alpha:]]*"

5、找出ifconfig命令结果中的1-255之间的数值;
   ifconfig | grep -E -o "\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"

6、课外作业:找出ifconfig命令结果中的IP地址;
  ifconfig | egrep -o "([0-9]{1,3}.){3}[0-9]{1,3}" --color=auto

7、添加用户bash, testbash, basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
  grep -E "^\([[:alnum:]]+\>\).*\1$" /etc/passwd

  grep -E "^\([^:]+\>\).*\1$" /etc/passwd

六、grep与正则表达式 (文本过滤)的更多相关文章

  1. Linux文本处理三剑客之grep及正则表达式详解

    Linux文本处理三剑客之grep及正则表达式详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Linux文本处理三剑客概述 grep: 全称:"Global se ...

  2. 第5天(半天)【shell编程初步、grep及正则表达式】

    第5天(半天)[shell编程初步.grep及正则表达式] shell编程初步(01)_recv shell脚本:文本文件 #!:/bin/bash #!:/usr/bin/python #!:/us ...

  3. Linux grep与正则表达式

    grep命令         格式:grep [-acinv] [--color=auto] '查找字符串' filename -a 将binary文件以text文件的 -c 计算找到 ‘查找字符串’ ...

  4. grep和正则表达式

    正则表达式示例表字 符 意 义 示 例* 任意长度的字符串. a* 表示: 空字符串.aaaa.a…? 长度为0或者1的字符串. a? 表示: 空字符串和a.+ 长度为一个或者多个的字符串. a+表示 ...

  5. grep与正则表达式,grep、egrep和fgrep

    grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同!正则表达式只是一种表示法,只要工具支持这种表示法, 那么该工具就可以处理正则表达式的字符串. ...

  6. [Linux 006]——grep和正则表达式

    在使用系统时,我们或多或少的有一些搜索.查找的需求,必须要在文本中搜索某个关键字,或者过滤出文本中某些特定的行.grep 命令就为我们提供了这样一个功能,同时,grep 还可以使用正则表达式进行匹配, ...

  7. grep与正则表达式使用

    grep简介 grep 是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.通常grep有三种版本grep.egrep(等同于grep -E)和fgrep.egrep为扩展的g ...

  8. grep用法详解:grep与正则表达式【转】

    转自:http://blog.csdn.net/hellochenlian/article/details/34088179 grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配 ...

  9. linux初级学习笔记十:linux grep及正则表达式!(视频序号:04_4)

    本节学习的命令:grep 本节学习的技能: grep对文本的匹配 正则表达式的使用 知识点十:grep及正则表达式(4_4) grep,egrep,fgrep: grep: 根据模式搜索文本,并将符合 ...

  10. grep使用正则表达式搜索IP地址

    递归搜索当前目录及其子目录.子目录的子目录……所包含文件是否包含IP地址 grep -r "[[:digit:]]\{1,3\}\.[[:digit:]]\{1,3\}\.[[:digit: ...

随机推荐

  1. 通过DBCC Page查看在SQL Server中哪行数据被锁住了?

    原文:通过DBCC Page查看在SQL Server中哪行数据被锁住了? 如何查看被锁的是哪行数据?通过dbcc page可以. 要想明白这个问题: 首先,需要模拟阻塞问题,这里直接模拟了阻塞问题的 ...

  2. python练习:函数4

    ''' 1.定义一个func(name),该函数效果如下. assert func("lilei") = "Lilei" assert func("h ...

  3. C#基础--Ref与Out区别

    两者都是按地址传递的,使用后都将改变原来参数的数值. class Program { static void Main(string[] args) { int num = 1; Method(ref ...

  4. Go 修改字符串中的字符(中文乱码)

    问题复现:修改字符串的第一个中文 先对原字符串做切片,然后进行拼接,得到新的字符串 func ModifyString(str string) string { tempStr := str[1:] ...

  5. h5获取地理坐标

    h5获取地理坐标 方法:h5自带获取地理信息的api api:navigator.geolocation.getCurrentPosition https://developer.mozilla.or ...

  6. Microsoft Internet Explorer v11 XML External Entity Injection 0day

    [+] Credits: John Page (aka hyp3rlinx) [+] Website: hyp3rlinx.altervista.org[+] Source:  http://hyp3 ...

  7. iOS中的分类(category)和类扩展(extension)

    今天在研究swift的时候看到了分类和扩展.这是两个十分重要有用的功能,但是之前用的不多,没有深入了解过,在今天就从头理一遍. 一.分类(Category): 概念: 分类(Category)是OC中 ...

  8. 数据库之sqlite

    数据创建数据 CREATE TABLE IF NOT EXISTS ArpAudit (ID INTEGER PRIMARY KEY autoincrement NOT NULL, UserName ...

  9. xposed获取类的属性成员

    XposedBridge.log("开始获取属性:"); Field[] fields = param.thisObject.getClass().getDeclaredField ...

  10. 持续集成工具FinalBuilder使用心得

    FinalBuilder 使用这款自动化创建和发布管理工具,软件开发者可以定义和维护一个可靠的以及可重复创建的程序.FinalBuilder包括集成的带有版本的控制系统,文件和目录选项,重复器,源代码 ...