何谓正则表达式

正则表达式,又称正规表示法、常规表示法(Regular Expression,在代码中常简写为regex、regexp或RE),是一类字符所书写的模式,其中许多字符不表示其字面意义,而是表达控制或通配等功能。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。
正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,不表示其字面意义,而用于额外功能性描述。
 
正则表达式分类

正则表达式根据元字符的数量及功能不同又分为基本正则表达式(grep)和拓展正则表达式(egrep)。而grep和egrep同属于文本搜索工具,可根据用户指定的文本模式(搜索条件)对目标文件进行逐行搜索,显示能匹配到的行。用法上grep –E等同于egrep,与grep和egrep相似的文本搜索工具还有fgrep,因不支持使用正则表达式,所以不再单独介绍。
 
基本正则表达式(grep)
 
语法格式:grep[option]... 'PATTERN' FILE...
 
基本正则表达式元字符:
 
1.字符匹配:
    .:任意单个字符
    [ ]:匹配指定范围内的任意单个字符
    [0-9]:匹配单个数字
    [a-z]:匹配单个小写字母
[A-Z]:匹配单个大写字母
[[:digit:]]:匹配单个数字
[[:lower:]]:匹配单个小写字母
[[:upper:]]:匹配单个大写字母
[[:space:]]:匹配单个空白字符
[[:punct:]]:匹配单个标点符号
[[:alnum:]]:匹配单个字母或数字
[[:alpha:]]:匹配单个字母(不分大小写)
[^]:匹配范围外的任意单个字符
 
  2.次数匹配:
*:任意次(前面字符出现任意次)
\?:0次或1次(前面字符可有可无)
\{m\}: m次(前面字符出现m次)
\{m,n\}:至少m次,至多n次
\{m,\}:至少m次
\{0,n\}:至多n次
.*:任意长度的任意字符
 
  3.位置锚定:
^:行首锚定(写在模式最左侧)
$:行尾锚定(写在模式最右侧)
^$:空白行
\<,/b:词首锚定(出现于单词左侧)
\>,/b:词尾锚定(出现于单词右侧)
(注:不包含特殊字符的连续字符组成的串叫单词)
 
  4.分组
\( \):如\(ab\)*
(分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用)
 
  5.引用
\n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容
 
拓展正则表达式(egrep)
    语法格式:egrep [option] 'PATTERN' FILE...
 
拓展正则表达式元字符:
1.字符匹配:
 .:任意单个字符
 [ ]:匹配范围内的任意单个字符
 [^]:匹配范围外的任意单个字符
 
2.次数匹配:
*:任意次
?: 0或1次
+:至少1次
{m}: m次
{m,n}:至少m次,至多n次
{m,}:至少m次
{0,n}:至多n次
 
3.位置锚定:
^:行首锚定
$:行尾锚定
\<,\b:词首锚定
\>,\b:词尾锚定
^$,^[[:space:]]*$:空白行
 
4.分组:
( ):分组
12347|:或 
 
5.引用:
    \n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容
 
grep及egrep命令选项

-v: 反向选取
-o:仅显示匹配的字串,而非字串所在的行
-i:ignore-case,忽略字符大小写
-A:显示之后两行
-B:显示之前两行
-C:显示上下两行
 
用法

显示/proc/meminfo文件中以大写或小写S开头的行

显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户
 

显示/etc/passwd文件中其默认shell为/bin/bash的用户中ID号最大的用户
 

找出/etc/passwd文件中的一位数或两位数
 

显示/boot/grub/grub.conf中以至少一个空白字符开头的行
 

显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行
 

找出netstat -tan命令执行结果中以'LISTEN'结尾的行
 

找出当前系统上其用户名和默认shell相同的用户
 

显示当前系统上root或scholar用户的默认shell12
 

找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“()”行
 

使用echo命令输出一个路径,而后使用grep取出其基名
 

找出ifconfig命令结果中的1-255之间的数字

grep、egrep命令用法的更多相关文章

  1. Linux grep/egrep命令详解

    grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来 grep搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2. grep的规则表达式( ...

  2. Shell命令-文件及内容处理之grep(egrep)、join

    文件及内容处理 - grep(egrep).join 1. grep(egrep):文本过滤工具 grep(egrep)命令的功能说明 grep命令是Linux系统中最重要的命令之一,其功能是从文本文 ...

  3. grep egrep fgrep命令

    一.grep.egrep.fgrep命令 本文中主要介绍了linux系统下grep egrep fgrep命令和正则表达式的基本参数和使用格式.方法.(注释:文中fg代表例子,) 1.1.基本定义: ...

  4. [转] linux 查找文本过滤grep正则表达式命令详解用法

    grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用 ...

  5. ps命令用法

    转自:http://www.cnblogs.com/peida/archive/2012/12/19/2824418.html Linux中的ps命令是Process Status的缩写.ps命令用来 ...

  6. find命令用法

    关于查找 文件查找:     locate非实时查找:根据索引查找     find实时查找:根据文件的各种属性去找到相对应文件     根据文件的各种属性去找到相对应文件 文本搜索:     gre ...

  7. Linux grep常用命令

    在一个文件中同时查找多个字符串: 并集语法: grep -e 'pattern1 -e 'pattern2 file 或集语法: 1.grep -E 'pattern1|pattern2' file ...

  8. Ubuntu kill命令用法详解

    转自:Ubuntu kill命令用法详解 1. kill   作用:根据进程号杀死进程   用法: kill [信号代码] 进程ID   root@fcola:/# ps -ef | grep sen ...

  9. 【转载】grep,egrep,fgrep详解

    [转载自]http://blog.csdn.net/homking/article/details/6000711 egrep 等价于 grep -E fgrep 等价于 grep -F grep - ...

随机推荐

  1. js的常见函数

    var n=0.0145; n.toFixed(2);//保留两位小数 n.lastIndexOf('a');//检索字符串最后出现的位置 n.indexof("h");//检索字 ...

  2. instanceof 与typeof的用法

    通常来讲,使用 instanceof 就是判断一个实例是否属于某种类型.例如: var oStringObject = new String("hello world"); con ...

  3. C#事件-自定义事件的使用方法(转载)

    1.声明一个委托类 public delegate SomethingChangedHandler(object sender,EventArgs e); 2.在你的类中声明一个事件绑定到该委托 pu ...

  4. c++ 返回对象的引用要小心

    除非能保证返回对象的生命周期足够长. 一定不要返回临时对象的引用.

  5. 点滴积累【C#】---Highcharts图形统计

    效果: 思路: 后台获取数据!然后拼接为前台所要求的格式,再将拼接好的StringBuilder给了hidden控件! 然后前台获取JQuery获取Hidden的值,最后将值赋给图形! 代码: [前台 ...

  6. 开启ss-libev多用户

    原理:通过查看进程,得到命令及需要的参数,然后,在制作一个配置文件,pid文件随意写. 1.首先正常开启一个: /etc/init.d/shadowsocks-libev start 2.然后:利用查 ...

  7. tensorflow 之模型的保存与加载(一)

    怎样让通过训练的神经网络模型得以复用? 本文先介绍简单的模型保存与加载的方法,后续文章再慢慢深入解读. #!/usr/bin/env python3 #-*- coding:utf-8 -*- ### ...

  8. 蓝牙(CoreBluetooth)-概述

    蓝牙(CoreBluetooth)-概述 通过此框架可以让你的Mac和iOS应用程序与外部蓝牙设备通信 外部设备: 就是需要通过iOS App控制器的其他设备: 例如:心率检测仪.数字温控器 蓝牙通讯 ...

  9. asp.net出现的异常:"由于代码已经过优化或者本机框架位于调用堆栈之上,无法计算表达式的值" 的解决方法

    引用: https://support.microsoft.com/zh-cn/kb/312629 症状 如果您使用的Response.End. Response.Redirect或Server.Tr ...

  10. 【转载】【Pycharm编辑器破解步骤】之idea和Pycharm 等系列产品激活激活方法和激活码(附:Mac系统)

    感谢:雪中皓月的<idea和Pycharm 等系列产品激活激活方法和激活码> 第一种方法:使用现有的注册服务器 优点:快捷,方便,省事 缺点:经常被封杀,可能会面临经常激活的困扰 Lice ...