正则表达式用于处理文本,精通运用正则表达式可以有效的解决工作的效率

正则表达式有基础正则表达式和扩展正则表达式区别

grep支持基础的正则表达式,grep -E (egrep)支持扩展正则表达式

1、脱字符号(^)、美元符号($)

脱字符号和美元符号实质上匹配的是一个位置(即定位),分别锚定一行的行首(^)和一行的行尾($)

在这里详细说明一下理解正则表达式是习惯:

^hel

^锁定一行的开始,接下来是字符h,紧接着是字符e,最后是字符l

只要满足这个标准,至于小写字母 L 之后是否存在字符就不在考虑范围之内了,这样理解正则表达式就很容易了

2、字符组 []

字符组匹配的是一组字符集合中的一个字符(必须匹配到一个字符)。(字符组嵌套使用变化多)

例: gr[ea]y     意思是:先找到字符g,接下来是字符r,紧接着是字符e或者a,最后是字符y,[]内含义是或者的意思

显然,gr[ea]y 并不匹配gry,这是因为[ea]占用一个位置字符,如果没有gray或者grey,则命令反馈为空白

字符组中还包含两个元字符:-(连字符)和^(排除符号)

-(连字符)在字符组[]中只有在两个字符中间才是表示范围的意思,例:<H[1-6]>,表示匹配<H 1>、<H 2> 、<H 3> 。。。。。

同时多重范围也是允许的。[0-9A-F_!.?] 表示匹配一个数字、一个大写字母、下划线、感叹号、点、问号,字符组内的顺序无关紧要。

有人会问 ?字符(?)不是正则表达式,匹配前一个字符0个或者1个吗?怎么又是匹配?问号呢?  说明一下,字符组中符号-和^才是解释为正则表达式,其他都是普通字符

注意在字符组中,-和^也不是一定就是解释为正则表达式,位置很关键?如果-在[中括号后的第一个字符,那么就表示普通字符-,如果^不是[中括号后的第一个字符,也不表示排除的意思

第一个-连字符是解释为a到z的范围,第二个-仅仅解释为普通字符-,这样就匹配到了字符h-lo

排除型字符组(^)

[^ ]取代[ ],^在字符组内的含义是排除的意思,例[^3-6] 表示排除数字3 、4、5、6之外的所有字符,不仅包含了1、2、7.。。。数字,大小写字母,还包含了特殊字符.?!~等等

kal[^a] 匹配了kali,却没有匹配kal,这就是我之前说的字符组[]和[^]占用一个匹配位,如果kal之后没有字符是匹配情况的。

后面会结合字符组列举一些技巧

3、句点符号(.

表示用来匹配任意一个字符,空格也可以匹配

多选结构

4、字符 | 匹配任意子表达式

利用扩展正则表达式字符 | 可以筛选多个选项。例: “Bob|Robert”注意字符 | 两边没有空格,表示包含Bob或Robert字符串的行

多选结构的正则表达式字符 | 与字符组[]相似,字符 | 有或者的含义,同时字符组[]内的字符也有或者的含义,但是也有明显的区别:字符组[]仅仅占用一个字符位,而字符 | 两边却是完整的正则表达式

一般| 都结合()一起来使用

()实际上是确定的多选的范围,所以(a|e)与[ea]效果是一样的,同时如果去除(),gre|ad 则表示包含gre或ad的行

三种表达式,反映的效果都是一样,反斜杠用于屏蔽句点符号.

至于第三个表达式,尝试用上面理解正则表达式的方式解读一下:

(Fire|l)st\.[Ss]treet        首先查找包含字符串Fire或者L(小写)接下来查找Fire后面是否紧跟字符s和t(不是就排除),或者是L(小写)后面是否是紧跟s和t,再接下来是句点,接着句点之                后是否是大写s或者小写s,大小写s之后是treet

对于^(Geo|Je)ff(rey|ery) 表示开头字符是Geo或者Je,拆开就是^Geo、 ^Je

如果是^Geoff|Jeff(rey|ery) 是表示什么呢?   匹配一行开始是Geoff的行,或者包含字符串Jeffery或Jeffery的行

5、单词分界符\<和\>  有些egre不支持单词分界符

\<    针对单词,表示匹配单词的开头字符. \<the

\>    针对单词,表示匹配单词的结尾. the\>

与^$相似,只是^$针对行,\<和\>针对单词,所以\<the\> 表示匹配单词的开头为the,结尾也是the,也就是匹配单词the,所以是精准匹配单词

END

shell 正则表达式一的更多相关文章

  1. linux shell 正则表达式(BREs,EREs,PREs)差异比较

    linux shell 正则表达式(BREs,EREs,PREs)差异比较 则表达式:在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符 串的单个字符串.在很多文本编辑器或其他工具里 ...

  2. linux shell 正则表达式(BREs,EREs,PREs)的比较

    原文 :   linux shell 正则表达式(BREs,EREs,PREs)差异比较 在使用 linux shell的实用程序,如awk,grep,sed等,正则表达式必不可少,他们的区别是什么 ...

  3. 文本处理三剑客与shell正则表达式

    文本处理三剑客 提到对于文本的处理上,除了vim这个强大的编辑器之外,还有使用命令的形式去处理你要处理的文本,而不需要手动打开文本再去编辑.这样做的好处是能够以shell命令的形式将编辑和处理文本的工 ...

  4. shell(shell函数、shell正则表达式)

    本章内容 shell函数 shell正则表达式 1.shell函数 linux shell 可以用户定义函数,然后在shell脚本中可以随便调用. 格式: funname () { CMD #函数体 ...

  5. Shell 正则表达式详解

    Shell 正则表达式 什么是正则表达式? 正则表达式在每种语言中都会有,功能就是匹配符合你预期要求的字符串. 为什么要学正则表达式? 在企业工作中,我们每天做的linux运维工作中,时刻都会面对大量 ...

  6. 我们一起来学Shell - 正则表达式

    文章目录 什么是正则表达式 正则表达式元字符 正则表达式应用举例 POSIX 方括号表达式 POSIX 字符集列表: 我们一起来学Shell - 初识shell 我们一起来学Shell - shell ...

  7. [Shell]正则表达式与通配符

    ----------------------------------------------------------------------------------------- 正则表达式与通配符: ...

  8. Python/Shell 正则表达式与运用

    正则表达式用的地方是很多的.比如字符串处理过程中.最近遇到记录一下. 1. 比如在shell中 #!/bin/bash str="date:2017-11-28 os:centos blac ...

  9. Shell正则表达式和文本处理工具

    作业一:整理正则表达式博客 一.什么是正则 正则就是用一些具有特殊含义的符号组合而成(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 通配符是由shell解释得. ...

  10. shell 正则表达式与文件名匹配

    1) . : 匹配任意单ASCII 字符,可以为字母,或为数字. 2) 举例: ..XC..匹配deXC1t.23XCdf 等,.w..w..w.匹配rwxrw-rw- 行首以^匹配字符串或字符序列 ...

随机推荐

  1. Jenkins代码自动部署相关文档

    环境 centos 7.0+ Java JDK 1.8+ jenkins 2.220 maven 3.0+ git 1.8+ 注意事项 一. linux 安装 JDK (jdk-8u201-linux ...

  2. scrapy异常状态码处理

    scrapy异常状态码处理 在setting.py中加入 scrapy  的 state 默认只处理200到300之间 # 403状态的响应不被自动忽略,对403 的响应做个性化处理 HTTPERRO ...

  3. Javascript和Typescript语言类型

    静态语言(强类型语言) 静态语言是在编译时变量的数据类型即可确定的语言,多数静态类型语言要求在使用变量之前必须声明数据类型. 例如:C++.Java.Delphi.C#等. 动态语言(弱类型语言) 动 ...

  4. 什么是 Web 服务器(server)

    首先我们来了解什么是服务器(server) Web服务器一般指网站服务器,是指驻留于因特网上某种类型计算机的程序,可以向浏览器等Web客户端提供文档,[1]也可以放置网站文件,让全世界浏览:可以放置数 ...

  5. Angel图算法

    Angel图算法 [2.0]CommonFriends 计算两个好友的共同好友数,某种程度上可以刻画两个节点之间的紧密程度. 输入 输入数据路径:输入文件所在路径,无权网络数据, 数据格式为两列 sr ...

  6. MindSpore基准性能

    MindSpore基准性能 本文介绍MindSpore的基准性能.MindSpore网络定义可参考Model Zoo. 训练性能 ResNet 以上数据基于华为云AI开发平台ModelArts测试获得 ...

  7. C++中头文件和实现文件的关系

    头文件相当于是声明的集合,包括头文件的语句#Include实质为程序代码的宏替换. 编译阶段将函数和变量登记在符号表,链接时将各种函数的入口地址在其中查找到来调用,解引用.

  8. Django框架之路由层汇总

    一 Django中路由的作用 URL配置(URLconf)就像Django 所支撑网站的目录.它的本质是URL与要为该URL调用的视图函数之间的映射表:你就是以这种方式告诉Django,对于客户端发来 ...

  9. 【NX二次开发】体消参,移除体参数UF_MODL_delete_body_parms()

    例子: 源码: extern DllExport void ufusr(char *param, int *returnCode, int rlen) { UF_initialize(); tag_t ...

  10. 如何把excel中的行转为列?

    步骤:选择复制要转行的内容--->新建一张表格---->右键选择性粘贴---->转置----->成功把行转为列(具体操作看下图) 选择复制这些内容