LinuxShell——正则表达式

摘要:本文主要学习了Shell中的正则表达式。

简介

含义

正则表达式,也称作正规表示法,是用于描述字符排列和匹配模式的一种语法规则,它主要用于字符串的模式分割、匹配、査找及替换操作。

正则表达式是用来匹配文件中的字符串的方法,它会先把整个文本分成一行一行的字符串,然后从每行字符串中搜索是否有符合正则表达式规则的字符串,如果有则匹配成功,如果没有则匹配失败。

正则表达式和通配符的区别

正则表达式用来在文件中匹配符合条件的字符串,通配符用来匹配符合条件的文件名。其实这种区别只在Shell中适用,因为用来在文件中搜索字符串的命令,如grep、awk、sed等可以支持正则表达式,而在系统中搜索文件的命令,如ls、find、cp等不支持正则表达式,所以只能使用Shell自己的通配符来进行匹配了。

语系对正则表达式的影响

不同环境下语系不同,可能使用正则表达式选取的结果也会有所差异。

使用之前设置语系:

 [root@localhost ~]# export LANG=C
[root@localhost ~]# export LC_ALL=C

元字符

在正则表达式中,我们把用于匹配的特殊符号又称作元字符。在Shell中,元字符又分为基础元字符和扩展元字符。

基础元字符

 *:前一个字符匹配0次或任意多次。
.:匹配除换行符外的任意一个字符。
^:匹配行首。例如:^hello会匹配以hello开头的行。
$:匹配行尾。例如:hello&会匹配以hello结尾的行。
[]:匹配中括号里的任意一个字符,而且只匹配一个字符。例如:[aoeiu]匹配任意一个元音字母,[-]匹配任意一位数字,[a-z][-]匹配由小写字母和一位数字构成的两位字符。
[^]:匹配除了中括号里的字符以外的任意一个字符。例如:[^-]匹配任意一位非数字字符,[^a-z]匹配任意一位非小写字母。
\:转义符,用于取消特殊符号的含义。
\{n\}:表示其前面的字符恰好出现n次。例如:[-]\{\}匹配4位数字,[][-][-]\{\}匹配手机号码。
\(n,\}:表示其前面的字符出现不少于n次。例如:[-]\{,\}匹配两位及以上的数字。
\{n,m\}:表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]\{,\}匹配6到8位的小写字母。

1)*

正则表达式中的“*”和通配符中的“*”含义不同,正则表达式中的代表前一个字符重复0次或任意多次。

举例:

“a*”并不是匹配a后面的任意字符,而是可以匹配所有内容,包括空白行,所以“a*”是没有意义的。

“aa*”会匹配至少包含一个a的字符串。

“a*b”并不能匹配a和b之间有任意字符的字符串,只能匹配包含了b的字符串。

2).

正则表达式中的“.”只能匹配一个字符,这个字符可以是任意字符。

举例:

“a.b”会匹配a和b之间有一个字符的字符串。

“a.*b”会匹配a和b之间有任意字符的字符串。

3)^

正则表达式中的“^”代表匹配行首。

举例:

“^M”会匹配以“M”开头的行。

4)$

正则表达式中的“$”代表匹配行尾。

举例:

“n$”会匹配以“n”结尾的行。

5)[]

正则表达式中的“[]”会匹配中括号里指定的任意一个字符,注意只能匹配一个字符。

举例:

“[ao]”要么匹配一个a字符,要么匹配一个o字符。

“[A-Z]”会匹配任意一个大写字母。

6)[^]

正则表达式中的“[^]”会匹配除了中括号里的字符以外的任意一个字符。

举例:

“^[^a-zA-Z]”会匹配不以字母开头的行。

7)\

转义符会取消特殊符号的含义,将其作为正常的字符串来匹配。

举例:

“.$”不能匹配使用.结尾的行,因为.有特殊含义,可以使用“\.$”来匹配使用.结尾的行。

8)\{n\}

正则表达式中的“\{n\}”表示其前面的字符恰好出现n次。

举例:

“a\{3\}”会匹配a字母连续出现3次的字符串,但不会限制之后的字符串,当然也会匹配到“aaaa”。

“a\{3\}[^a]”会匹配a字母连续出现3次的字符串,并且之后不为a的字符串,也就是只匹配a字母连续出现3次的字符串。

9)\{n,\}

正则表达式中的“\{n,\}”表示其前面的字符出现不少于n次。

举例:

“^[0-9]\{3,\}”会匹配最少连续3个数字开头的字符串。

10)\{n,m\}

正则表达式中的“\{n,m\}”表示其前面的字符出现不少于n次,不超过m次。

举例:

“ao\{1,3\}e”会匹配在字母a和字母e之间最少1个、最多3个的o字符串。

扩展元字符

在正则表达式中还有一些元字符,被称为扩展元字符。有的命令支持这种元字符,比如awk命令,有的命令不支持这种元字符,比如sed命令和grep命令。

 +:前一个字符匹配1次或任意多次。例如:a+b匹配以a开始以b结尾的字符串。
?:前一个字符匹配0次或1次。例如:a?b匹配ab或者b。
|:匹配两个或多个分支选择。例如:a|b|c匹配a或者b或者c。
():匹配其整体为一个字符,即模式单元。可以理解为由多个单个字符组成的大字符。例如:(abc)+会匹配重复abc这个整体一次或多次的字符串。

LinuxShell——正则表达式的更多相关文章

  1. Linux--shell脚本之正则表达式

    一.正则表达式的概念及特点: 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑.规 ...

  2. Linux--shell grep与正则表达式--04

    一.grep程序 Linux下有文本处理三剑客:grep.sed.awk grep:文本 行过滤工具 sed:文本 行编辑器(流编辑器) awk:报告生成器(做文本输出格式化) 1.grep grep ...

  3. 脚本学习python和linux-shell和jQuery(javascript)

    使用脚本可以方便管理,使用计算机. 打算学脚本来更好地用计算机系统,特别是Linux. 学python因为它开源,而且是C家族的语言,本来也是课程需要,再加上它确实很好,所以非常主打,之前看过perl ...

  4. 程序员必知的LinuxShell命令

    程序员必知的LinuxShell命令 grep (Globle Regular Expression Print全局正则表达式) 命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的 ...

  5. LinuxShell脚本——循环结构

    LinuxShell脚本——循环结构 摘要:本文主要学习了Shell脚本中的循环结构. while循环 基本语法 while循环是最简单的一种循环,如果条件满足则执行循环里的语句,如果条件不满足则退出 ...

  6. LinuxShell脚本——选择结构

    LinuxShell脚本——选择结构 摘要:本文主要学习了Shell脚本中的选择结构. if-else语句 基本语法 最简单的用法就是只使用if语句,它的语法格式为: if 条件 then 命令 fi ...

  7. LinuxShell——管道命令

    LinuxShell——管道命令 摘要:本文主要学习了Shell中的管道命令. grep命令 grep命令的作用是在文件中提取和匹配符合条件的字符串行,全称是Global Regular Expres ...

  8. Linuxshell脚本-格式-变量-条件测试

    1.Linuxshell脚本格式 脚本文件名称格式: 1.NAME.sh.脚本文件名称必须以 .sh 结尾 脚本编辑第一行必须包括shell声明序列:#! 添加注释,注释以#开头     2.加3执行 ...

  9. JS正则表达式常用总结

    正则表达式的创建 JS正则表达式的创建有两种方式: new RegExp() 和 直接字面量. //使用RegExp对象创建 var regObj = new RegExp("(^\\s+) ...

随机推荐

  1. 微信小程序 setData 如何修改动态数据?

    最近这段时间在写微信小程序,有一个页面需要动态修改 data 中的数据,而这里似乎是个坑. 1.正常修改 正常修改很简单,当触发 change 事件时,数据和页面都会同时发生改变.这个也不用多说,很简 ...

  2. Dynamics CRM定制子网格添加按钮实例之一

    关注本人微信和易信公众号: 微软动态CRM专家罗勇 ,回复221或者20160430可方便获取本文,同时可以在第一间得到我发布的最新的博文信息,follow me!我的网站是 www.luoyong. ...

  3. 传入一个Map<String,Long> 返回它按value排序后的结果

    //传入一个Map<String,Long> 返回它按value排序后的结果 sort为正序还是倒序(-1倒序),size为要几条数据 private static Map<Stri ...

  4. Mysql添加用户与授权

    1.本地环境 CentOS Linux release 7.5.1804 (Core) mysql Ver 14.14 Distrib 5.7.22, for Linux (x86_64) using ...

  5. Linux—服务器SSL/TLS快速检测工具(TLSSLed)

    一.下载TLSSLed [root@localhost ~]# yum install tlssled 二.服务器SSL/TLS快速检测工具TLSSLed 现在SSL和TLS被广泛应用服务器的数据加密 ...

  6. Ubuntu安装DaVinci Resolve

    安装DaVinci Resolve所需依赖 sudo apt install libssl1.0.0 ocl-icd-opencl-dev fakeroot xorriso 下载MakeResolve ...

  7. CodeForces - 1255C(构造+模拟)

    题意 https://vjudge.net/problem/CodeForces-1255C 一个长度为n的序列,给你n-2个三元组,比如p=[1,4,2,3,5],那么三元组为[1,4,2],[4, ...

  8. c# 第37节 接口的实现与继承

    本节内容: 1:接口继承注意 2:开发封闭原则: 3:实例解释接口的作用 1:接口继承注意 接口的继承: :类继承具有单根性,接口可多重继承: :接口继承多个接口的时候,派生接口名与父接口用冒号隔开, ...

  9. 【Eureka篇三】Eureka常用配置说明(7)

    服务注册中心配置(Bean类:org.springframework.cloud.netflix.eureka.server.EurekaServerConfigBean) #关闭注册中心的保护机制, ...

  10. 一、man、系统工作、系统检测命令

    目录 一.man命令 (一)常用按键 (二)结构意义 二.常用系统工作命令 (一) echo (二)date (三)reboot (四)powoff (五)wget (六)ps (七)top (八)p ...