1. 基础的正则表达式

1.1 正则表达式与通配符

(1)正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。

(2)通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。

1.2 基础正则表达式

元字符

作用

*

前一个字符匹配0次或任意多次(是前一个字符,这与bash的通配符不同)

.

匹配除了换行符外任意一个字符

^

匹配行首。例如:^hello会匹配以hello开头的行

$

匹配行尾。例如:hello$会匹配以hello结尾的行

[]

匹配中括号中指定的任意一个字符只匹配一个字符。例如:[aoeiu]匹配任意一个元音字母,[0-9]匹配任意一个数字,[a-z][0-9]匹配小写字母和一位数字构成的两位字符。

[^]

匹配除中括号中字符以外的任意一个字符。例如:[^0-9]匹配任意一位非数字字符,[^a-z]表示任意一位非小写字母。

\

转义符。用于将特殊殊号的含义取消。

\{n\}

表示前面的字符恰好出现n次。实际上为{n},其中{}要转义为原来的含义。

\{n,\}

表示其前面的字符出现不小于n次。例如:[0-9]\{2,\}表示两位及以上的数字

\{n,m\}

表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]\{6,8\}匹配6到8位的小写字母。

【编程实验】正则表达式

//测试文本(test_rule.txt)

Mr. Santa Claus said:
he was the honest man in HorzionStudio
123 depise him. But since Mr. Rolling Stone came,
he never saaaid those words.
55555nice! because,actuaaaaly,
Mr. Rolling Stone is the most honest man! Later, Mr. Santa Claus soid his hot body.

(1)“*”表示前一个字符匹配0次,或任意多次。

  ①#grep "a*" test_rule.txt  //匹配所有内容,包括空白行。(理解:*取0时,表示空白行或者可理解为在行中不出现a的行*≥1时表示a出现1次或多次的行。)

  ②#grep "aa*" test_rule.txt //至少包含有一个a的行。

  ③#grep "aaa*" test_rule.txt //至少包含两个连续a的字符串

  ④#grep "aaaa*" test_rule.txt //至少包含四个连续a的字符串。

(2)“.”匹配除了换行符外任意一个字符

  ①# grep "s..d" test_rule.txt //匹配在s和d之间一定有两个字符的字符串。

  ②# grep "s.*d" test_rule.txt //匹配在s和d字母之间有任意字符。

  ③# grep ".*" test_rule.txt   //匹配所有内容

(3)“^”匹配行首,“$”匹配行尾

  ①# grep "^M" test_rule.txt  //匹配以大写“M”开头的行

  ②# grep "n$" test_rule.txt  //匹配以小写n结尾的行

  ③# grep  -n "^$" test_rule.txt  //匹配空白行,-n表示输出的同时打印行号。

(4)“[]”匹配中括号中指定的任意一个字符,只匹配一个字符。

  ①# grep "s[ao]id" test_rule.txt //匹配s和i字母中,要不是a,要不是o

  ②# grep "[0-9]" test_rule.txt   //匹配任意一个数字

  ③# grep "^[a-z]" test_rule.txt  //匹配用小写字母开头的行。

  ④# grep "^[^0-9]" test_rule.txt //匹配以非数字开头的行

(5)“\”转义符

  ①# grep "\.$" test_rule.txt  //匹配以“.”结尾的行

(6)“\{n\}”表示其前面的字符恰好出现n次。

  ①# grep "a\{3\}" test_rule.txt  //匹配a字母连续出现3次的字符串,因正则是包括匹配,只要字符串中有3个连续的a则匹配。

  ②# grep "[0-9]\{3\}" test_rule.txt  //匹配包含连接3个数字的字符串

(7)“\{n,\}”表示其前面的字符出现不小于n次

  # grep "^[0-9]\{3,\}[a-z]" test_rule.txt  //匹配最少用连续3个数字开头的行。

(8)“\{n,m\}”匹配其前面的字符至少出现n次,最多出次m次。

  # grep "sa\{1,3\}i" test_rule.txt //匹配在字母s和i之间最少一个a最多3个a

第10章 Shell编程(1)_正则表达式的更多相关文章

  1. 第10章 Shell编程(2)_字符截取命令

    2. 字符截取命令 2.1 cut字段提取命令(grep提取行,cut提取列) (1)cut命令:#cut [选项] 文件名 选项: -f 列号:提取第几列: -d 分隔符:按照指定分隔符分割列,默认 ...

  2. 第10章 Shell编程(4)_流程控制

    5. 流程控制 5.1 if语句 (1)格式: 格式1 格式2 多分支if if [ 条件判断式 ];then #程序 else #程序 fi if [ 条件判断式 ] then #程序 else # ...

  3. 第10章 Shell编程(3)_字符处理命令和条件判断

    3. 字符处理命令 3.1 排序命令:sort (1)sort命令:#sort [选项] 文件名 选项 作用 -f 忽略大小写 -n 以数值型进行排序,默认使用字符串型排序 -r 反向排序 -t 指定 ...

  4. linux 10 -Bash Shell编程

    二十三. Bash Shell编程:     1.  读取用户变量:     read命令是用于从终端或者文件中读取输入的内建命令,read命令读取整行输入,每行末尾的换行符不被读入.在read命令后 ...

  5. 10、shell编程+流程控制+分支嵌套

    SHELL 编程     shell 是一个命令解释器,侦听用户指令.启动这些指令.将结果返回给用户(交互式的shell)     shell 也是一种简单的程序设计语言.利用它可以编写一些系统脚本. ...

  6. Linux系统shell编程自学_第一章基础

    第一章 基础shell的优势在于处理操作系统底层的业务,Python,php的优势在于开发运维工具,web界面的管理工具以及web业务开发.处理一键安装.优化.报警脚本shell又叫命令解释器,它能识 ...

  7. shell编程值之正则表达式与字符截取(6)

    正则表达式与通配符 正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配.grep.awk.sed等命令可以支持正则表达式 通配符用来匹配符合条件的文件名,通配符是完全匹配.ls.find.cp ...

  8. shell编程基础(五): 正则表达式及其使用

    正则表达式 1.前情提要 以前我们用grep在一个文件中找出包含某些字符串的行,比如在头文件中找出一个宏定义.其实grep还可以找出符合某个模式(Pattern)的一类字符串.例如找出所有符合xxxx ...

  9. Java面向对象笔记 • 【第10章 Swing编程初级应用】

    全部章节   >>>> 本章目录 10.1 JFrame窗口容器 10.1.1 Swing介绍 10.1.2 JFrame窗口容器应用 JFrame常用方法 10.1.3 实践 ...

随机推荐

  1. CRL快速开发框架系列教程八(使用CRL.Package)

    本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...

  2. jQuery-template.js学习

    花了点时间,看了下jQuery-template.js,不多废话,先上结构 jQuery.each({..},function(){}) jQuery.fn.extend({..}) jQuery.e ...

  3. C# 给PDF文件添加水印

      水印种类及功能介绍 PDF水印分为两种:文本水印和图片水印.文本水印一般被用在商业领域,提醒读者该文档是受版权保护的,其他人不能抄袭或者免费使用.除了这个特征,水印还可以用来标记这个文档 的一些基 ...

  4. Vertica 导出数据测试用例

    需求:构建简单的测试用例,完成演示Vertica导出数据的功能. 测试用例:导出test业务用户t_jingyu表中的数据. 一.初始化测试环境 二.导出数据 2.1 vsql命令说明帮助 2.2 导 ...

  5. 计算机网络学习笔记--数据链据层之MAC子层(整理)

    概述: 为什么需要介质访问控制子层(MAC)? 介质访问控制子层(MAC)是局域网体系结构中划分的子层,多路访问链路采用共享介质连接所有站点.发送站点通过广播方式发送数据并占用整个带宽,如果有多个站点 ...

  6. Spark的DataFrame的窗口函数使用

    作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 转载请注明出处 SparkSQL这块儿从1.4开始支持了很多的窗口分析函数,像row_number这些,平时写程 ...

  7. LCM性质 + 组合数 - HDU 5407 CRB and Candies

    CRB and Candies Problem's Link Mean: 给定一个数n,求LCM(C(n,0),C(n,1),C(n,2)...C(n,n))的值,(n<=1e6). analy ...

  8. C++ 最小化到托盘

    #define WM_SHOWTASK (WM_USER + 1) void CTestDlg::OnSysCommand(UINT nID, LPARAM lParam) { if ((nID &a ...

  9. 【夯实PHP基础】php开发时遇到白页的调试方法

    本文地址   分享提纲: 1. 设置报错报错级别,显示报错 2. 白页的可能原因     1.[设置报错报错级别,显示报错] php开发时,访问地址也对,但就是不出来页面,显示的是 白的页面,所以就可 ...

  10. 使用MyBatis Generator自动创建代码(dao,mapping,poji)

    连接的数据库为SQL server2008,所以需要的文件为sqljdbc4.jar 使用的lib库有: 在lib库目录下新建一个src文件夹用来存放生成的文件,然后新建generatorConfig ...