1.使用正则表达式修改文本

正则表达式的功能不只有查询，还可以对文本进行修改，例如替换

$var=~m/regex/i                             
$var=~s/regex/replacement/i

Replacement两侧的斜杠相当于双引号，也就是说replacement中可以有$1，$2这样的变量来代表前面匹配到的内容

用$var=~s/regex/replacement/可以改变$var中的文本，如果没有匹配成功，就不会有文本的替换

$var=Jeff frield;
$var=~s/Jeff/Jeffery/;
$var=Jeffery frield

可是如果在运行$var=~s/Jeff/Jeffery/一次，就会得到：

$var=Jefferyery fried;

因为Jeff始终被匹配，所以替换始终会发生。

要避免这样的情况，我们必须要把匹配条件说的再具体一些。

匹配的是Jeff这个单词，而不是这四个字母，所以我们用：

$var=~s/\bJeff\b/Jeffery/

这样子第二次运行$var=~s/\bJeff\b/Jeffery/就不会再改变文本了

1.1例子一公函生成器

设想有一个公函系统，它包含很多公函魔板，其中一些标记，对每一封具体的公函来说，标记部分的值都有所不同

例如：

尊敬的=FIRST=,

恭喜您！获得了=TRINKET=！完全免费！您还想为=FAMILY=家获得更多的=TRINKEY=吗？告诉你=FULL=，你可以的！

然后设置三个变量：

$given="王";
$family="小明";
$prize="10000克拉的钻石";

然后我们就可以为语句的模板填写内容：

$letter=~s/=FIRST=/$family/g;
$letter=~s/=FAMILY=/$given/g;
$letter=~s/=FULL=/$given $family/g;
$letter=~s/=TRINKET=/价值连城$prize/g;

g是全局替换的修饰符，他告诉s///在一次匹配替换成功以后继续下一次，直到匹配不成功为止，从而达到全部相关文本都被替换的效果

结果：

尊敬的小明，

恭喜您！获得了价值连城10000克拉的钻石！完全免费！您还想为王家获得更多的价值连城10000克拉的钻石吗？告诉你王小明，你可以的！

1.2 例子二修整数字格式

有时候因为计算机内部表示浮点的原理，输出来的数字是9.05000000372272，可是我们其实只需要保留小数点后三位就可以了

要求就是：保留小数点后两位，如果第三位不为0，也要保留，例如12.3750000000392会变成12.375,37.500会变成37.50.

$num=~s/(\.\d\d[1-9]?)\d*/$1/;

用环视功能为数值添加逗号

大的数值，为了方便读懂，通常在其间加入逗号。

Print "the US population is $pop\n"；

会输出the US population is 298444215,但298,444,215会更加顺眼。

我们应该从数字的右边开始，每次数三个数字如果左边还有数字，就加入一个逗号。

这是直观的想法，但是正则表达式是从左到右去处理文本的。

逗号应该加在”左边有数字，右边数字的个数正好是3的倍数的位置“。

对于这样的任务，我们用环视功能来实现。

环视结构不匹配任何字符，只匹配文本中特定的位置。这个特性其实我们前面已经见过很多次，例如\b、^、$等，都是匹配一个位置，但环视比它们更加通用，因为它匹配的位置是你自己定义的。

顺序环视：从左到右查看文本，尝试匹配正则表达式。肯定型顺序环视用(?=……)来表示，例如(?=\d)，表示如果当前位置右边的字符是数字则匹配成功

逆序环视：从右到左查看文本，尝试匹配正则表达式。肯定型逆序环视用(?<=……)来表示，例如(?<=\d)，表示如果当前位置左边字符是数字则匹配成功（也就是紧跟在数字后面的位置）。

环视正则表达式在匹配的时候不会“占用”字符，只是匹配位置。

用Jeffery匹配by Jeffery friedl，匹配到是Jeffery这几个字符之前的位置

把环视结构和真正匹配的字符结合起来使用，我们能匹配到更加精准的内容，例如：

(?=Jeffery)Jeff

能匹配到by Jeffery friedl

不能匹配by Jefferson

(?=Jeffery)Jeff ;Jeff(?=ery)

Jeff(?=Jeffery)不能够匹配以上例子，而是匹配后面紧跟Jeffery的Jeff，例如JeffJeffery

1.3例子三effs=》Jeff’s

把Jeffs换成Jeff’s

s/Jeffs/Jeff’s/
s/\bJeffs\b/Jeff’ s/
s/\b(Jeff)(s)\b/$1’$2/

s/\bJeff(?=s\b)/Jeff’/

环视只是匹配一个位置，它的好处是容许我们在匹配Jeff前先检查整个Jeffs

s/(?<=\bJeff)(?=s\b)/’/
s/(?=s\b)(?<=\bJeff)/’/

用顺序环视和逆序环视找到了一个精确的位置，因为找的只是位置，所以条件循序调换了也没有影响。

1.4例子四回到逗号

“左边有数字，右边数字的个数正好是3的倍数”。

第一个要求用逆序环视就能够满足，左边有数字，(?<=\d)

第二个要求：3位数字可以表示成\d\d\d，然后可以用(\d\d\d)+表示3的若干倍

最后再加上$来确保这些数字后面不存在其他字符，以保证这样的结果“正好”在最后3位数字之后结束

$pop=~s/(?<=\d)(?=(\d\d\d)+$)/,/g;
Print"The US population is $pop\n";

298,444,215

试想，如果不加$，会有什么后果？

$pop=~s/(?<=\d)(?=(\d\d\d)+)/,/g;

2,9,8,4,4,4,215

而且这里括住\d\d\d的括号，其实我们只是用来使得+可以作用于这个括号，并没有使用它的捕获功能，所以可以写成非捕获型括号:(?:......)

$pop=~s/(?<=\d)(?=(?:\d\d\d)+$)/,/g;

否定环视

现在，我们又希望把这个插入逗号的正则表达式应用到很长的字符串汇中，例如

$text="The population of 299444215 is growing"

这样子s/(?<=\d)(?=(\d\d\d)+$)/,/g;就不管用了，因为数字之后不是结尾，所以匹配不成功

解决方法：可以把$换成\b，尽管\b被称为单词分隔符，但是对于perl来说，匹配单词的\w是[a-zA-Z0-9]，把数字也包括进去了，所以这是广义的单词

注意到这里，\b的意思就是，在此位置的一侧是单词，另外一侧不是

环视也有相关的概念，前面我们说的(?=)、(?<=)都叫做肯定顺序环视和肯定逆序环视。因为他们成功的条件是子表达式在这些位置能够匹配

另外还有否定顺序环视(?!)和否定逆序环视(?<!)，他们成功条件是子表达式无法匹配

类型	正则表达式	匹配成功的条件
肯定顺序环视	(?=)	子表达式能够匹配右侧文本
肯定逆序环视	(?<=)	子表达式能够匹配左侧文本
否定顺序环视	(?!)	子表达式不能够匹配右侧文本
否定逆序环视	(?	子表达式不能够匹配左侧文本

这样，其实\b就是(?<!\w)(?=\w)|(?<=\w)(?!\w)

s/(?<=\d)(?=(\d\d\d)+(?!\d)/,/g;

不是所有的宿主语言都支持逆序环视

那么我们可以这样子写，这样就没有用到逆序环视

s/(\d)(?=(\d\d\d)+$)/$1,/g;

如果连顺序环视都不用呢？

s/(\d)((\d\d\d)+\b)/$1,$2/g;

可以吗？

答案是不可以，结果是298,444215

因为g这个修饰符规定，下一次匹配是在这一次匹配的终点开始的。但是在第一次匹配时，(\d\d\d)+\b已经匹配了444215，所以g的下一次匹配开始是在5的后面

解决方法是在perl中加个while循环，重复匹配，而不是迭代匹配

2.正则表达式使用注意事项

在某种特定的宿主语言或工具软件中使用正则表达式时，主要有3个问题需要注意

1.支持的元字符，以及这些元字符的意义，这通常称为正则表达式的“流派”

2.正则表达式与语言工具的“交互方式”。譬如如何进行正则表达式的操作，容许进行哪些操作，以及这些操作的目标文本类型

3.正则表达式引擎如何将表达式应用到文本

由于正则表达式的漫长的发展史，众多程序员，新的程序又形成自己的流派，所以就成了巨大的迷局。

直到1986年，POSIX（一系列标准）诞生，它是标准化的尝试，试图把缠绕不清的正则表达式各个流派标准化，用同一套规则来实现正则表达式。它把各种常见的流派分为两大类：

Basic Regular Expressions(BREs)和Extended Regular Expressions(EREs)

POSIX程序必须支持其中任意一种

perl正则表达式第二周笔记的更多相关文章

perl正则表达式第一周笔记
正则表达式基础 ^ 行首标志 $ 行末标志如^cat即一整行只有cat这个单词,^则是一个空行 [ ] 字符组,用来匹配若干字符之一如gr[ae]y,即grey或者gray - 在字符组内部,字 ...
《Linux内核分析》第二周笔记操作系统是如何工作的
操作系统是如何工作的一.函数调用堆栈 1.三个法宝计算机是如何工作的?(总结)——三个法宝(存储程序计算机.函数调用堆栈.中断机制) 1)存储程序计算机工作模型,计算机系统最最基础性的逻辑结构: ...
20165326 java第二周学习笔记
学习笔记一.理论学习基本数据类型与数组标识符的第一个字符不能是数字:标识符不能为关键字. 基本数据类型多数与c语言相同.重点如下: 1.逻辑类型boolean赋值true/false 2.浮点数 ...
《Linux内核分析》第二周学习笔记
<Linux内核分析>第二周学习笔记操作系统是如何工作的郭垚原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/ ...
Linux内核分析第二周学习笔记
linux内核分析第二周学习笔记标签(空格分隔): 20135328陈都陈都原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.co ...
Java学习第二周学习笔记
20145307<Java程序设计>第二周学习总结教材学习内容总结 Java语言中的很多基本语法都和C语言类似,以下Java中的基本语法标识符标识符是程序中自定义的一些名称. 由26 ...
20145231第二周Java学习笔记
20145231 <Java程序设计>第2周学习总结教材学习内容总结本周的学习采用的依然是先看课本,再看视频,然后实践敲代码,最后根据学习笔记总结完成博客. 第三章:基础语法知识点比 ...
红帽学习笔记[RHCSA] 第二周
目录红帽学习笔记[RHCSA]第二周环境第七课[网络配置相关] 在Vmware中添加网卡将网卡添加到虚拟机上关于网卡命名规则配置网络网络配置命令总结更改hostname 关于SSH的一 ...
吴恩达《深度学习》-第一门课 (Neural Networks and Deep Learning)-第二周：(Basics of Neural Network programming)-课程笔记
第二周:神经网络的编程基础 (Basics of Neural Network programming) 2.1.二分类(Binary Classification) 二分类问题的目标就是习得一个分类 ...

随机推荐

HTML5表单增强
感觉最大的改变就是表单元素可以不写在form标签中.写在其他地方,加个form属性就能提交了别的嘛感觉没什么,表单验证也不能提示信息,感觉不实用 <!DOCTYPE html> <h ...
L6 Shell
写出以下shell脚本1 判定一个用参数指定的文件是否为可执行,如果不是,则改为可执行#!/bin/bash if [ -x $1 ]then echo "OK"else echo ...
js arguments参数说明
在javascript中,不需要明确指出参数名,就能访问它们.如: function hi(){if(arguments[0]=="andy"){ return;}aler ...
git 克隆本地仓库
如果要从本地仓库克隆到另一个地方使用如下命令 git clone d:/SourceRepository d:/DestinationRepository d:/SourceRepository:本地 ...
java/php/c#版rsa签名以及验签实现
本文为转载,请转载请注明地址: 原文地址为 http://xw-z1985.iteye.com/blog/1837376 在开放平台领域,需要给isv提供sdk,签名是Sdk中需要提供的 ...
php5.3 PHP5.4 PHP5.5 新特性/使用PHP5.5要注意的
1.PHP 5.3中的新特性 1.1 PHP 5.3中的新特性 1.1.1. 支持命名空间 (Namespace) 毫无疑问,命名空间是PHP5.3所带来的最重要的新特性. 在PHP5.3中,则只 ...
struts2中#，$,%的用法以及el，ognl表达式的用法
OGNL, JSTL, STRUTS2标签中符号#,$,%的用法示例取Session中的值 <c:out value="${sessionScope.user.userId}&quo ...
js返回值
看下js变量.作用域.内存文档. 1. <script type="text/javascript"> function c(){ return 23; } var a ...
php数据类型有哪些?
php数据类型有哪些?有三大类1.基本数据类型 1.1整型 $a = 0123; // 八进制数(是以0开头) 83 $a = 0x1A; // 十六进制数 26 1.2小数 ...
【Chromium中文文档】跨平台开发的约定与模式
跨平台开发的约定与模式转载请注明出处:https://ahangchen.gitbooks.io/chromium_doc_zh/content/zh//General_Architecture/C ...

perl正则表达式第二周笔记