Chapter 21_3 模式
很多地方都会看到各种匹配模式,每次接触这些函数,颇使人望文生畏。
今天就来好好面对它、认识它、了解它、最后战胜它。
匹配模式都是用一串常规的字符串来描述,最主要的是理解这些字符串的语法及含义(即它能匹配到什么)。
^$()%.[]*+-? |
魔法字符,具有特殊的含义。 %作为这些魔法字符的转义字符,还可以用于其他所有非字母和数字。 %. 表示匹配一个"." %% 表示匹配一个“%” 当不确定一个字符是否需要转义时,应该前置一个转义符。 |
. | 所有字符 |
%a | 字母 |
%c | 控制字符 |
%d | 数字 |
%g | 除空白符外的可打印字符 |
%l | 小写字母 |
%p | 标点符号 |
%s | 空格字符 |
%u | 大写字母 |
%w | 字母及数字 |
%x | 16进制数字符号 |
%x |
表示字符x(这里的x是任意非字母或数字的字符),这是对魔法字符转义的标准方法。 所有非字母或数字的字符(标点,非魔法字符) 都可以用前置一个"%"放在模式串中表示自身。 |
[set] |
表示set中所有字符的联合。可以以‘-’连接升序书写范围两端的字符,来表示一个范围的字符集。 上一个%x形式也可以在set中使用表示其中的一个元素。其它出现在set中的字符则代表它们自己。 例如: [%w_](或[_%w]) 表示所有的字母数字加下划线 [0-7] 表示8进制数字 [0-7%l%-] 表示8进制数字、 小写字母、‘-’ 字符。 交叉使用类和范围的行为未定义。因此,像[%a-z] 或 [a-%%] 这样的模式串没有意义。 |
[^set] | 表示set的补集 |
所有单个字母表示的类别(%a,%c,等),若将其字母改为大写,均表示对应的补集。
例如:%S表示所有非空格的字符。
%A表示所有非字母字符:
print(string.gsub("hello, up-down!", "%A" , "."))
--> hello..up.down. 4 -- 4 是gsub返回的第二个结果
对于Lua来说,模式就是普通的字符串,只有模式函数才会解释它们,此时才会将'%'当作转义符来处理。
在模式中放入一个引号的方法,与在普通字符串中放入引号的方法相同,需要用"\"来对引号进行转义。
在一对方括号"[ ]"内将不同的字符分类或单个字符组合起来,即可创建出自己的字母,数字和下划线:
"[01]" :表示匹配二进制数字
"[%[%]]":表示匹配方括号本身
若要统计一段文本中元音的数量,可这么写:
nvow = select(,string.gsub(text , "[AEIOUaeiou]",""))
有的时候,需要写出一段字符范围:
"[0-9]" 即为 "%d"
"[0-9a-fA-F]" 即为 "%x"
"[0-7]" 即为查找一个八进制数字,就要比"[01234567]"好
在一个字符集前加"^",可以得到这个字符集的补集,像"[^0-7]"就表示所有非八进制数字的字符。
"[^\n]"表示除了换行符以外的其他字符。但是对于简单的分类,可以使用大写形式得到其补集,"%S"显然比"[^%s]"简单。
但是,像"[a-z]" 可能并不等于"%l"。在某些区域设置中,后者可能会包括像"á"、"ú" 、"ü"等。
可以通过修饰符来描述模式中的重复部分和可选部分。Lua的模式提供4中修饰符:
* | 0或多个,匹配尽可能长的串 |
+ | 1或多个,匹配尽可能长的串 |
- | 0或多个,和*不同,它匹配尽可能短的串 |
? | 可选部分,0或1次,比如:A?将匹配0或一个A,只要有可能,它会匹配一个。 |
%n | 这里的n可以从1-9;匹配一个等于n号捕获物的子串,下一节有介绍。 |
%bxy |
这里的x和y是两个明确的字符;匹配以x开始y结束,且其中x和y保持平衡的字符串。 意思是,如果从左到右读这个字符串,对每次读到一个x就+1,读到一个y就-1,最终 结束处的那个y是第一个记数到0的y。比如:条目"%b()"可以匹配到括号平衡的表达式。 |
%f[set] | 指边境模式;这个条目会匹配到一个位于set内某个字符之前的一个空串, |
%a+举例说明:
print(string.gsub("one,and two ;and three","%a+","word"))
--> word , word word; word word
%d+举例说明:
print(string.match("the number 1298 is even","%d+"))
--> 1298
*与+的用途,一个典型是匹配一个模式不同部分之间的空格。例如,匹配像"()"或"( )"这样的一对空圆括号。可以使用模式:
"%(%s*%)" --0或多个空格字符
匹配标识符:
"[_%a][_%w]*"
"-"和"*"差别不大,但是有时结果却截然不同。
"[_%a][_%w]-" --查找一个标识符,只会找到第一个字母,因为"[_%w]-"总是匹配空串。
"/%*.*%*/" --查找一个C程序中的注释,".*"会尽可能地扩展,因此"/*"只会与最后一个"*/"相匹配
test = "int x;/* x */ int y; /* y */"
print(string.gsub(test,"/%*.-%*/","<COMMENT>")) --只找第一个"*/"就完成第一个注释
--> int x ; <COMMENT> int y;<COMMENT> print(string.match(test,"/%*.*%*/"))
--> /* x */ int y; /* y */ 这里的".*"尽可能找很多。所以打印了从头到尾的注释
"?"匹配一个可选的字符
"[+-]?%d+" --在一段文本中寻找一个可选正负号的整数,像-12、23、+1009这样的数
"^"和"$"
if string.find(s,"^%d") then ... --检查s串是否以一个数字开头
if string.find(s,"^[+-]?%d+$") then ... --检查s串是否表示一个整数,并且没有多余的前导字符和结尾字符
"%b" 匹配成对的字符
用法是"%b<x><y>"
其中<x>和<y>是两个不同的字符,<x>是起始字符,<y>是结束字符:例如 "%b()"
s = "a (enclosed(in) parentheses) line"
print(string.gsub(s,"%b()", "")) --> a line
经典用法是"%b()"、"%b[]"、"%b{}"、"%b<>",但实际上可以用任何字符作为分隔符。
"%f[%w]" --这儿没有理解透彻
s = "the anthem is the theme"
print(s:gsub("%f[%w]","one")
--> onethe oneanthem oneis onethe onetheme print(s:gsub("%f[%w]the%f[%W]","one"))
--> one anthem is one theme
以上内容来自:《Lua程序设计第二版》和《Programming in Lua third edition 》 和 Lua参考手册
Chapter 21_3 模式的更多相关文章
- Chapter 2.策略模式
首先贴一段代码: package xiao; import java.util.Scanner; class CashSuper{ private int num; private dou ...
- Chapter 13 建造者模式
建造者模式又叫生成器模式:将一个产品的内部表象与产品的生成过程分割开来,从而可以使一个建造过程生成具有不同的内部表象的产品对象. 代码: package xiao; import java.util. ...
- Chapter 12 外观模式
外观模式:为子系统中的一组接口提供一个一致的界面,此模式定义了一个高层接口,这个模式使得这一子系统更加容易使用. 外观模式三个阶段: 首先,在设计初期阶段,应该要有意识的将不同的两个层分离. 其次,在 ...
- Chapter 10 模版方法模式
我们要完成在某一细节层次一致的一个过程或一系列步骤,但其个别步骤在更详细的层次上的实现可能不同时,我们通常考虑用模版模式来处理. 模版方法模式:定义一个操作中的算法的骨架,而将一些步骤延迟到子类中.模 ...
- Chapter 9 原型模式
原型模式:用原型实例指定创建对象的种类,并且通过拷贝这些原型创建新的对象. 简单的说就是clone一个对象实例.使得clone出来的copy和原有的对象一模一样. 插一个简单使用clone的例子,如果 ...
- Chapter 8 工厂方法模式
工厂方法模式实现时,客户端需要决定实例化哪一个工厂来实现运算类,选择判断的问题还是存在的,也就是说,工厂方法把简单工厂的内部逻辑判断移到了客户端代码来进行.你想要加功能,本来是改工厂类的,而现在是修改 ...
- Chapter 7 代理模式
代理模式:为其它对象提供一种代理以控制对这个对象的访问. 代码: package xiao; class Girl{ private String name; public void setName( ...
- 《linux 内核全然剖析》 chapter 4 80x86 保护模式极其编程
80x86 保护模式极其编程 首先我不得不说.看这章真的非常纠结...看了半天.不知道这个东西能干嘛.我感觉唯一有点用的就是对于内存映射的理解...我假设不在底层给80x86写汇编的话.我 ...
- <Chapter 2>2-2-1.用户偏好模式(The User Preferences Pattern)
在这个模块中我们要创建的应用是一个简单的钟.当一个用户访问这个网站时,这个应用会更具服务器的系统时间显示当前的时间.默认情况下,这个应用使用标准国际时间(UTC)时区显示当前时间.用户可以使用Goog ...
随机推荐
- 常用排序算法的python实现和性能分析
常用排序算法的python实现和性能分析 一年一度的换工作高峰又到了,HR大概每天都塞几份简历过来,基本上一天安排两个面试的话,当天就只能加班干活了.趁着面试别人的机会,自己也把一些基础算法和一些面试 ...
- .net开发框架设计
转WisDom .net开发框架设计 WisDom .net 框架设计 1. 为啥要弄 2014 年我已经是我们参加工作的第六年,也做过不少项目,但是发现自己没有代码积累.这里利用业余时间梳理一下 ...
- Media Formatters媒体格式化器
Media Formatters媒体格式化器 前言 阅读本文之前,您也可以到Asp.Net Web API 2 系列导航进行查看 http://www.cnblogs.com/aehyok/p/344 ...
- 排序算法学习,python实现
原创博文,转载请注明出处 利用周六周末的时间把几种基本的排序方法用python实现了一下,废话少说,直接上代码. 本文不注重基础知识的讲解,只做大致的描述,大家如果不清楚概念,自行查找资料. 直接插入 ...
- rabibtMQ安装及集群配置-linux
安装RabbitMQ RabbitMQ是流行的开源消息队列系统,用erlang语言开发,故首先需要安装erlang依赖及erlang. 安装erlang依赖的基本环境,通过yum方式进行安装: yum ...
- CODEFORCES#274 DIV2
A[傻逼题] 大意:给你a,b,c三个数,你可以在其中加上括号,加号,乘号,使得到的值最大 就是问你 a+b+c,a*(b+c),(a+b)*c,a*b*c,(a+c)*b 哪个最大! 我去...这不 ...
- C#socket通信1
.net平台下C#socket通信(上) 完全是基础,新手可以随意看看,大牛可以关闭浏览页了,哈哈. 在开始介绍socket前先补充补充基础知识,在此基础上理解网络通信才会顺理成章,当然有基础的可以跳 ...
- jQuery中,$.extend,$obj.extend和$.fn.extend三者的区别
jQuery中,$.extend,$obj.extend和$.fn.extend三者的区别 现在做的一个项目,所使用的框架是基于jQuery扩展的,于是平时学了一下jQuery,了解到了它的扩展函数: ...
- 使用JAVA进行MD5加密后所遇到的一些问题
前言:这几天在研究apache shiro如何使用,这好用到了给密码加密的地方,就碰巧研究了下java的MD5加密是如何实现的,下面记录下我遇到的一些小问题. 使用java进行MD5加密非常的简单,代 ...
- jquery以及js实现option左移右移
<table cellspacing="1" width="350px" align="center"> <tr> ...