NFA与DFA

正则表达式匹配，包含两个东西，一个是表达式，一个文本。

NFA(Nondeterministic Finite Automaton)，不确定有穷自动机，表达式主导，NFA去吃文本，贪婪算法吃下去，如果因为前面吃得太多，导致后面没的吃（后面匹配失败），前面吃的要吐出一点，后面还匹配不成功，前面再吐出一点。。。

DFA(Deterministic Finite Automaton)，确定有穷自动机，文本主导，DFA去找吃货，去掉不能吃的吃货，找到最合适的吃货。

举例来说：.*[0-9]+，去匹配 hangzhou 2015，从程序的角度来看，[0-9]+ 是死代码，因为.*是大范围，[0-9]+是小范围，按道理永远不会被匹配到。

实际的匹配流程是：

.*一直吃到5，然后发现坏了，吃太多了，导致[0-9]+没法匹配，于是吐出5，这样就导致[0-9]+匹配成功，也就是说，.*匹配hangzhou 201，[0-9]+匹配5，显然，这不是好的匹配结果，好的匹配结果应该是，.*匹配hangzhou ，[0-9]+匹配2015，但是NFA不管，我只要匹配成功就好了，才不管你是不是最优匹配呢。

如何解决上面的问题呢？

因为量词是优先匹配的，也就是尽量多吃，解决办法是忽略优先量词，也就是尽量少吃，使用 (.*?)([09]+)，匹配结果就是 .*?匹配hangzhou ，[0-9]+匹配2015，

考虑下面的问题，notepad搜索关键字，如果一行多次出现，搜索结果就会重复列出对应的行，如何解决？

使用正则表达式如下：^(.*abc.*)+$, 仔细思考，可以去掉+，使用^(.*abc.*)$, 前面的.*尽量多吃，abc 匹配最后一行中的最后一个abc，由于notepad 本来就是按行，列出结果的，可以直接写成 .*abc

NFA与DFA的更多相关文章

NFA转DFA - json数字识别
json的主页上,提供了number类型的符号识别过程,如下: 图片引用:http://www.json.org/json-zh.html 实际上这张图片表示的是一个状态机,只是状态没有标出来.因为这 ...
求子串-KPM模式匹配-NFA／DFA
求子串数据结构中对串的5种最小操作子集:串赋值,串比较,求串长,串连接,求子串,其他操作均可在该子集上实现数据结构中串的模式匹配 KPM模式匹配算法基本的模式匹配算法 //求字串subStrin ...
nfa转dfa，正式完成
为了加速转换的处理,我压缩了符号表.具体算法参考任何一本与编译或者自动机相关的书籍. 这里的核心问题是处理传递性闭包,transitive closure,这个我目前采取的是最简单的warshall算 ...
NFA和DFA区别
一个数据块的访问时间等于寻道时间.旋转延迟时间和数据传输时间三者之和: NFA和DFA区别: 一个状态如A,遇0可以转换到下一个状态B或C,因为选择多所以不确定,因此为不确定的有限自动机: 一个状态还 ...
利用子集构造法实现NFA到DFA的转换
概述 NFA非有穷自动机,即当前状态识别某个转换条件后到达的后继状态不唯一,这种自动机不便机械实现,而DFA是确定有限状态的自动机,它的状态转换的条件是确定的,且状态数目往往少于NFA,所以DFA能够 ...
计算理论：NFA转DFA的两种方法
本文将以两种方法实现NFA转DFA,并利用C语言实现. 方法二已利用HNU OJ系统验证,方法一迷之WA,但思路应该是对的,自试方案,测试均通过. (主要是思路,AC均浮云,大概又有什么奇怪的Case ...
[编译原理代码][NFA转DFA并最小化DFA并使用DFA进行词法分析]
#include <iostream> #include <vector> #include <cstring> #include "stack" ...
编译原理-NFA构造DFA
本题摘自北邮的编译原理与技术. 首先,根据此图构造状态转换表表中第一列第一行表示从第一个符号B通过任意个空转换能到达的节点,Ia表示由此行的状态数组({B,5,1}可以看作0状态)经过一个a可以到达 ...
NFA到DFA实例
下面图使用NFA表示的状态转换图, 使用子集构造法,有如下过程, ε-closure(0) = {0, 1, 2, 3, 4, 6, 7}初始值,令为AA = {0, 1, 2, 3, 4, 6, 7 ...

随机推荐

zoj 3659 Conquer a New Region
// 给你一颗树选一个点,从这个点出发到其它所有点的权值和最大// i 到 j的最大权值为 i到j所经历的树边容量的最小值// 第一感觉是树上的dp// 后面发现不可以// 看了题解说是并查集// ...
AFNetworking教程
转:http://www.lanrenios.com/tutorials/network/2012/1126/527.html AFNETWORKING AFNetworking他是一个现在非常用得多 ...
C/C++面试小知识点
1.static有什么用途. 解答: 在函数体中,一个被声明为静态的变量在这一函数被调用过程中维持其值不变. 在模块内(但在函数体外),一个被声明为静态的变量可以被模块内所有函数访问,但不能被模块外其 ...
Android ViewPager欢迎页+引导页+进入首页
import android.app.Activity; import android.content.Intent; import android.content.SharedPreferences ...
Bigger is Better
题意: 有n个火柴棒,已知拼成9个数字花费的数目,求能拼出的能整除m的最大数分析: dp[i][j]表示,用i个火柴棒,拼出的数余m余数为j时的最大数 int tmp=dp[i][j]*10+k;( ...
acdream 1044
题意:有你一个草坪,草的初始高度都是100,让你用割草机割,割草机只能横着或竖着割,每次割的高度一定,问你能不能割出给定的草坪出来. 考虑任意一个草被割要么是横着要么竖着,所以任意一个草必然是它所在行 ...
spoj 839 Optimal Marks（二进制位，最小割）
[题目链接] http://acm.hust.edu.cn/vjudge/problem/viewProblem.action?id=17875 [题意] 给定一个图,图的权定义为边的两端点相抑或值的 ...
linux 下的进程管理工具 supervisor
在linux下监控进程: 1)yum install python-setuptools linux下的python安装工具 2)easy_install supervisor 安装sup ...
HDU5734:Acperience（方差）
题意: 给出n个数xi,确定一个值α,使得Σ(xi-α)^2的值最小. 分析: 可以猜想是方差,不懂得可以去方差了解一下. 那么α即为∑(xi)/n,然后要注意的是转化为分数,首先我们不能用小数转分数 ...
Todolist
UValive 6041(KD tree) UValive 6042(DP) UValive 6044(图论)

NFA与DFA

NFA与DFA的更多相关文章

随机推荐

热门专题