有没有不适合使用flex/lex作为词法分析器的语言?(摘自知乎)
本问题及解答摘自本人知乎 http://www.zhihu.com/people/chaos-xie http://www.zhihu.com/question/29922657
感谢知乎网友的回答!现将问题及可能的解答记录如下:
有没有不适合使用flex/lex作为词法分析器的语言?
Javascript 正则表达式字面量和除法操作符的二义性, 很难用 lex 解决, 一般只用 lex 做很少很少的事情, 然后把真正含义的辨清延迟到 parse 阶段.
有一个用 lex 中判断 / 含义的方案, 主要是通过保存前一个 token 状态来做判断, 你感受一下它的复杂度:
`//` 总是辨认为行注释开始
如果符号是 `/` 或者 `/=`, 并且前一个 token 是下列 token 之一, 那它就是除法运算符:
]
Identifier Number RegularExpression String
class false null private protected public super this true
get include set
如果前一个 token 是下列 token 之一, 那它就是正则表达式的开始:
! != !== # % %= & && &&= &= ( * *= + += , - -= ->
. .. ... / /= : :: ; < << <<= <= = == === > >= >> >>= >>> >>>=
? @ [ ^ ^= ^^ ^^= { | |= || ||= ~
abstract break case catch const continue debugger default delete do else enum
export extends final finally for function goto if implements import in instanceof
interface is namespace native new package return static switch synchronized
throw throws transient try typeof use var volatile while with
但是它依然判断不了 前一个 token 是 ) } 的情况...
if (true) /a/g ---> 正则表达式
(x+y)/2 ---> 除法
{}/a/g ---> 正则表达式
+{}/a/g ---> 除法
所以得添加一个状态栈来判断右括号是控制结构 if / for / while 的括号还是表达式的括号.
再加一个状态栈来判断右大括号是 block 结束还是 object literal 的结束.
但是它依然判断不了前一个 token 是 ++ 或 -- 的情况
a++/a/g ---> 除法
RegExp.prototype.foo = 3
++/a/g.foo ---> 正则表达式
所以还得判断前面的 ++ 到底是后缀运算符, 还是前缀运算符...
至此你的 lexer 充满了一堆非常复杂的状态... 你会思考人生的价值, 怀疑 lex 到底有啥意义, 为什么不直接用一个 scannerless 的 parser 解决这个变态的语言?
eta的答案所提到的问题还是相对比较简单的,只要你把bison当lex用就可以轻松解决,所有的那些状态都embed在你的文法里面了。主要标准就是,当你需要一个表达式而此时你看到的是/的时候,如果他不是注释,那就肯定是正则表达式。
Chaobs 评论 vczh:
我明白你和Zete的意思了,这就是说有些记号的含义只有到了语法分析阶段才能消除二义性。我暂时还没有考虑去实现一个C++的词法、语法分析器,也没有考虑去实现函数式语言的分析,不过我会考虑去做一个语义分析和语法分析同时做的例子的。
杨个毛 评论 Chaobs:
真正复杂的问题是bison搞不定的,譬如说C++需要语义分析和语法分析同时做,让语义分析的结果来指导语法分析到底要选择哪条grammar rule来resolve conflict。
有没有不适合使用flex/lex作为词法分析器的语言?(摘自知乎)的更多相关文章
- Flex 国际化(中英语言适配)
原文地址:http://www.cnblogs.com/meteoric_cry/archive/2011/01/13/1934404.html(由于此贴时间久远,已做微调) 1.新建Flex Pro ...
- Flex Builder 4.6切换语言
一.修改Flex builder 1.用无格式编辑器打开FlashBuilder.ini 2.把zh_CN替换成"en_US" 二.修改MyEclipse插件 1.用无格式编辑器打 ...
- 编译原理实战——使用Lex/Flex进行编写一个有一定词汇量的词法分析器
编译原理实战--使用Lex/Flex进行编写一个有一定词汇量的词法分析器 by steve yu 2019.9.30 参考文档:1.https://blog.csdn.net/mist14/artic ...
- Flex & Bison 开始
Flex 与 Bison 是为编译器和解释器的编程人员特别设计的工具: Flex 用于词法分析(lexical analysis,或称 scanning),把输入分割成一个个有意义的词块,称为记号(t ...
- DarkStone - 跨平台移动应用开发之 Flex 的崛起
我的好友Ds 发布一个flex的消息.我帮忙转发 DarkStone - 跨平台移动应用开发之 Flex 的崛起 (2013-08-20 22:28:32) 此文章由 周戈 (DarkSton ...
- Flex的正则表达式匹配速度与手工代码的比较
flex是一个词法分析器生成器,它是编译器和解释器编程人员的常用工具之一.flex的程序主要由一系列带有指令(称为动作代码)的正则表达式组成.在匹配输入时,flex会将所有的正则表达式翻译成确定性有穷 ...
- [转载] 如何使用Lex/YACC
原文: http://segmentfault.com/a/1190000000396608?hmsr=toutiao.io&utm_medium=toutiao.io&utm_sou ...
- Windows下lex 与 yacc的使用
Windows下lex 与 yacc的使用 首先 下载下载flex和bison.网址是http://pan.baidu.com/s/1dDlfiW5 选择下载就好了,下载后解压到你电脑中的任一盘中. ...
- 从不同的角度分析Flex的优缺点
从不同的角度分析Flex的优缺点 技术角度: (1)具备了RIA时代富客户端的优点(C/S+B/S) (2)支持多种服务器语言(JAVA..NET.PHP)及主流框架(Spring.Hibernate ...
随机推荐
- 记忆化搜索,FatMouse and Cheese
题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=1107 http://acm.hdu.edu.cn/showpro ...
- mybatis学习记录七——延迟加载
14 延迟加载 14.1 什么是延迟加载 resultMap可以实现高级映射(使用association.collection实现一对一及一对多映射),association.co ...
- o'Reill的SVG精髓(第二版)学习笔记——第一章
1.1图形系统 计算机中描述图形信息的两大系统是栅格系统(raster graphics)和矢量图形(vector graphics) 1.1.4矢量图形的用途 ①计算机辅助绘图(CAD)程序. ②设 ...
- Consul vs Zookeeper vs Etcd vs Eureka
为什么不应该使用ZooKeeper做服务发现 Eureka 更好 ,etcd作为一个受到Zookeeper与doozer启发而催生的项目,除了拥有与之类似的功能外,更具有以下4个特点{![引自Dock ...
- Alert Log删除
标题:Renaming or Deleting the Alert Log While an Oracle Instance is Up & Running (文档 ID 74966.1) Q ...
- c#的二进制序列化组件MessagePack介绍
c#的序列化有多种,我一般喜欢用第三方组件,一个公共组件要拿出来用,而且支持很多语言,甚至以此谋生,肯定有其优势. 有或者说存在必然有其合理性,经过几年开发,我更加喜欢第三方的东西,类似序列化的东西. ...
- Git工作流指南:Gitflow工作流
git工作流 1.Git flow 核心分支:master,dev 可能还会有:功能分支,bug修复分支,预发布分支 2.github flow:只一个长期分支,就是master 第一步:根据需求,从 ...
- poj 2186 Popular Cows :求能被有多少点是能被所有点到达的点 tarjan O(E)
/** problem: http://poj.org/problem?id=2186 当出度为0的点(可能是缩点后的点)只有一个时就存在被所有牛崇拜的牛 因为如果存在有两个及以上出度为0的点的话,他 ...
- mybatis <fireach> 拼接sql语句 org.apache.ibatis.exceptions.PersistenceException: ### Error querying database. Cause: org.apache.ibatis.builder.BuilderException: Error evaluating expression 'in'. Cause:
<select id="getUserIn" parameterType="QueryVo" resultMap="userMap"& ...
- 使用Python对SQLite数据库操作
SQLite是一种嵌入式数据库,它的数据库就是一个文件.由于SQLite本身是C写的,而且体积很小,所以,经常被集成到各种应用程序中,甚至在IOS和Android的APP中都可以集成. Python内 ...