前言

不要让用户被那些“专业术语”吓住!
用心设计的提示和反馈信息是软件设计者的“职业良心”。
 
内容
1 存在哪些错误?
2 美化错误提示
3 错误恢复策略
 
1 存在哪些错误?
在DSL语言开发周期内,首先需要设计文法,根据文法生成翻译器,然后输入语言样本测试翻译器的效果,以及根据存在的翻译问题调整翻译策略。这其中就可能存在两类错误:文法错误语言样本错误
在Parr将一些错误拉出来游街,以及盛赞ANTLR在错误提示和恢复方面的优异表现的描述中,可以观察到一些错误提示和恢复的策略和惯例:
(1)错误恢复是从语言样本中的语法错误中恢复过程,常通过修改输入符号或吃掉一些符号直到解析器到达识别了一个确定性的规则状态;
(2)应该极力避免级联错误提示信息,即每个语法错误只给出一条错误提示信息。
 
2 美化错误提示
打开ANTLR的-dfa选项,可以通过查看生成的DFA,了解识别器的决策和状态信息。
 
为实现美化的错误提示,在文法中覆盖BaseRecognizer的getErrorMesage()和getTokenErrorDisplay()方法。(文中要求覆盖displayRecognitionError()而不是getErrorMesage(),其实查看生成的代码可以产出前者会调用后者)。
 
一些内建的异常类
异常 说明
RecognitionException 识别异常。ANTLR生成的识别器抛出异常的基类。记录错误发生时的输入流信息:识别器当前看到的符号(字符、Token或树节点)的索引,错误符号的指针、当前行、行内位置。
MismatchedTokenException Token不匹配异常。指出解析器预期的特定符号当前未找到。记录额外的Token类型信息。
MismatchedTreeNodeException 树节点不匹配异常。 与上一异常类似,指出树解析器预期的特定token类型节点未找到。
NoViableAltException 无可行选项异常。识别器达到决策点,但向前看符号与所有选项均不一致。记录向前看DFA中决策号和状态号,同时记录做出此决策的一块文法。
EarlyExitException 过早退出异常。识别(...)+ EBNF子规则时,只少匹配一个,但该规则没有匹配任何符号。记录DFA中决策号。
FailedPredicateException 失败的谓词异常。语义谓词求值为false。记录规则名称和谓词文本。
MismatchedRangeException 范围不匹配异常。范围如[a..z],未匹配范围中任何符号。记录范围中最小和最大元素。
MismatchedSetException 集合不匹配异常。集合如{'a','b'},未匹配集合中任何符号。记录集合中所有符号。
MismatchedNostSetException 非集合不匹配异常。非集合指用~操作符表示的集合的拟。与上一个异常类似。
 
ANTLR识别器不用字符串信息创建异常对象,只跟踪和记录必要的用于生成错误的现场信息。
基识别器类BaseRecognizer中多个报告错误方法可以生成本地的错误信息,不要指望从上面的异常类中getMessage()方法返回什么异常信息。
 
除异常信息外,可以在文法中用自定义动作提供错误信息。
一个重要的错误信息提示是指出发生错误时所用的解析规则(栈),一般方法是在文法@members中定义个错误信息栈,在对用户意义最清晰的规则中的@init/@after动作中分别执行入栈和出栈操作,同时在@memebers动作中覆盖getErrorMessage()方法,它使用该错误信息栈的peek()获取当前现场的提示信息。
 
错误零容忍:遇到第一个错误立即退出
需要在文法@members动作中覆盖mismatch()、recoverFromMismatchedSet()方法以及覆盖默认的@rulecatch。
 
覆盖@rulecatch动作会对所有规则产生影响,可以采用细粒度的规则级catch动作来执行手动恢复操作。
 
词法和树文法的错误与一般文法类似,区别仅在于处理的是字符和树节点。
 
3 错误恢复策略
站在巨人的肩膀上
ANTLR的错误恢复机制参考了Nikalaus Wirth的"Algorithms + Data Structures = Programs"(八卦一下:好像他靠这句话拿到图灵奖)、Rodney Topor的"递归下降解析器中错误恢复记录"和一些Josef Grosch在CoCo解析器生成器的一些思路。
 
本质上的思路是,识别器在遇到不匹配的符号错误时,先尽可能的尝试单个符号插入删除是否可以恢复,如果不能,再吞掉一些符号直到向前看符号属于一个重新同步集(resynchronization set)后退出该规则。
 
重新同步集是输入符号的集合,这些符号可以合法的在当前规则和当前规则调用链中出现。

ANTLR3完全参考指南读书笔记[08]的更多相关文章

  1. ANTLR3完全参考指南读书笔记[01]

    引用 Terence Parr. The Definitive ANTLR Reference, Building Domain Specific Languages(antlr3 version). ...

  2. ANTLR3完全参考指南读书笔记[06]

    前言 这段时间在公司忙的跟狗似的,但忙的是没多少技术含量的活儿. 终于将AST IR和tree grammar过了一遍,计划明天写完这部分的读书笔记.   内容 1 内部表示AST构建 2 树文法   ...

  3. ANTLR3完全参考指南读书笔记[02]

    前言 程序语言是什么? 用wiki上的描述,程序语言是一种人工设计的语言,用于通过指令与机器交互:程序语言是编程程序的标记,而程序是一种计算或算法的描述.详细介绍和背景信息参考: Programmin ...

  4. ANTLR3完全参考指南读书笔记[07]

    前言 真正意义上的程序员都很懒,懒的连多余的一行代码也不写. 如果能将底层满手油污的活儿都可以交给别人去做,自己就扮演个智囊团成员的角色,生活会比想象中的还要惬意. 严格的按照指令执行长时间不知疲倦的 ...

  5. ANTLR3完全参考指南读书笔记[05]

    前言 仅生成给出true/false的识别器是没有多大用处的,自然的就有在识别过程中遇到某一结构时执行一段代码.存储该结构中信息的想法. ANTLR提供了在文法中嵌入属性和动作超级混合“文法”,可以生 ...

  6. ANTLR3完全参考指南读书笔记[04]

    前言 学习框架或第三方库的方法是什么 (1)少量的浏览manual或tutoral,只关注程序所需的特征,再完善其详细内容和特征的认识? (2)花大量的时间研究详细内容,再考虑程序实现? 这是个先有鸡 ...

  7. ANTLR3完全参考指南读书笔记[03]

    前言 文中第4章内容有点多,有点枯燥,但不坚持一下,之前所做的工作就白做了. 再次确认一下总体目标: protege4编辑器中Class Definition中语法解析和错误提示: Java虚拟机规范 ...

  8. HTTP权威指南读书笔记

    HTTP权威指南笔记 读书有两种境界,第一种境界是将书读薄,另一种是读厚.本篇文章就是HTTP权威指南的读书笔记,算是读书的第一重境界,将厚书读薄.文章对HTTP的一些关键概念做了比较详细的概述,通读 ...

  9. css权威指南读书笔记

    今天翻手机,翻到了许久之前看css权威指南时的笔记,遂移到博客中来. 1.属性选择器p.one class名为one的p元素p[class][name] 含有class和name属性的p元素p[cla ...

随机推荐

  1. 常州培训 day4 解题报告

    第一题:(简单的模拟题) 给出一个N位二进制数,有‘+’, ‘-’, ‘*’, ‘/’ 操作,分别表示加1,减1,乘2,除以2,给出M个操作,求出M个操作后的二进制数.N,M<=5000000; ...

  2. php unicode

    在很多场合能看到unicode编码过的文字,如“\u6d3b\u52a8\u63a5\u53e3”,虽然程序会认识,但人眼无法阅读,很不方便,网络上很多人写了很多的转换函数,但是一个比一个臃肿,终于发 ...

  3. 在网页中编辑报表的报表设计器Stimulsoft Reports Designer.Web报表控件

    Stimulsoft Reports Designer.Web报表控件是一款网页报表设计器.您想在网页中编辑您的报表吗?现在是可能的! Stimulsoft Reports Designer.Web ...

  4. android启动模式2

    Android中的启动模式(下) 在这篇文章中,我会继续跟大家分享有关于Android中启动模式的相关知识.当然,如果对这个启动模式还不完全了解或者没有听过的话,可以先看看我之前写的有关于这个知识点的 ...

  5. c# Winforms WebBrowser - Clear all cookies

    Hello,   I recently search for a method to delete all cookies from the build in .NET WinForms WebBro ...

  6. JVM-JDK命令行工具

    JDK命令行工具 当我们进入JDK的安装目录里面的/bin目录,会发现有很多小工具,有我们熟悉的也经常用的java,javac,也有很多我们不怎么用到很陌生的工具.下面看看哪些平时不怎么用到的工具吧. ...

  7. YAML 语言语法

    发现很多开源的软件的配置文件都使用了这种语言来描述,据说是简单强大,很不巧,ansible也使用了这种语言来描述配置,学习ansible之前,先学习一下YAML语言. YAML基本语法规则如下: 大小 ...

  8. Nginx SSL配置过程

    1. 在godaddy购买了UCC SSL(最多5个域名)的SSL证书 2. 设置证书 -- 管理 -- 3. 需要制作证书申请CSR文件(在线工具制作或者openssl命令制作),保存CSR和key ...

  9. python tuple 操作

    特点:不可改(与字符串一样.不允许删除和修改) 操作:1.print 可使用跟%的元祖  print( '%s is %d years old' % (name, age)) 2.像列表一样有索引 3 ...

  10. 获取hadoop的源码和通过eclipse关联hadoop的源码

    一.获取hadoop的源码 首先通过官网下载hadoop-2.5.2-src.tar.gz的软件包,下载好之后解压发现出现了一些错误,无法解压缩, 因此有部分源码我们无法解压 ,因此在这里我讲述一下如 ...