用java实现编译器-算术表达式及其语法解析器的实现
大家在参考本节时,请先阅读以下博文,进行预热:
http://blog.csdn.net/tyler_download/article/details/50708807
本节代码下载地址:
http://pan.baidu.com/s/1sjWiwPn
代码的理解和运行是吃透编译原理的关键,如果我们看的是爱情动作片,自然选择无码的好,但如果看得是计算机课程,则必须有码,无码的计算机理论都是耍流氓。
当前,java所实现的简易编译器目的是将一条或一组含有加号和乘号的算术表达式编译成类似汇编语言的伪码,因此必须给算术表达式设立一组语法规则,那么程序才能对输入的表达式进行分析。我们把一组带有分号的算术表达式称为statements, 例如:
1+2*3+4;
2+3*4+5;
3+4*5+6;
这三个表达式的集合称为statements.同时将一组表达式中的某一条带有分号的表达式称为expression, 这样statements 就是由一个或多个expression组成的:
因此statements的语法规则可以写成:
statements -> expression; | expression; statements
大家看到该语法定义跟我在上一篇文章中举的例子有所不同:
1. 在-> 右边有两组解析规则,他们用符号 | 分割开。
2. -> 左边的被解析的对象居然在右边的解析规则中出现,形成了一种循环,也就是用自己来解释自己,这种情况在编译原理中称为左循环LR (Left recursive).
这里,大家可能会发现语法定义的一些问题:
1. 右边有两组解析规则,用右边替换左边时,到底选取哪一组?
2. 左边的符号(statements) 出现在右边的规则中,替换的话就会出现死循环:
statements(buffer) {
expression(buffer);
statements(buffer); //此处将导致循环调用
}
这些问题,在后面我们再加以解决,暂且先继续给出余下的语法规则:
Expression ->expression + term | term;
term -> term* factor | factor
factor ->NUMBER | (expression)
看到这,大家会不会有点恼火,为什么这组语法规则能够用来解析一组算术表达式? 你是根据什么办法给出这组规则的?我以前在读编译原理的相关书籍时也会有这些郁闷和困惑,都不知道作者是怎么想到的,书中解释有含糊不清,直到现在我才明白,在学习的早期,有些地方你必须先囫囵吞枣,带着疑惑看到后面,你自然就会明白,所以大家在此先无需理解我是怎么给出这组语法定义的,先记着,然后把代码跑一边,看看结果,有个感性认识,在后续文章中,我会慢慢解释,如何根据要编译的文本,给出相应的语法规则。
现在我们来解决前面提到的两个问题, ->右边有两组替换规则,在语法解析的时候,如何决定选取哪一组?在编译原理的实现技巧中,有一种方法叫look ahead, 举个例子,对规则:
statements ->expression; | expression; statements
替换时用“| “ 左边的 expression; 还是右边的expression; statements呢,办法是当我们在程序中,读到第一个分号”;” 时,再继续读入下一个符号,如果继续读入符号时,返回的是输入的结束标志(EOI) 那么我们就使用“|” 左边的规则来替换,如果继续读入的符号不是结束标志,那意味着分号后边还有需要解析的信息,那就使用“|” 右边的替换规则,这种技巧在语法解析中就叫look ahead.
如何解决语法规则中出现循环调用呢?我们需要对语法规则做一些更改,更改原理在以后的文章中再做进一步的解释,请大家再囫囵吞枣一次,我知道吃东西不消化会对胃不好,黄天在上,这里是最后一次这样,请大家原谅,修改后的语法规则如下:
1. statements -> ‘空‘ | expression; statements
2. expression-> term expression'
3. expression'-> +term expression' | ‘空‘
4. term -> factor term'
5. term' -> * factor term' | ‘空‘
6. factor -> number | (expression)
这组修改后的语法规则比修改前更加难以理解,但能确保,这组规则不会出现修改前那样导致解析死循环。语法规则中的’空’ 表示结束,什么都不做。例如如果我们输入一个空字符串””给语法解析器,那么规则1中就以”空”来解析输入的空字符串,其结果就是程序什么都不做,直接返回,在程序中”空” 相当于return语句。
我们用表达式:1 + 2 ; 看看语法规则形成的解析树是怎样的:
在下面给出的视频中,我将对代码实现进行详细的讲解,同时通过运行代码,让大家体会到执行的效果,以帮助大家对语法解析的原理和实现有深一步的认识,大家把代码下下来,对着视频中的步骤运行一次,便可得知一个语法解析器的“五脏六腑"是如何组合运行的。由于视频中会出现代码解析,如果画面分辨率过低,可能无法看清代码,请大家在观看视频时将分辨率设置成高清或1080P。
由于csdn无法插入视频,我将视频地址给出如下:
http://v.youku.com/v_show/id_XMTQ4MTI2NzgyMA==.html?firsttime=0&from=y1.4-2
用java实现编译器-算术表达式及其语法解析器的实现的更多相关文章
- 使用 java 实现一个简单的 markdown 语法解析器
1. 什么是 markdown Markdown 是一种轻量级的「标记语言」,它的优点很多,目前也被越来越多的写作爱好者,撰稿者广泛使用.看到这里请不要被「标记」.「语言」所迷惑,Markdown 的 ...
- Boost学习之语法解析器--Spirit
Boost.Spirit能使我们轻松地编写出一个简单脚本的语法解析器,它巧妙利用了元编程并重载了大量的C++操作符使得我们能够在C++里直接使用类似EBNF的语法构造出一个完整的语法解析器(同时也把C ...
- Anrlr4 生成C++版本的语法解析器
一. 写在前面 我最早是在2005年,首次在实际开发中实现语法解析器,当时调研了Yacc&Lex,觉得风格不是太好,关键当时yacc对多线程也支持的不太好,接着就又学习了Bison&F ...
- 在.NET Core中使用Irony实现自己的查询语言语法解析器
在之前<在ASP.NET Core中使用Apworks快速开发数据服务>一文的评论部分,.NET大神张善友为我提了个建议,可以使用Compile As a Service的Roslyn为语 ...
- 语法解析器续:case..when..语法解析计算
之前写过一篇博客,是关于如何解析类似sql之类的解析器实现参考:https://www.cnblogs.com/yougewe/p/13774289.html 之前的解析器,更多的是是做语言的翻译转换 ...
- 手写token解析器、语法解析器、LLVM IR生成器(GO语言)
最近开始尝试用go写点东西,正好在看LLVM的资料,就写了点相关的内容 - 前端解析器+中间代码生成(本地代码的汇编.执行则靠LLVM工具链完成) https://github.com/daibinh ...
- [java]输入一个算术表达式输出结果
动手有益. 输入一个表达式,没有括号,数字小于0-9之间,输出计算结果,所有的中间结果化为整形.例如: 输入:3+8×2/9-2 输出:2 /** * input a calculate stri ...
- 【读书笔记】-【编程语言的实现模式】-【LL(1)递归下降的语法解析器】
形如:[a,b,c] [a,[b,cd],f] 为 嵌套列表 其ANTLR文法表示: list :'[' elements ']'; // 匹配方括号 elements : elements (',' ...
- 利用栈实现算术表达式求值(Java语言描述)
利用栈实现算术表达式求值(Java语言描述) 算术表达式求值是栈的典型应用,自己写栈,实现Java栈算术表达式求值,涉及栈,编译原理方面的知识.声明:部分代码参考自茫茫大海的专栏. 链栈的实现: pa ...
随机推荐
- Android adb获取屏幕分辨率
获取Android设备屏幕分辨率,可以采用最快捷的方式,使用ADB命令获取即可: 打印详细方式: adb shell dumpsys window displays 执行结果: Dump time : ...
- unlimited channel buffer in Go
channel buffer可以事先分配大小,但是这些是需要占用内存的,事先分配几G内存给一个channel很浪费资源的,所以怎样创建一个无限的channel buffer呢?比较naive的写法就是 ...
- [c# 20问] 4.Console应用获取执行路径
一行代码可以搞定了~ static void GetAppPath() { string path = System.Reflection.Assembly.GetExecutingAssembly( ...
- PLSQL(PL/SQL)集成Team Foundation Server (TFS),实现数据库代码的版本管理
PL/SQL是面向Oralcle数据库的集成开发环境,是众多Oracle数据库开发人员的主要工具.由于PL/SQL(百度百科)不仅是一种SQL语言,更是一种过程编程语言,在项目实施过程中,会积累大量除 ...
- 微软DevOps软件开发高级培训课程(深圳站) 2016.04.06
深圳特区云集了国内众多大型IT企业,作为北上广深的一线城市,当之无愧! 我们在深圳同方信息港的微软办公室是举行培训,60人的培训教室,生生被挤满了80人,过道都被全部占用了.可惜由于换了电脑,把照片搞 ...
- javascript 对象克隆
浅克隆 先看代码: /** * 浅克隆 克隆传入对象,只克隆一层 * @param {any} source */ function shallowClone(source) { var tiaget ...
- (php)实现万年历
<?php //修改页面编码 header("content-type:text/html;charset=utf-8"); //获取当前年 $year=$_GET['y'] ...
- ABP框架踩坑记录
ABP框架踩坑记录 ASP.NET Boilerplate是一个专用于现代Web应用程序的通用应用程序框架. 它使用了你已经熟悉的工具,并根据它们实现最佳实践. 文章目录 使用MySQL 配置User ...
- ABP框架入门踩坑-配置User Secrets
配置User Secrets ABP踩坑记录-目录 起因 因为以往习惯在User Secrets中保存连接字符串之类信息,但当我把连接字符串移到secrets.json中后,却发现在迁移过程中会报如下 ...
- JavaScript中的类数组对象
在javascript中,对象与数组都是这门语言的原生规范中的基本数据类型,处于并列的位置. 一般来说,如果我们有一个对象obj和一个数组a: obj["attr1"]; / ...