一、part7

资料来源：https://ruslanspivak.com/lsbasi-part7/

看作者博客的标题就知道，这一节我们需要完成抽象语法树的功能。

抽象语法树和具体语法树（解析树）

例如这个表达式的例子（2 * 7 + 3）就形成了这样的一棵抽象语法树。

而该表达式的解析树（具体语法树）如下图所示：

解析树记录了解析器应用于识别输入的一系列规则。
语法分析树的根标有语法开始符号。
每个内部节点代表一个非终结符，也就是说，它代表一个语法规则应用程序，例如本例中的expr，term或factor。
每个叶节点代表一个Token。

两者的区别：

AST使用运算符/操作作为根节点和内部节点，并使用操作数作为其子节点。
与解析树不同，AST不使用内部节点表示语法规则。
AST不能代表真实语法中的每个细节（这就是为什么它们被称为abstract）的原因，例如，没有规则节点也没有括号。
与相同语言结构的分析树相比，AST的密度更高。

如何在AST中对运算符优先级进行编码？

In order to encode the operator precedence in AST, that is, to represent that “X happens before Y” you just need to put X lower in the tree than Y. And you’ve already seen that in the previous pictures.

为了在AST中编码运算符优先级，即表示“ X发生在Y之前”，您只需要在树中将X放到比Y低的位置即可。并且您已经在上一张图片中看到了。

代码实现

先编写抽象语法树接口 AST

public interface AST {

}

（它确实是一个空接口，只是为了实现多态）

二元运算符节点：

public class BinOp implements AST {

    public Token op;

    public AST left;

    public AST right;

    public BinOp(AST left, Token op, AST right){

        this.left = left;

        this.op = op;

        this.right = right;

    }

}

数字（整数）节点：

public class Num implements AST {

    public Token token;

    public int value;

    public Num(Token token){

        this.token = token;

        this.value = (Integer) token.value;

    }

}

原有的Lexer类不做改变（原来也已经说明过，Lexer类的职责是读取字符串并将它分解为各个Token）。

新增Parser类（语法解析器类，生成抽象语法树）：

（把原来的Interpreter类的一些功能划分到了它的身上，原来是返回各个部分的值，而这个时候返回各个部分合成的解析树）

public class Parser {

    private final Lexer lexer;

    private Token currentToken;

    public Parser(Lexer lexer) throws Exception {

        this.lexer = lexer;

        this.currentToken = this.lexer.getNextToken();

    }

    private void error() throws Exception {

        throw new Exception("Invalid syntax");

    }

    private void eat(Token.TokenType tokenType) throws Exception {

        if (currentToken.type == tokenType){

            currentToken = lexer.getNextToken();

        }

        else {

            this.error();

        }

    }

    private AST factor() throws Exception {

        // factor : INTEGER | LPAREN expr RPAREN

        Token token = currentToken;

        if (currentToken.type == Token.TokenType.INTEGER){

            eat(Token.TokenType.INTEGER);

            return new Num(token);

        }

        else {

            eat(Token.TokenType.LPAREN);

            AST result = expr();

            eat(Token.TokenType.RPAREN);

            return result;

        }

    }

    private AST term() throws Exception {

        // term : factor ((MUL | DIV) factor)*

        AST node = factor();

        while (currentToken.type == Token.TokenType.MUL || currentToken.type == Token.TokenType.DIV){

            Token token = currentToken;

            if (token.type == Token.TokenType.MUL){

                eat(Token.TokenType.MUL);

            }

            else {

                eat(Token.TokenType.DIV);

            }

            node = new BinOp(node, token, this.factor());

        }

        return node;

    }

    private AST expr() throws Exception {

        /*

        expr   : term ((PLUS | MINUS) term)*

        term   : factor ((MUL | DIV) factor)*

        factor : INTEGER | LPAREN expr RPAREN

         */

        AST node = term();

        while (currentToken.type == Token.TokenType.PLUS || currentToken.type == Token.TokenType.MINUS){

            Token token = currentToken;

            if (token.type == Token.TokenType.PLUS){

                eat(Token.TokenType.PLUS);

            }

            else {

                eat(Token.TokenType.MINUS);

            }

            node = new BinOp(node, token, term());

        }

        return node;

    }

    public AST parse() throws Exception {

        return this.expr();

    }

}

parser类接受一个lexer对象，职责是接收lexer对象将字符串转化为的多个token，输出表达式对应的抽象语法树AST。

NodeVisitor类，访问各个AST节点的基类（使用反射进行实现）

public abstract class NodeVisitor {

	// 调用visit方法时，先使用反射得到AST子类具体的类名，即className，

	// 然后调用"visit"+className的方法，如若node为BinOp，则调用visitBinOp()方法

	// 使用反射大大提高了编码实现的灵活性

    protected int visit(AST node) throws Exception {

        String[] strings = node.getClass().getName().split("\\.");

        String className = strings[strings.length-1];

        Method visitMethod = this.getClass().getDeclaredMethod("visit"+className, AST.class);

        return (int) visitMethod.invoke(this, node);

    }

    protected void genericVisit() throws Exception {

        throw new Exception("No this type to visit");

    }

    // 写好访问各个节点的接口方法，供实现类来实现

    abstract int visitBinOp(AST node) throws Exception;

    abstract int visitNum(AST node);

}

该类的职责是定义AST visitor需要完成的接口，以及使用反射使访问多种类型的AST变得简单。

最后是Interpreter类：

public class Interpreter extends NodeVisitor {

	// 成员变量parser

    private final Parser parser;

    public Interpreter(Parser parser){

        this.parser = parser;

    }

    @Override

    protected int visitBinOp(AST node) throws Exception {

        BinOp binOp = (BinOp)node;

        int res = 0;

        switch (binOp.op.type){

            case PLUS:

                res = visit(binOp.left) + visit(binOp.right);

                break;

            case MINUS:

                res = visit(binOp.left) - visit(binOp.right);

                break;

            case MUL:

                res = visit(binOp.left) * visit(binOp.right);

                break;

            case DIV:

                res = visit(binOp.left) / visit(binOp.right);

                break;

        }

        return res;

    }

    @Override

    protected int visitNum(AST node) {

        return ((Num)node).value;

    }

    public int interpret() throws Exception {

        AST tree = parser.parse();

        return this.visit(tree);

    }

}

Interpreter类的接收一个parser对象，其对应的职责是接收parser对象调用parser后得到的AST，即抽象语法树，然后遍历抽象语法树的各个节点，最后将语法树所代表的表达式的值输出出来。

总结各个类的职责（摘自大佬博客）：

客户端类Main：

public class Main {

    public static void main(String[] args) throws Exception {

        Scanner scanner = new Scanner(System.in);

        while (true) {

            System.out.print("spi> ");

            String text = scanner.nextLine();

            if (text.equals("exit"))

                break;

            Lexer lexer = new Lexer(text);

            Parser parser = new Parser(lexer);

            Interpreter interpreter = new Interpreter(parser);

            int res = interpreter.interpret();

            System.out.println("res: " + res);

        }

    }

}

运行结果：

二、part8

资料来源：https://ruslanspivak.com/lsbasi-part8/

这一part我们主要要完成一元运算符的功能，在我们之前看起来好像已经完成了计算加减乘除表达式的所有功能，实际上我们还无法计算像这样一些表达式：+1 -3，（-1）*4，(-2-3) * (+4-5)等等这些带正负号的数，这一节我们就是为了解决正负号这种一元操作符无法表达的问题。

修改或新增的类：

由于我们只是增加一个新语法，所以词法解析器Lexer的代码是完全不用修改的，主要需要修改Parser和添加一个AST的子类来代表一元运算符节点，而增加了一个新类型的节点后，我们自然还需要添加访问这个新类型节点的方法，因此我们还需要为NodeVisitor编写新接口visitUnaryOp，并为实现类Interpreter添加对应的方法实现。

一元运算符节点类UnaryOp：

public class UnaryOp implements AST {

    public Token op;

    public AST expr;

    public UnaryOp(Token op, AST expr){

        this.op = op;

        this.expr = expr;

    }

}

和二元操作符节点BinOp类非常的类似，不细说。

然后一元运算符应该是属于factor（因数）生成式的一部分，如：-5*3，(-5)整体应该是一个因数

故factor的生成式可修改为：

factor : (PLUS | MINUS) factor | INTEGER | LPAREN expr RPAREN

由此，我们只需为Parser的factor函数添加一种情况即可：

factor函数：

private AST factor() throws Exception {

    // factor : (PLUS | MINUS) factor | INTEGER | LPAREN expr RPAREN

    Token token = currentToken;

    // ++++++这部分是添加的代码

    if (token.type == Token.TokenType.PLUS || token.type == Token.TokenType.MINUS){

        if (token.type == Token.TokenType.PLUS){

            eat(Token.TokenType.PLUS);

        }

        else {

            eat(Token.TokenType.MINUS);

        }

        return new UnaryOp(token, factor());

    }

    // ++++++++++++++++++++++

    else if (currentToken.type == Token.TokenType.INTEGER){

        eat(Token.TokenType.INTEGER);

        return new Num(token);

    }

    else {

        eat(Token.TokenType.LPAREN);

        AST result = expr();

        eat(Token.TokenType.RPAREN);

        return result;

    }

}

NodeVisitor类：

public abstract class NodeVisitor {

    ...

    abstract int visitUnaryOp(AST node) throws Exception;

}

使用反射的巧妙之处就体现出来了，在这里我们就只需要添加新函数即可，而无需为新类型添加判断之类的新的操作，代码维护起来非常方便。

Interpreter.visitUnaryOp函数：

@Override

int visitUnaryOp(AST node) throws Exception {

    UnaryOp unaryOp = (UnaryOp)node;

    if (unaryOp.op.type== Token.TokenType.PLUS){

        return +visit(unaryOp.expr);

    }

    else {

        return -visit(unaryOp.expr);

    }

}

运行效果：

至此，我们已经完成所有的解析四则运算表达式的功能。

上一篇：手写Pascal解释器（二）

下一篇：未完待续

手写Pascal解释器（三）的更多相关文章

手写Pascal解释器（二）
目录一.part4 补充理论知识二.part5 设计生成式三.part6 一.part4 承接上次的内容,我们继续编写part4,这个部分我们的任务是完成输入一个仅带乘除运算符的表达式,然后返回 ...
手写Pascal解释器（一）
目录一.编写解释器的动机二.part1 三.part2 四.part3 一.编写解释器的动机学习了Vue之后,我发现对字符串的处理对于编写一个程序框架来说是非常重要的,就拿Vue来说,我们使用该 ...
opencv 手写选择题阅卷 (三)训练分类器
opencv 手写选择题阅卷 (三)训练分类器 1,分类器选择:SVM 本来一开始用的KNN分类器,但这个分类器目前没有实现保存训练数据的功能,所以选择了SVN分类器; 2,样本图像的预处理和特征提取 ...
TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络多层卷积网络的基本理论构建一个多层卷积网络权值初始化卷积和池化第一层卷积第二层卷积密集层连接 ...
使用神经网络来识别手写数字【译】（三）- 用Python代码实现
实现我们分类数字的网络好,让我们使用随机梯度下降和 MNIST训练数据来写一个程序来学习怎样识别手写数字. 我们用Python (2.7) 来实现.只有 74 行代码!我们需要的第一个东西是 MNI ...
手写JAVA虚拟机（三）——搜索class文件并读出内容
查看手写JAVA虚拟机系列可以进我的博客园主页查看. 前面我们介绍了准备工作以及命令行的编写.既然我们的任务实现命令行中的java命令,同时我们知道java命令是将class文件(字节码)转换成机器码 ...
【TensorFlow-windows】(三) 多层感知器进行手写数字识别（mnist）
主要内容: 1.基于多层感知器的mnist手写数字识别(代码注释) 2.该实现中的函数总结平台: 1.windows 10 64位 2.Anaconda3-4.2.0-Windows-x86_64. ...
手写DAO框架（三）-数据库连接
-------前篇:手写DAO框架(二)-开发前的最后准备--------- 前言上一篇主要是温习了一下基础知识,然后将整个项目按照模块进行了划分.因为是个人项目,一个人开发,本人采用了自底向上的开 ...
手写MQ框架（三）-客户端实现
一.背景书接手写MQ框架(二)-服务端实现 ,前面介绍了服务端的实现.但是具体使用框架过程中,用户肯定是以客户端的形式跟服务端打交道的.客户端的好坏直接影响了框架使用的便利性. 虽然框架目前是通过 ...

随机推荐

Vue指令实现原理
前言自定义指令是vue中使用频率仅次于组件,其包含bind.inserted.update.componentUpdated.unbind五个生命周期钩子.本文将对vue指令的工作原理进行相应介绍, ...
精尽Spring Boot源码分析 - 剖析 @SpringBootApplication 注解
该系列文章是笔者在学习 Spring Boot 过程中总结下来的,里面涉及到相关源码,可能对读者不太友好,请结合我的源码注释 Spring Boot 源码分析 GitHub 地址进行阅读 Sprin ...
限流神器Sentinel，不了解一下吗？
概述书接上回:你来说说什么是限流? ,限流的整体概述中,描述了限流是什么,限流方式和限流的实现.在文章尾部的分布式限流,没有做过多的介绍,选择了放到这篇文章中.给大伙细细讲解一下 Sentine ...
不带Anchors和NMS的目标检测
前言: 目标检测是计算机视觉中的一项传统任务.自2015年以来,人们倾向于使用现代深度学习技术来提高目标检测的性能.虽然模型的准确性越来越高,但模型的复杂性也增加了,主要是由于在训练和NMS后处理过 ...
JSR - 133 都解决了哪些问题？
究竟什么是内存模型? 在多处理系统中,每个 CPU 通常都包含一层或者多层内存缓存,这样设计的原因是为了加快数据访问速度(因为数据会更靠近处理器) 并且能够减少共享内存总线上的流量(因为可以满足许多内 ...
修改myeclipse 项目中用的jdk版本
修改myeclipse 项目中用的jdk版本首先, 打开MyEclipse,如下图所示打开之后,找到我们的java项目右键--"Build Path--->Confirgure ...
pdm文件name与comment互相同步
1.使用Powerdesigner工具将pdm文件的name同步至comment. 点击Tools->Execute Commands->Edit/Run Scripts 输入脚本: Op ...
NSDate小结
dateFormat用法: y - 年 2013年,yyyy=2013,yy=13 M - 月 3月,M=3,MM=03,MMM=Mar,MMMM=March D - 一年中的第几天 d - 一月中的 ...
Flask（10）- 标准类视图
前言前面文章讲解 Flask 路由的时候,都是将 URL 路径和一个视图函数关联当 Flask 框架接收到请求后,会根据请求 URL,调用响应的视图函数进行处理 Flask 不仅提供了视图函数来处 ...
echarts堆叠柱状图在最上面的柱子显示总和
需求柱子需设置barMinHeight 在堆叠柱状图的最上面显示当前堆叠的总和直接上代码吧需要注意:设置barMinHeight时为了让0不显示,只能将0设置为null; 设置为null的柱子l ...