Java 实现《编译原理》简单词法分析功能

Java 实现《编译原理》简单词法分析功能 - 程序解析

简易词法分析功能

要求及功能

（1）读取一个 txt 程序文件（最后的 # 作为结束标志，不可省去）

{

  int a, b;

  a = 10;

  if(a>=1){

    b = a + 20;

  }

}

#

（2）词法识别分析表

单词类别	单词自身值	内部编码
关键字	int、for、while、do、return、break、continue	1
标识符	除关键字外的以字母开头，后跟字母、数字的字符序列	2
常数	无符号整型数	3
运算符	+、-、*、/、>、<、=、>=、<=、!=	4
界限符	,、;、{、}、(、)	5
换行符	\n	6

（3）输出结果：

(5,{)

(6,\n)

(1,int)

(2,a)

(5,,)

(2,b)

(5,;)

(6,\n)

(2,a)

(4,=)

(3,10)

(5,;)

(6,\n)

(2,if)

(5,()

(2,a)

(4,>=)

(3,1)

(5,))

(5,{)

(6,\n)

(2,b)

(4,=)

(2,a)

(4,+)

(3,20)

(5,;)

(6,\n)

(5,})

(6,\n)

(5,})

(6,\n)

(0,#)

并保存成新的 txt 文件

编程实现

（1）程序文件目录：

（2）Word.java 文件：

package com.java997.analyzer.lexical;

/**

 * <p>

 * 表示识别后的词实体类

 *

 * @author XiaoPengwei

 * @since 2019-06-13

 */

public class Word {

    /**

     * 种别码

     */

    private int typeNum;

    /**

     * 扫描得到的词

     */

    private String word;

    public int getTypeNum() {

        return typeNum;

    }

    public void setTypeNum(int typeNum) {

        this.typeNum = typeNum;

    }

    public String getWord() {

        return word;

    }

    public void setWord(String word) {

        this.word = word;

    }

}

（3）CodeScanner.java 文件：

package com.java997.analyzer.lexical;

/**

 * <p>

 * 字符扫描

 *

 * @author XiaoPengwei

 * @since 2019-06-13

 */

public class CodeScanner {

    private static String _KEY_WORD_END = "end string of string";

    private int charNum = 0;

    private Word word;

    private char[] input = new char[255];

    private char[] token = new char[255];

    private int p_input = 0;

    private int p_token = 0;

    private char ch;

    /**

     * 关键字数组

     */

    private String[] rwtab = {"int", "if", "while", "do", "return", "break", "continue", _KEY_WORD_END};

    /**

     * 逻辑运算数组

     */

    private String[] logicTab = {"==",">=","<=","!=", _KEY_WORD_END};

    public CodeScanner(char[] input) {

        this.input = input;

    }

    /**

     * 取下一个字符

     *

     * @return

     */

    public char m_getch() {

        if (p_input < input.length) {

            ch = input[p_input];

            p_input++;

        }

        return ch;

    }

    /**

     * 如果是标识符或者空白符就取下一个字符

     */

    public void getbc() {

        while ((ch == ' ' || ch == '\t') && p_input < input.length) {

            ch = input[p_input];

            p_input++;

        }

    }

    /**

     * 把当前字符和原有字符串连接

     */

    public void concat() {

        token[p_token] = ch;

        p_token++;

        token[p_token] = '\0';

    }

    /**

     * 回退一个字符

     */

    public void retract() {

        p_input--;

    }

    /**

     * 判断是否为字母

     *

     * @return boolean

     * @author XiaoPengwei

     */

    public boolean isLetter() {

        return ch >= 'a' && ch <= 'z' || ch >= 'A' && ch <= 'Z';

    }

    /**

     * 判断是否为数字

     *

     * @return boolean

     * @author XiaoPengwei

     */

    public boolean isDigit() {

        return ch >= '0' && ch <= '9';

    }

    /**

     * 查看 token 中的字符串是否是关键字，是的话返回关键字种别编码，否则返回 2

     *

     * @return

     */

    public int isKey() {

        int i = 0;

        while (rwtab[i].compareTo(_KEY_WORD_END) != 0) {

            if (rwtab[i].compareTo(new String(token).trim()) == 0) {

                return i + 1;

            }

            i++;

        }

        return 2;

    }

    /**

     * 可能是逻辑预算字符

     *

     * @return

     */

    public Boolean isLogicChar() {

        return ch == '>' || ch == '<'|| ch == '='|| ch == '!';

    }

    /**

     * 查看 token 中的字符串是否是逻辑运算符，是的话返回关键字种别编码，否则返回 2

     *

     * @return

     */

    public int isLogicTab() {

        int i = 0;

        while (logicTab[i].compareTo(_KEY_WORD_END) != 0) {

            if (logicTab[i].compareTo(new String(token).trim()) == 0) {

                return i + 1;

            }

            i++;

        }

        return 4;

    }

    /**

     * 能够识别换行，单行注释和多行注释的

     * 换行的种别码设置成30

     * 多行注释的种别码设置成31

     *

     * @return

     */

    public Word scan() {

        token = new char[255];

        Word myWord = new Word();

        myWord.setTypeNum(10);

        myWord.setWord("");

        p_token = 0;

        m_getch();

        getbc();

        if (isLetter()) {

            while (isLetter() || isDigit()) {

                concat();

                m_getch();

            }

            retract();

            myWord.setTypeNum(isKey());

            myWord.setWord(new String(token).trim());

            return myWord;

        } else if (isLogicChar()) {

            while (isLogicChar()) {

                concat();

                m_getch();

            }

            retract();

            myWord.setTypeNum(4);

            myWord.setWord(new String(token).trim());

            return myWord;

        } else if (isDigit()) {

            while (isDigit()) {

                concat();

                m_getch();

            }

            retract();

            myWord.setTypeNum(3);

            myWord.setWord(new String(token).trim());

            return myWord;

        } else {

            switch (ch) {

                //5

                case ',':

                    myWord.setTypeNum(5);

                    myWord.setWord(",");

                    return myWord;

                case ';':

                    myWord.setTypeNum(5);

                    myWord.setWord(";");

                    return myWord;

                case '{':

                    myWord.setTypeNum(5);

                    myWord.setWord("{");

                    return myWord;

                case '}':

                    myWord.setTypeNum(5);

                    myWord.setWord("}");

                    return myWord;

                case '(':

                    myWord.setTypeNum(5);

                    myWord.setWord("(");

                    return myWord;

                case ')':

                    myWord.setTypeNum(5);

                    myWord.setWord(")");

                    return myWord;

                //4

                case '=':

                    myWord.setTypeNum(4);

                    myWord.setWord("=");

                    return myWord;

                case '+':

                    myWord.setTypeNum(4);

                    myWord.setWord("+");

                    return myWord;

                case '-':

                    myWord.setTypeNum(4);

                    myWord.setWord("-");

                    return myWord;

                case '*':

                    myWord.setTypeNum(4);

                    myWord.setWord("*");

                    return myWord;

                case '/':

                    myWord.setTypeNum(4);

                    myWord.setWord("/");

                    return myWord;

                case '\n':

                    myWord.setTypeNum(6);

                    myWord.setWord("\\n");

                    return myWord;

                case '#':

                    myWord.setTypeNum(0);

                    myWord.setWord("#");

                    return myWord;

                default:

                    concat();

                    myWord.setTypeNum(-1);

                    myWord.setWord("ERROR INFO: WORD = \"" + new String(token).trim() + "\"");

                    return myWord;

            }

        }

    }

}

（4）MainAnalyzer.java 文件：

package com.java997.analyzer.lexical;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileWriter;

import java.io.IOException;

import java.io.Writer;

import java.util.ArrayList;

import java.util.Scanner;

/**

 * <p>

 * 执行主程序

 *

 * @author XiaoPengwei

 * @since 2019-06-13

 */

public class MainAnalyzer {

    private File inputFile;

    private File outputFile;

    private String fileContent;

    private ArrayList<Word> list = new ArrayList<>();

    /**

     * 构造方法

     *

     * @param input

     * @param output

     * @author XiaoPengwei

     */

    public MainAnalyzer(String input, String output) {

        //实例化输入文件

        inputFile = new File(input);

        //实例化输出文件

        outputFile = new File(output);

    }

    /**

     * 从指定的 txt 文件中读取源程序文件内容

     *

     * @return java.lang.String

     */

    public String getContent() {

        StringBuilder stringBuilder = new StringBuilder();

        try (Scanner reader = new Scanner(inputFile)) {

            while (reader.hasNextLine()) {

                String line = reader.nextLine();

                stringBuilder.append(line + "\n");

                System.out.println(line);

            }

            System.out.println("Successful reading of files：" + inputFile.getName());

        } catch (FileNotFoundException e) {

            e.printStackTrace();

        }

        return fileContent = stringBuilder.toString();

    }

    /**

     * 然后扫描程序，在程序结束前将扫描到的词添加到 list 中

     * 最后把扫描结果保存到指定的文件中

     *

     * @param fileContent

     * @return void

     */

    public void analyze(String fileContent) {

        int over = 1;

        Word word = new Word();

        //调用扫描程序

        CodeScanner scanner = new CodeScanner(fileContent.toCharArray());

        System.out.println("The result:");

        while (over != 0) {

            word = scanner.scan();

            System.out.println("(" + word.getTypeNum() + "," + word.getWord() + ")");

            list.add(word);

            over = word.getTypeNum();

        }

        saveResult();

    }

    /**

     * 将结果写入到到指定文件中

     * 如果文件不存在，则创建一个新的文件

     * 用一个 foreach 循环将 list 中的项变成字符串写入到文件中

     */

    public void saveResult() {

        //创建文件

        if (!outputFile.exists()) {

            try {

                outputFile.createNewFile();

            } catch (IOException e1) {

                e1.printStackTrace();

            }

        }

        //写入文件

        try (Writer writer = new FileWriter(outputFile)) {

            for (Word word : list) {

                writer.write("(" + word.getTypeNum() + " ," + word.getWord() + ")\n");

            }

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    public static void main(String[] args) {

        //注意输入文件路径/名称必须对, 输出文件可以由程序创建

        MainAnalyzer analyzer = new MainAnalyzer("D:\\analyzer\\src\\main\\java\\com\\java997\\analyzer\\lexical\\input.txt", "D:\\analyzer\\src\\main\\java\\com\\java997\\analyzer\\lexical\\output.txt");

        analyzer.analyze(analyzer.getContent());

    }

}

（5）input.txt 文件：

{

  int a, b;

  a = 10;

  if(a>=1){

    b = a + 20;

  }

}

#

执行测试

Java 实现《编译原理》简单词法分析功能 - 程序解析的更多相关文章

Java的编译原理
概述 java语言的"编译期"分为前端编译和后端编译两个阶段.前端编译是指把*.java文件转变成*.class文件的过程; 后端编译(JIT, Just In Time Comp ...
深入分析Java的编译原理
在<Java代码的编译与反编译>中,有过关于Java语言的编译和反编译的介绍.我们可以通过javac命令将Java程序的源代码编译成Java字节码,即我们常说的class文件.这是我们通常 ...
编译原理简单语法分析器（first,follow,分析表）源码下载
编译原理(简单语法分析器下载) http://files.cnblogs.com/files/hujunzheng/%E5%8A%A0%E5%85%A5%E5%90%8C%E6%AD%A5%E7%AC ...
.Net编译原理简单介绍
首先简单说一下计算机软件运行.所谓软件运行,就是一步一步做一些事情.计算机只认识0和1.给计算机下命令,只能是0与1的方式,确切的说,其实是CPU只认识0和1,因为软件运行是CPU控制的.人直接操作0 ...
Java网络编程以及简单的聊天程序
网络编程技术是互联网技术中的主流编程技术之一,懂的一些基本的操作是非常必要的.这章主要讲解网络编程,UDP和Socket编程,以及使用Socket做一个简单的聊天软件. 全部代码下载:链接 1.网络编 ...
Net编译原理简单
转载:http://blog.csdn.net/sundacheng1989/article/details/20941893 首先简单说一下计算机软件运行.所谓软件运行,就是一步一步做一些事情.计算 ...
Java continue break 制作简单聊天室程序，屏蔽不文明语言，显示每句话聊天时间 for(;;) SimpleDateFormat("yyyy-MM-dd hh:mm:ss") equalsIgnoreCase
package com.swift; import java.text.SimpleDateFormat; import java.util.Date; import java.util.Scanne ...
Java注解及其原理以及分析spring注解解析源码
注解的定义注解是那些插入到源代码中,使用其他工具可以对其进行处理的标签. 注解不会改变程序的编译方式:Java编译器对于包含注解和不包含注解的代码会生成相同的虚拟机指令. 在Java中,注解是被当做 ...
Java中JSON的简单使用与前端解析
http://www.blogjava.net/qileilove/archive/2014/06/13/414694.html 一.JSON JSON(JavaScript Object Notat ...

随机推荐

k8s设置集群角色
查看所有的node节点 [root@test1 ~]# kubectl get nodes NAME STATUS ROLES AGE VERSION test1 Ready <none> ...
不容错过的 Babel7 知识
对 Babel 的配置项的作用不那么了解,是否会影响日常开发呢?老实说,大多情况下没有特别大的影响(毕竟有搜索引擎). 不过呢,还是想更进一步了解下,于是最近认真阅读了 Babel 的文档,外加不断编 ...
AE调用GP工具（创建缓冲区和相交为例）
引用 Geoprocessing是ArcGIS提供的一个非常实用的工具,借由Geoprocessing工具可以方便的调用ArcToolBox中提供的各类工具,本文在ArcEngine9.2平台环境下总 ...
【JulyEdu-Python基础】第３课：容器以及容器的访问使用
大纲容器切片 list/tupledictset 切片列表推导生成器迭代器容器 list 列表序列是Python中最基本的数据结构.序列中的每个元素都分配一个数字 - 它的位置,或索引,第 ...
【DSP开发】HyperLink 编程和性能考量
冯华亮/Brighton Feng---Communication Infrastructure 摘要 HyperLink 为两个 KeyStone 架构 DSP 之间提供了一种高速,低延迟,引脚数量 ...
webpack打包vue项目之后怎么启动&注意事项
参考路径:https://blog.csdn.net/cn_yaojin/article/details/80164477 参考路径:https://www.imooc.com/article/323 ...
elk 入门 - 分析nginx日志 + json格式 + 有调试的意识 + elk7.2.0
1.本次采用的一台主机,将所有的软件安装一台上进行测试工作. 2.安装部署:https://blog.51cto.com/hwg1227/2299995 3.简单调试输出rubydebug inpu ...
动态赋予java类的属性set与get值
public class Contact { private String name; private String tel; private attrControl attrC=new attrCo ...
题目---汉诺塔及AI代码及八皇后
2019春第十一周作业这个作业属于那个课程 C语言程序设计II 这个作业要求在哪里 https://edu.cnblogs.com/campus/zswxy/software-engineering ...
ZOJ 2314 （无源汇有上下边界的可行流）
(点击此处查看原题) 题意分析给出n个结点,m条管道,每条管道存在最小流量和最大流量,而且每个结点的流入量等于流出流出量,问这n个结点和m条管道能否形成流量循环解题思路经典的无源汇有上下边界的可 ...

Java 实现《编译原理》简单词法分析功能 - 程序解析

Java 实现《编译原理》简单词法分析功能 - 程序解析

要求及功能

编程实现

执行测试

Java 实现《编译原理》简单词法分析功能 - 程序解析的更多相关文章

随机推荐

热门专题