LALR(1)语法分析生成器--xbytes

　　0.概述：

　　看了编译器龙书和虎书后，自己手动写了一个LALR(1)语法分析生成器，使用的语法文件格式和lemon的差不多。

　　程序里面很多的算法也都是摘录自虎书，龙书虽然讲的很详细，但是真正动手写的时候还是虎书上面的算法给力点。程序相对来说比较简单，没有做任何优化，如果看过虎书和龙书，看懂代码难度不大。代码文件bytes.hpp和bytes.cpp中是主要的代码，TEMPLATE.hxx和TEMPLATE.cxx是语法分析生成器的模板文件。首先直接用make进行编译，然后进入到test目录中，运行生成器程序文件，参数是语法说明文件。执行成功后会生成会文件PARSER.hxx和PARSER.cxx，这两个文件就是你需要的语法分析器了。下面是个简单的实例说明下。

　　1.语法说明文件：

这里用一个简单的计算器来说明语法说明文件的用法。下面是计算器的语法说明文件。

%include { #include <iostream> }

%token { int }

%syntax_error { std::cout << "Error: Syntax error.\n" << std::endl;}

#left PLUS MINUS

#left TIMES DIV

program -> exp(A). { std::cout << "Result=" << A << std::endl; }

exp(A) -> exp(B) MINUS exp(C). { A = B - C; std::cout << A << "=" << B << "-" << C << std::endl; }

exp(A) -> exp(B) PLUS exp(C). { A = B + C; std::cout << A << "=" << B << "+" << C << std::endl; }

exp(A) -> exp(B) TIMES exp(C). { A = B * C; std::cout << A << "=" << B << "*" << C << std::endl; }

exp(A) -> exp(B) DIV exp(C). {

    if(C != )

    {

        A = B / C;

    }

    else

    {

        std::cout << "Divide by zero." << std::endl;

    }

    std::cout << A << "=" << B << "/" << C << std::endl;

}

exp(A) -> INT(B). { A = B; std::cout << A << "=" << B << std::endl;}

终结符：终结符的名称只能由大写字母组成，在生成PARSER.hxx文件中会包括所有终结符的枚举定义。词法分析器的分析结果要和这里定义的枚举值一致。

　　非终结符：非终结符由小写字母、下划线组成，非终结符只存在于生成语法分析器的过程中。生成的语法分析器不会包括非终结符。

　　%include：这个说明符指定了生成的语法分析程序中要包含的头文件，这个指示符的格式是后面必须用大括号。如果有多个头文件可以用回车。

　　%token：这个是token结构的指示符，必须在大括号中指定，目前只支持内建的数据类型。

　　%syntax_error：语法分析过程中出现错误时，需要执行的代码。

　　#left：左结合指示符。同时会指定优先级，越往后面的优先级越高。

　　#right：右结合指示符。同left一样会指定优先级。

　　program：是语法开始指示符，语法说明文件必须指定program生成式，否则会报错。

　　BNF范式（产生式）：每个产生式必须以非终结符开始，以 . 符号结束。产生式中的每个非终结符都可以起别名，方便在语义代码中使用，别名必须紧跟在非终结符后面，而且要括在小括号中。需要注意的是xbytes不支持，一行多个产生式，因此每行只能写一个产生式。

　　语义代码：每个产生式的后面可以在大括号中指定产生式的语义代码。这个大括号要放到产生式最后的 . 点前面。语义代码只要是C++或者C代码就可以，没有其他限制。

　　语法说明文件名：因为我写的语法分析生成器的名字叫xbytes，所以我把语法说明文件的后缀名指定为.x。比如上面计算器的语法说明文件名：calculate.x 。当然这个文件的后缀名是可以随便起的，即使没有也没有关系。

　　ACTION.txt：在生成语法分析器的同时，会生成一个名为ACTION.txt的文件。文件中以很友好的方式将语法分析器的动作表打印出来了。可以帮助用户理解LALR(1)语法分析器的运作过程。

　　备注：在xbytes.cpp代码文件中，包含许多dump_开头的函数。这些函数可以输出很多生成分析器过程中的数据。包括Symbol集合、规则集合、First集、Follow集、状态集和动作表等。

　　2.语法分析器使用方式：

在根目录下直接输入 make 。编译xbytes，生成的可执行程序会被移入test目录中，进入test目录，然后执行./x calculate.x 就可以生成，简单计算器的语法分析程序了。使用这个程序的方式是自己写一个main.cpp文件，文件内容如下：

#include "PARSER.hxx"

#include <iostream>

int main()

{

    xbytes::parser p;

    //5 * 3 + 6 / 2 - 8

    p.eat(INT, );

    p.eat(TIMES, );

    p.eat(INT, );

    p.eat(PLUS, );

    p.eat(INT, );

    p.eat(DIV, );

    p.eat(INT, );

    p.eat(MINUS, );

    p.eat(INT, );

    p.eat(, );

    return ;

}

使用方式很简单，首先要自己写个词法分析器，来进行词法分析，然后将词法分析得到的token一个个的喂给parser就可以了。parser::eat函数的第一个参数是token的类型，第二个参数是token的值。读取结束后，最后写入0,就是结束分析。

3.运行结果：

这里计算的是算式 5 * 3 + 6 / 2 - 8 的值。打印的是规约的过程，具体要打印的信息可以自己在语法说明文件的语义代码中自己定制。

[kiven@localhost test]$ ./XP

=

=

=*

=

=

=/

=+

=

=-

Result=

4.代码：

目前的代码我只在CentOS下面测试过，其他平台没有经过测试。代码地址：https://github.com/kiven-li/xbytes

　　5.展望：

　　目前程序也仅仅只是能够生成语法分析器，但是性能不是很好，实用性也不是很高。后续要优化下程序性能，token要支持自定义结构。

LALR(1)语法分析生成器--xbytes的更多相关文章

JavaCC首页、文档和下载 - 语法分析生成器 - 开源中国社区
JavaCC首页.文档和下载 - 语法分析生成器 - 开源中国社区
之前博客中的代码都放到github上
之前一直把代码托管在taocode上,现在已经不能用了,所以把代码整理了一下,统一都放在gibhub上了. LALR(1)语法分析生成器:https://github.com/kiven-li/xby ...
About Webkit
http://blog.csdn.net/spacetiller/article/details/5784461 一 . WebKit 简介 Webkit 是一个开放源代码的浏览器引擎 (web br ...
几个不常见但非常出色的 .NET 开源库
NLog NLog 目前最为出色的 .NET 日志库,非常容易配置,且极具灵活性.最重要的是与 log4net 相比,NLog 的开发很活跃.顺带提一句,NLog 完全兼容 Mono. Mono.Ce ...
WebKit介绍和总结（一）
一 . WebKit 简单介绍 Webkit 是一个开放源码的浏览器引擎 (web browser engine) ,最初的代码来自 KDE 的 KHTML 和 KJS( 均开放源码 ) . 苹果公司 ...
WebKit介绍及总结（一）
一 . WebKit 简单介绍 Webkit 是一个开放源码的浏览器引擎 (web browser engine) ,最初的代码来自 KDE 的 KHTML 和 KJS( 均开放源码 ) .苹果公司在 ...
SQLite Lemon 语法分析器学习与使用
本文是浙江大学出版社的<LEMON语法分析生成器(LALR 1类型)源代码情景分析>学习笔记. 用到的Windows下的编译器介绍MinGW(http://www.mingw.org/): ...
YACC、LEX、JAVACC-------常用的编译工具
CC(Compiler Compiler) CC的意思就是"编译器的编译器". 你可以定义一种上下文无关文法(CFG),然后针对这个特定的CFG你可以写出一个C程序来解释这种CFG ...
Python之父新发文，将替换现有解析器
花下猫语: Guido van Rossum 是 Python 的创造者,虽然他现在放弃了"终身仁慈独裁者"的职位,但却成为了指导委员会的五位成员之一,其一举一动依然备受瞩目.近日 ...

随机推荐

jQuery easyui 之 expend row
http://www.jeasyui.com/tutorial/datagrid/datagrid21.php
在server 2008/2003中取消对网站的安全检查/去除添加信任网站
新安装好Windows Server 2003操作系统后,打开浏览器来查询网上信息时,发现IE总是“不厌其烦”地提示我们,是否需要将当前访问的网站添加到自己信任的站点中去:要是不信任的话,就无 ...
Linux下查看tcp连接数及状态
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’ TIME_WAIT 8947FIN_WAIT1 15FIN_W ...
AppCompat Toolbar控件去掉阴影设置高度
For Android 5.0, if you want to set it directly into a style use: <item name="android:elevat ...
UVa11292
Problem C: The Dragon of Loowater Once upon a time, in the Kingdom of Loowater, a minor nuisance tur ...
OpenCV开发环境配置-Windows/MinGW/Clion/CMake
临时更换成了TDM-GCC,和mingw类似,这里只是声明一下. 由于opencv下载下来的.exe安装包实际上是没有mingw(gcc)匹配的/动静态库,因此这些东西需要我们自己使用mingw编译. ...
Direct3D11学习：（七）绘图基础——彩色立方体的绘制
转载请注明出处:http://www.cnblogs.com/Ray1024 一.概述在前面的几篇文章中,我们详细介绍了Direct3D渲染所需要的数学基础和渲染管道理论知识.从这篇文章开始,我们就 ...
.NET ORM 哪家强
ORM到底哪家强? 很多人都想知道这个问题,自已也没测试过,只能道听途说. 闲的无聊就将几个ORM拿出来比一比,假如怀疑测试代码有问题可以将它下载下来慢慢研究. 参赛ORM 1.SqlSugar:是一 ...
jQuery--捕获键盘敲击
功能当页面加载完成后,用户键盘按下某个键后,jQuery能够捕获到一个数字,从而执行一系列动作. 格式 1 2 3 4 5 6 7 8 9 10 11 12 $(function(){ $ ...
CentOS6.5菜鸟之旅：安装rpmforge软件库
一.rpmforge软件库 rpmforge是包含4000多种CentOS软件的软件库,被CentOS社区认为是安全和稳定的软件库. 二.安装rpmforege 1. 在http:/ ...

LALR(1)语法分析生成器--xbytes

LALR(1)语法分析生成器--xbytes的更多相关文章

随机推荐

热门专题