写完词法部分,又有很多杂事,周末终于有空来实现伟大的语法解析部分了。

撸完代码之后发现,程序太短了,不算上状态机,才186行(含注释),关键代码不到100行。运行调试过后,发现还行。居然可以解析OneThink里面的function.php。这个文件堪称Php程序的集大成者,里面什么妖魔鬼怪都有,调试的时候真是一把辛酸泪。当然我也是不会说的,哈

有鉴于程序太短,所以我准备详细地来说说,以免大家不太明白其中奥妙:)

我们知道,语法解析一般有LL(1),LR(0),SLR(1),LALR(1),LR(1)等分析方法。比较常见的,就是LL(1),LR(0)

LL这种分析方法是从左到右扫描,最左推导;LR是从左到右扫描,最右推导;LL采用的是预测表,LR采用的是分析表;LR的难度在LL之上,分析能力也在LL之上,而且,LR的变化也更多。所以这样一个玩票的项目,当然要用LR才能稳稳地创(zhuang)新(bi)。

LR分析器的模型如下图。

包括两个栈,其中最首要地工作是生成LR分析表。当然我并不准备老老实实地按课本上的经典方法来,如何创(tou)新(lan)呢?这是关键。

我们看SLR(1),LALR(1),LR(1)都是对LR(0)的一种改进,其中最重要的就是那个(1),代表向前查看。为什么要向前看?为了减少分析表的规模。未来有无数的可能性,向前看了,可能性减少了,分析的规模也会大大减少。我们要减少分析的规模就必须向前看,而且看得越多分析表越小,而相反的编程难度也越大。那么,有没有一种方法让我站着把钱赚了,让我不向前看,难度不增加,分析表又减少呢。

有,还真有,这难不倒一个资深懒汉。我们知道,向前看的需求,来源于文法表达式:如A → Abc,它的单个表达式长度越长,不确定性越大。所以,限制方法表达式的最大长度,可以在此长度内保证100%的确定性,也就完全不需要向前看了。我把这种方法命名限长LR,即LLLR(0,n),n>=3。

如此,这次我理所当然地选择LLLR(0,3)做为分析方法,而且为了实现方便,我决定不保存状态,也就不需要生成分析表了,不生成表了,不生成表了……

妈蛋!这也太偷懒了。不保存状态,意味着每次都需要从头搜索,效率呢效率,这是程序员的生命!

稍安勿躁,表达式的最大长度为3,最多搜索3步即可,放心吧,就这么定了。:)

这就是100行超简Php编译器的奥秘,如何,够创(zhuang)新(bi)吧。源码在此:converterV0.4.zip Enjoy!

<未完待续>

转换器4:手写PHP转Python编译器,语法解析部分的更多相关文章

  1. 转换器3:手写PHP转Python编译器,词法部分

    上周写了<ThinkPhp模板转Flask.Django模板> 一时技痒,自然而然地想搞个大家伙,把整个PHP程序转成Python.不比模板,可以用正则匹配偷懒,这次非写一个Php编译器不 ...

  2. 为sproto手写了一个python parser

    这是sproto系列文章的第三篇,可以参考前面的<为sproto添加python绑定>.<为python-sproto添加map支持>. sproto是云风设计的序列化协议,用 ...

  3. 手写 Vue2 系列 之 编译器

    前言 接下来就要正式进入手写 Vue2 系列了.这里不会从零开始,会基于 lyn-vue 直接进行升级,所以如果你没有阅读过 手写 Vue 系列 之 Vue1.x,请先从这篇文章开始,按照顺序进行学习 ...

  4. KNN手写实践:Python基于数据集整体计算以及排序

    1. 距离计算,不要通过遍历每个样本来计算和指定样本距离,而是通过对于指定样本进行广播(复制)成为一个shape和全局一致后,再进行整体计算,这里的广播 / 复制采用的是tile函数来实现的: 2. ...

  5. 用java实现一个简易编译器-语法解析

    语法和解析树: 举个例子看看,语法解析的过程.句子:“我看到刘德华唱歌”.在计算机里,怎么用程序解析它呢.从语法上看,句子的组成是由主语,动词,和谓语从句组成,主语是“我”,动词是“看见”, 谓语从句 ...

  6. Python学习宝典,Python400集让你成为从零基础到手写神经网络的Python大神

    当您学完Python,你学到了什么? 开发网站! 或者, 基础语法要点.函数.面向对象编程.调试.IO编程.进程与线程.正则表达式... 当你学完Python,你可以干什么? 当程序员! 或者, 手写 ...

  7. TensorFlow下利用MNIST训练模型识别手写数字

    本文将参考TensorFlow中文社区官方文档使用mnist数据集训练一个多层卷积神经网络(LeNet5网络),并利用所训练的模型识别自己手写数字. 训练MNIST数据集,并保存训练模型 # Pyth ...

  8. 手写 Vue2 系列 之 初始渲染

    前言 上一篇文章 手写 Vue2 系列 之 编译器 中完成了从模版字符串到 render 函数的工作.当我们得到 render 函数之后,接下来就该进入到真正的挂载阶段了: 挂载 -> 实例化渲 ...

  9. 手写一个IOC容器

    链接:https://pan.baidu.com/s/1MhKJYamBY1ejjjhz3BKoWQ 提取码:e8on 明白什么是IOC容器: IOC(Inversion of Control,控制反 ...

随机推荐

  1. Linux安装配置VPN服务器

    一.实验简介 VPN ,中文翻译为虚拟专有网络,英文全称是 Virtual Private Network .现在 VPN 被普遍定义为通过 一个公用互联网络建立一个临时的.安全的连接,是一条穿过混乱 ...

  2. 算法一之N皇后问题

    (写这篇文章主要是明天就要考试了,算法考试,今天不想再复习了,xiang着今天也开通了博客,于是在这个平台上进行复习,应该会更高效.最后祝愿我明天考个好成绩.嘻嘻...) n皇后问题,主要是应用到回溯 ...

  3. Bootstrap入门(二十七)JS插件4:标签页

    Bootstrap入门(二十七)JS插件4:标签页 标签页的切换可以带动内容的变化 首先我们引入CSS文件 <link href="bootstrap.min.css" re ...

  4. [html]关于html标签的一些总结

    以下内容纯属个人对项目细节的总结,因为只是为了自己回顾方便,所以比较杂乱. 1.img 如果不指定img的高度和宽度,则img显示的是原图片的大小:如果只指定了高度和宽度中的一者,则为指定的一者等比例 ...

  5. 神秘的ApplicationPoolIdentity再也不用妈妈担心程序池安全了

    在IIS 7和IIS 7.5中,我们可以为应用程序池设置一个特殊的Identity(用户标识):ApplicationPoolIdentity. 那么这个标识到底是什么意思?它是具体什么身份呢?这一讲 ...

  6. Cookie与Passport安全

    对于web系统而言,由于HTTP协议无状态的特性,用户登录时需要服务端生成通行证返回给浏览器.浏览器保存该通行证并在接下来的请求中携带该通行证.通常来讲,web系统使用http cookie来保存和传 ...

  7. AFNetworking2.0和AFNetworking3.0 的HTTPS的配置

    前言: 由于苹果声明在前说是2017.01.01之后提交审核的APP,必须使用HTTPS请求,要不就直接驳回审核,吓得我们年前赶紧提交了一个版本,想着年后在弄这个https,结果又有消息说是苹果推迟了 ...

  8. vs2010 入门程序

    #include <stdio.h> int main(){ printf("hello world!\n"); getchar(); //此处避免执行完程序自动退出 ...

  9. 关系型数据库MySql-模糊搜索优化(like %abc%):全文搜索引擎技术选型

    1.阿里云OpenSearch 阿里云开放搜索OpenSearch是一款阿里巴巴自主研发的大规模分布式搜索引擎平台,该平台承载了淘宝.天猫.1688.神马搜索.口碑.菜鸟等搜索业务,通过OpenSea ...

  10. 单页应用SPA的路由

    关于单页应用 单页Web应用(single page web application,SPA),就是只有一张Web页面的应用,是加载单个HTML 页面并在用户与应用程序交互时动态更新该页面的Web应用 ...