纸上得来终觉浅,绝知此事要躬行。

最近看了 SICP,其第四章讲述了一个简单的 Scheme 解释器的实现。粗看了一遍后决定自己用 C 语言实现一个残疾的 Scheme 解释器,想来这样的学习效果应该比只看书要强得多。

在这过程中发现用 C 实现这样一个解释器比用 Lisp 写要麻烦得多。一个 Lisp 语句本身其实就是一个 Lisp 里的表,利用这一特性就可以省去词法分析划分 token 的步骤,直接用自带的 carcdr 等过程就能方便地提取出语句中的各个成分(相当于直接对树操作);而用 C 就只能老老实实地处理字符串,从而生成一个树结构。

我瞎 YY 出来的这种树结构有点 AST 的样子,暂且把它叫做语法树吧:

struct _Node {
char *exp;
struct _Node *next;
struct _Node *child;
};

next 代表右边的兄弟节点,child 则是子节点。对于复杂语句(也就是能够继续往下划分的节点)不需要记录其表达式字符串(因为并没有什么卵用),而对于 atom (也就是不能继续划分的元素)则用 exp 记录其字符串。

对于这样一个语句((lambda (x) (+ x 1)) 2),对应的语法树应该是这样的:

然后就是 evalapply 的互相调用。

Scheme 有个特点是把函数作为一级对象,也就是和数据同等对待,所以设计 eval 函数的时候应该考虑到其可以返回数值和函数(当然还有符号和表)。于是应该设计一个 Value 结构体,使得其代表一种通用的值类型,既可以存储数值也可以存储过程。

eval 的实现中关键的部分在于判断语句的类型,这里的一大串 if..else 的顺序非常重要,大体框架应该是这样的:

if (node->child) {
node = node->child;
if (isPrimitive(node->exp)) {
return evalPrimitive(node, env);
} else if (isLambda(node->exp)) {
if (node->exp)
return evalLambda(node, env);
} else { //apply procedure
return apply(node, env);
}
} else { //self-evaluating expressions
if (isNumber(node->exp)) {
return (Value){NUMBER, atoi(node->exp)};
} else {
return getValue(node->exp, env);
}
}

其逻辑概括起来就是对于复杂表达式应该先判断其语句类型(Primitive 表示 Scheme 原有的那些操作比如算术操作),如果不属于任何类型则必然是对函数的执行;而除了复杂表达式剩下的就是自求值表达式,判断是字面量还是变量,并做相应处理。

这里涉及到求值所在的环境。环境可以用一个个嵌套的框架来表示,表示不同的作用域。每个框架有一个 parent 指针指向外围框架。对变量的定义、赋值和取值都通过维护环境框架中的一个变量列表来实现。

apply 函数则为函数的执行创造一个环境框架,并将形参与实参进行对应。然后再调用 eval 在新的环境里对函数体求值。

然后一个基本的 Scheme 解释器就完成了:


这个项目托管在 GitHub 上: http://github.com/lsdsjy/licp

目前只实现了 lambda 和一些关于整数的 Primitive 操作,而 define 和条件语句尚待实现。期待最后做出一个 IDE。可以预见又是一个大坑。

Licp - 一个玩具解释器的实现的更多相关文章

  1. 用C++实现一个Brainfuck解释器

    Brainfuck是一种极小化的计算机语言,只含有8种运算符,由于fuck在英语中是脏话,这种语言有时被称为brainfck或brainf**,甚至被简称为BF.正如它的名字所暗示,brainfuck ...

  2. 打包一个python解释器

    利用python的exec语句,可以很方便地动态执行python语句.如果一个python代码打包为了exe,其原先的代码就很难更改了.一个好的解决方法就是import相应的库,然后把主程序段放到一个 ...

  3. 前端与编译原理——用JS写一个JS解释器

    说起编译原理,印象往往只停留在本科时那些枯燥的课程和晦涩的概念.作为前端开发者,编译原理似乎离我们很远,对它的理解很可能仅仅局限于"抽象语法树(AST)".但这仅仅是个开头而已.编 ...

  4. 一个玩具程序——测试密码强度(pure C)

    替人写的C语言作业… 介绍: 程序名称:密码强度检测程序 注释风格:doxygen 测试环境:linux3.6, gcc4.7window7, vs2012 已知问题:1. 算法与参考链接不一致,结果 ...

  5. 以鶸ice为例,手撸一个解释器(一)明确目标

    代码地址 # HelloWorld.ice print("hello, world") 前言(废话) 其实从开始学习编译原理到现在已经有快半年的时间了,但是其间常常不能坚持看下去龙 ...

  6. Python之路【第二十四篇】:Python学习路径及练手项目合集

      Python学习路径及练手项目合集 Wayne Shi· 2 个月前 参照:https://zhuanlan.zhihu.com/p/23561159 更多文章欢迎关注专栏:学习编程. 本系列Py ...

  7. python项目练习地址

    作者:Wayne Shi链接:http://www.zhihu.com/question/29372574/answer/88744491来源:知乎著作权归作者所有,转载请联系作者获得授权. 目前是3 ...

  8. python项目推荐(转载知乎)

    作者:Wayne Shi链接:https://www.zhihu.com/question/29372574/answer/88744491来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商 ...

  9. 第二弹:超全Python学习资源整理(进阶系列)

    造一个草原要一株三叶草加一只蜜蜂.一株三叶草,一只蜂,再加一个梦.要是蜜蜂少,光靠梦也行. - 狄金森 "成为编程大牛要一门好语言加一点点天分.一门好语言,一点点天分,再加一份坚持.要是天分 ...

随机推荐

  1. sphinx 安装使用

    一.linux(centos)下安装源码包 1.下载  wget http://sphinxsearch.com/files/sphinx-2.3.1-beta.tar.gz 2.安装   切换目录到 ...

  2. Solr学习总结 Solr的安装与配置

    接着前一篇,这里总结下Solr的安装与配置 1.准备 1.安装Java8 和 Tomcat9 ,java和tomcat 的安装这里不再重复.需要注意的是这两个的版本兼容问题.貌似java8 不支持,t ...

  3. Servlet之监听事件细究

    观察者三个模式: ServletContextListener:用于监听WEB 应用启动和销毁的事件,监听器类需要实现javax.servlet.ServletContextListener 接口. ...

  4. nyoj1007——欧拉求和

    GCD 时间限制:1000 ms  |  内存限制:65535 KB 难度:3   描述 The greatest common divisor GCD(a,b) of two positive in ...

  5. 共用y轴的双图形绘制

    实现这种形式的图形,可通过matplotlib和pandas的实现,相比下pandas实现方便的多. 我数据分析的时候主要是stacked bar.bar和line形式的放在一张图上.stacked ...

  6. js排序算法03——选择排序

    选排序的思路是首先从要排序的数组中选择最小的和目前的第一位交换位置,然后从剩下的数中选择最小的和第二个位置的数交换位置,再从剩下的数中选择最小的和第三个位置的数交换位置,以此类推,实现代码如下: fu ...

  7. 转:聊聊Greenplum的那些事

    笔者有幸从04年就开始从事大规模数据计算的相关工作,08年作为Greenplum 早期员工加入Greenplum团队(当时的工牌是“005”,哈哈),记得当时看了一眼Greenplum的架构(嗯,就是 ...

  8. 使用群晖NAS:配置Git server

    1.首先在群晖的DSM的控制面板中创建一个用户例如是Git_test(我给了管理员权限) 2.在套件中心安装 Git server 3.打开Git server 勾选用户 Git_test 4.在控制 ...

  9. C++复制控制:赋值操作符和析构函数

    一.赋值操作符 类定义了该类型对象赋值时会发生什么.与拷贝构造函数一样,如果类没有定义自己的赋值操作符,编译器会合成一个. 1.重载操作符的简单介绍 重载操作符是一些函数,其名字为operator后跟 ...

  10. java语言基础-进制

    一丶Java语言基础:进制 1.进制的四种表现形式 (1).二进制:0,1 满2进1. (2).八进制0-7 :满8进1,用0开头表示. (3).十进制:0-9 满10进1. (4).十六进制:0-9 ...