java开发编译器:中间语言格式
阅读博客的朋友可以到我的网易云课堂中,通过视频的方式查看代码的调试和执行过程:
http://study.163.com/course/courseMain.htm?courseId=1002830012
在通常情况下,编译器会将目标语言转换成某种中间语言格式,而不是直接将源代码转换成二进制机器指令。不少C语言编译器,都会将代码编译成汇编语言,然后再通过汇编编译器将汇编代码转换成目标机器可执行的二进制代码,这么说来,汇编语言其实也是一种中间语言。
编译成中间语言有很多优势,一是可以优化,先把中间语言进行高度优化后,再将其转换成机器指令,那么程序的速度可以成倍的提高。其二是可以实现跨平台,针对同一种中间语言,不同平台的编译器可以将其转换成与该平台兼容的二进制指令,从而使得一种源程序代码可以运行到不同的硬件平台上。
还有一种好处,就是可以通过虚拟机来运行中间语言,从而突破硬件平台对语言的限制,例如java字节码显然就是一种中间语言,运行到java虚拟机上。我们本章或许会将C语言转义成某种字节码,然后开发一个虚拟机来运行生成的字节码。由此,接下来的重点,我们将聚焦到指令集的格式,以及虚拟机的架构设计上。
中间语言的格式:三元组,四元组,逆向波兰格式
中间语言的指令格式,一般如标题所提及的一样,对大多数汇编语言来说,采取的就是三元组形式,这种格式的指令一般包含三部分:操作符,数据源,结果目标。例如指令:
ADD D0, D1
意思是将D0寄存器的数值与D1相加,并把相加后的结果存放到寄存器D1中。其实C语言也有等价功能的代码表示:
d += s;
上面的语句用数学表示法如下:
(+=, d, s)
三元组指令格式又可以称为两地址指令,因为大多数指令都由源地址,目标地址,以及操作符构成。
四元组一般由四部分组成,两个数据源地址,一个操作符,一个目标地址,例如:
d = s1 + s2;
数学化的表现形式如下:
(+, d, s1, s2)
有时候四元组指令并非都包含四部分,例如赋值语句:
(=, d, s, -)
第四部分的 -, 不是减号,而是横杆,表示这一部分为空。第一部分表示操作,不能为空,所以上面指令的意思是:
d = s;
无论是三元组还是四元组,有时候目标地址无需明确的包含在指令中,例如下面两条三元组指令:
(LESS_THAN, a, b)
(GOTO, target, -)
第一条指令比较两个数的大小,并且将比较结果存放在某个地方,第二条指令的执行将依赖第一条指令的结果,如果第一条指令结果为true, 那么第二条指令将使得程序流跳转到target指定的地址。
有时候,算术运算的指令也不会涉及到目标地址,例如下面两条三元组语句将执行A = B + C:
(+, B, C)
(=, A, .-1)
第一条语句执行完加法运算后,把结果存储到一个内部寄存器叫”加法寄存器”
第二条三元组语句,第三部分的”.”, 表示当前语句所在的地址,那么 “.-1”, 表示的就是上一条语句的地址,因此,第二条语句的作用是把上一条语句的运算结果赋值给A.
三元组相对于四元组有一个优势,就是它与大多数汇编语言的格式很接近。我们本章将代码编译后,所形成的中间语言将采用三元组格式。但四元组也有三元组无法企及的好处,一是简练,例如(+, d, s1, s2), 就需要两条三元组来完成同等功能:
(=, d, s1)
(+=, d, s2)
此外,四元组相比于三元组,更容易进行优化,例如上面的两条三元组语句,在优化时,需要将他们当做一个整体对待,代码挪动时需要两条语句一起挪动,而四元组只要挪动一条语句就可以了。
第三种常用的中间语言格式是逆向波兰格式,PostScript, HP计算器,使用的中间代码就是这种格式。这种格式的语句比较容易解析,同时语句解析时不需要分配临时变量。例如表达式:
( 1 + 2 ) * (3 + 4)
对应的逆向波兰格式为:
1 2 + 3 4 + *
逆向波兰表达式的解析需要一个堆栈, 例如上面语句的解析过程如下:
stack input action
empty 1 2 + 3 4 + * push 1
1 2 + 3 4 + * push 2
1 2 + 3 4 + * 将栈顶两元素出栈相加,
然后将相加的结果压入
堆栈
3 3 4 + * push 3
3 3 4 + * push 4
3 3 4 + * 将栈顶两元素出栈相加然
后将相加的结果压入堆栈
3 7 * 将栈顶两元素出栈相乘,
然后将相加的结果压入堆栈
21 栈顶元素就是计算结果
java开发编译器:中间语言格式的更多相关文章
- 阿里巴巴Java开发手册(格式规约篇)——查自己的漏-补自己的缺
(三) 格式规约 1. [强制]大括号的使用约定.如果是大括号内为空,则简洁地写成{}即可,不需要换行:如果是非空代码块则: 1) 左大括号前不换行.行. 2) 左大括号后换行. 3) 右大括号前换行 ...
- 《阿里巴巴Java开发手册》代码格式部分应用——idea中checkstyle的使用教程
<阿里巴巴Java开发手册>代码格式部分应用--idea中checkstyle的使用教程 1.<阿里巴巴Java开发手册> 这是阿里巴巴工程师送给各位软件工程师的宝典,就像开车 ...
- 我的Java开发学习之旅------>工具类:将播放器的进度值转换成相应的时间格式
在我的博客<我的Java开发学习之旅------>Java 格式化类(java.util.Formatter)基本用法,地址:http://blog.csdn.net/ouyang_pen ...
- Java开发笔记(一百四十三)FXML布局的基本格式
前面介绍了JavaFX的常见控件用法,虽然JavaFX控件比起AWT与Swing要好用些,但是一样通过代码编写控件界面,并没有提高什么开发效率.要想浏览界面的展示效果,都必须运行测试程序才能观看,即使 ...
- 阿里巴巴 Java 开发手册(三): 代码格式
1. [强制]大括号的使用约定.如果是大括号内为空,则简洁地写成{}即可,不需要换行:如果 是非空代码块则: 1) 左大括号前不换行. 2) 左大括号后换行. 3) 右大括号前换行. 4) 右大括号后 ...
- Java开发笔记(一百零七)URL地址的组成格式
URL的全称是Uniform Resource Locator,意思是统一资源定位符,俗称网络地址或网址.网络上的每个文件及接口,都有对应的URL网址,它规定了其他设备如何通过一系列的路径找到自己,犹 ...
- 【搬砖】安卓入门(1)- Java开发入门
01.01_计算机基础知识(计算机概述)(了解) A:什么是计算机?计算机在生活中的应用举例 计算机(Computer)全称:电子计算机,俗称电脑.是一种能够按照程序运行,自动.高速处理海量数据的现代 ...
- 打造Linux三流娱乐环境,二流办公环境,一流Java开发环境
写这篇文章的目的首先是为让自己以后再装linux环境时候,不用再通宵google+百度,做个备忘录,其次,给新入Linux环境的同学分享一点个人经验,再高尚点的动机也算是想做为开源技术的传播布道者.我 ...
- Unit01: JAVA开发环境案例
Top JAVA Fundamental DAY01 JDK及Eclipse目录结构操作 JDK的安装及配置 控制台版的JAVA HelloWorld 使用Eclipse开发Java应用程序 1 JD ...
随机推荐
- 一个CSV文件解析类
import java.io.BufferedReader; import java.io.FileReader; import java.util.ArrayList; import java.ut ...
- colorbox在android上由于高度太高无法scroll问题
首先看问题截图: 我们可以看到弹出的colorbox页面的高度已经到了下面,你根本看不到"mistake cross"<=>"X". 我测试了iph ...
- Xml 序列化和反序列化
xml序列化帮助类 using System.IO; using System.Xml; using System.Xml.Serialization; public class XmlHelper ...
- 异常测试之Socket网络异常
本文由作者张雨授权网易云社区发布. 前言 不知道大家在测试的过程中有没有发现关于异常测试这样一个特点: 无论是分散在功能测试中的异常用例还是规模相对较大的专项异常测试中,异常测试的用例占比虽然不大但是 ...
- ES6躬行记(22)——Promise
在JavaScript中,回调函数是处理异步编程的常用解决方案,但层层嵌套的回调金字塔(如下代码所示)一直受人诟病,因为不仅在视觉上更加混乱,而且在管理上也更为复杂. setTimeout(() =& ...
- PhoneGap原理
http://www.oschina.net/question/213217_46380
- day 77 基于form组件的注册功能
Form 表单 py文件 from django import forms #定义一个form类注册用 class RegForm (forms.Form): username =forms.Char ...
- Day 9 作业题(完成)
# 练习题# 1.整理函数相关知识点,画思维导图,写博客 # 2.写函数,检查获取传入列表或元组对象的所有奇数位索引对应的元素,并将其作为新列表返回给调用者.'''def func1(argv): f ...
- 深入学习c++--智能指针(一) shared_ptr
1. 几种智能指针 1. auto_ptr: c++11中推荐不使用他 2. shared_ptr: 每添加一次引用 就+1,减少一次引用,就-1:做到指针进行共享 3. unique_ptr: 一个 ...
- .Net后台获取客户端信息
1.获取浏览器版本号 /// <summary> /// 获取浏览器版本号 /// </summary> /// <returns></returns> ...