机器指令翻译成 JavaScript —— No.4 动态跳转
上一篇,我们用模拟流程的方式,解决了跳转问题。
不过静态跳转,好歹事先是知道来龙去脉的。而动态跳转,只有运行时才知道要去哪。既然流程都是未知的,翻译从何谈起?
动态跳转,平时出现的多吗?非常多!除了 JMP 指令,还有一个更常用的,就是 RTS 指令。
它用于子流程的返回 —— 从栈上取出数据给程序计数器 PC,回到之前执行 JSR 指令的位置(相当于 call / return)。如果把栈上数据改了,那也是可以任意跳转的。
动态跳转很常用,因此必须得支持。
已有流程
动态跳转,理论上可以跳到任意位置,但事实上很少会乱跳。大多数时候,跳转的仍然是某个已有的流程。
比如 RTS 指令,跳转的就是之前执行 JSR 时的位置。(除非破坏了栈上的数据,跳到未知流程,但这是极小概率情况)
所以我们在翻译时,记录下每个 block_xxx 对应的原始位置:
addr_block_map = {
0x0600: block_0,
0x0612: block_1,
0x0618: block_2,
...
}
这样就可在运行时,通过「目标地址」查询对应的 JS 流程块。例如:
JMP ($00f0)
翻译成类似如下的 JS 代码:
pc = mem_read_uint16(0x00f0)
nextFn = addr_block_map[pc]
虽然 pc 的值不确定,但 addr_block_map[pc] 通常还是存在的。
使用这种方式,就能处理大多数情况下的「动态跳转」了!
未知流程
但是,总会有不存在的情况。最极端的,就是跳到栈内存上,将动态的数据当指令执行。。。这时,光靠翻译显然是做不到了。
不过,上一篇已给我们启示:如果翻译做不到,就用模拟凑合。现在完全无法翻译,那就 100% 模拟吧!
我们把模拟器、原始二进制指令,都打包在一起。运行过程中,一旦进入未知流程,就切换至模拟:
nextFn = addr_block_map[pc]
if (!nextFn) { // 没有对应的流程,进入解释模式
nextFn = interpreter
return
}
模拟虽然很慢,但总比不支持好啊!
事实上,不必一直模拟下去,只要抓住机会,还是有可能翻身的:
function interpreter() {
do { // 解释模式
opcode = MEM[pc++]
switch (opcode) {
case 0xA9: // LDA
...
case 0x85: // STA
...
case 0x4C: // JMP
pc = ...
nextFn = addr_block_map[pc]
}
} while(...)
}
一旦解释到「跳转指令」,并且跳到已有的 JS 流程上,这时就可以退出解释器,重回翻译模式了!
有了模拟器这个后备方案,我们总能活下去。并且大多数情况下,只是用来应急而已,不会模拟太久,因此性能损失不会太大。
到此,任意跳转的问题,就这样解决了。
结尾
前面提到,跳到栈上可以执行动态指令。事实上还有一种情况,不用跳转也可以,那就是:修改已有的指令。
下一篇,将讨论动态指令相关的问题。
机器指令翻译成 JavaScript —— No.4 动态跳转的更多相关文章
- 【探索】机器指令翻译成 JavaScript
前言 前些时候研究脚本混淆时,打算先学一些「程序流程」相关的概念.为了不因太枯燥而放弃,决定想一个有趣的案例,可以边探索边学. 于是想了一个话题:尝试将机器指令 1:1 翻译 成 JavaScript ...
- 机器指令翻译成 JavaScript —— No.5 指令变化
上一篇,我们通过内置解释器的方案,解决任意跳转的问题.同时,也提到另一个问题:如果指令发生变化,又该如何应对. 指令自改 如果指令加载到 RAM 中,那就和普通数据一样,也是可以随意修改的.然而,对应 ...
- 机器指令翻译成 JavaScript —— No.2 跳转处理
上一篇,我们发现大多数 6502 指令都可以直接 1:1 翻译成 JS 代码,但除了「跳转指令」. 跳转指令,分无条件跳转.条件跳转.从另一个角度,也可分: 静态跳转:目标地址已知 动态跳转:目标地址 ...
- 机器指令翻译成 JavaScript —— No.7 过渡语言
上一篇,我们决定使用 LLVM 来优化程序,并打算用 C 作为输入语言.现在我们来研究一下,将 6502 指令转换成 C 的可行性. 跳转支持 翻译成 C 语言,可比 JS 容易多了.因为 C 支持 ...
- 机器指令翻译成 JavaScript —— 终极目标
上一篇,我们顺利将 6502 指令翻译成 C 代码,并演示了一个案例. 现在,我们来完成最后的目标 -- 转换成 JavaScript. 中间码输出 我们之所以选择 C,就是为了使用 LLVM.现在来 ...
- 机器指令翻译成 JavaScript —— No.3 流程分割
上一篇 我们讨论了跳转指令,并实现「正跳转」的翻译,但最终困在「负跳转」上.而且,由于线程模型的差异,我们不能 1:1 的翻译,必须对流程进行一些改造. 当初之所以选择翻译,而不是模拟,就是出于性能考 ...
- 机器指令翻译成 JavaScript —— No.6 深度优化
第一篇 中我们曾提到,JavaScript 最终还得经过浏览器来解析.因此可以把一些优化工作,交给脚本引擎来完成. 现代浏览器的优化能力确实很强,但是,运行时的优化终归是有限的.如果能在事先实现,则可 ...
- 四十年前的 6502 CPU 指令翻译成 JS 代码会是怎样
去年折腾的一个东西,之前 blog 里也写过,不过那时边琢磨边写,所以比较杂乱,现在简单完整地讲解一下. 前言 当时看到一本虚拟机相关的书,正好又在想 JS 混淆相关的事,无意中冒出个问题:能不能把某 ...
- [书籍翻译] 《JavaScript并发编程》第一章 JavaScript并发简介
> 本文是我翻译<JavaScript Concurrency>书籍的第一章,该书主要以Promises.Generator.Web workers等技术来讲解JavaScript并 ...
随机推荐
- Hadoop 中利用 mapreduce 读写 mysql 数据
Hadoop 中利用 mapreduce 读写 mysql 数据 有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...
- 浅谈 Fragment 生命周期
版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰 源码:AndroidDemo/Fragment 文中如有纰漏,欢迎大家留言指出. Fragment 是在 Android 3.0 中 ...
- RPC 使用中的一些注意点
最近线上碰到一点小问题,分析其原因发现是出在对 RPC 使用上的一些细节掌握不够清晰导致.很多时候我们做业务开发会把 RPC 当作黑盒机制来使用,但若不对黑盒的工作原理有个基本掌握,也容易犯一些误用的 ...
- ZIP压缩算法详细分析及解压实例解释
最近自己实现了一个ZIP压缩数据的解压程序,觉得有必要把ZIP压缩格式进行一下详细总结,数据压缩是一门通信原理和计算机科学都会涉及到的学科,在通信原理中,一般称为信源编码,在计算机科学里,一般称为数据 ...
- TODO:macOS上ThinkPHP5和Semantic-UI集成
TODO:macOS上ThinkPHP5和Semantic-UI集成 1. 全局安装 (on OSX via homebrew)Composer 是 homebrew-php 项目的一部分 2. 把X ...
- 游戏编程系列[1]--游戏编程中RPC协议的使用[3]--体验
运行环境,客户端一般编译为.Net 3.5 Unity兼容,服务端因为用了一些库,所以一般为4.0 或往上.同一份代码,建立拥有2个项目.客户端引用: WindNet.Client服务端引用: OpL ...
- 1.初始Windows Server 2012 R2 Hyper-V + 系统安装详细
干啥的?现在企业服务器都是分开的,比如图片服务器,数据库服务器,redis服务器等等,或多或少一个网站都会用到多个服务器,而服务器的成本很高,要是动不动采购几十台,公司绝对吃不消的,于是虚拟化技术出来 ...
- 从Vue.js窥探前端行业
近年来前端开发趋势 1.旧浏览器逐渐淘汰,移动端需求增加: 旧浏览器主要指的是IE6-IE8,它是不支持ES5特性的:IE9+.chrome.sarafi.firefox对ES5是完全支持的,移动端大 ...
- 怎样两个月完成Udacity Data Analyst Nanodegree
在迷恋数据科学很久后,我决定要在MOOC网站上拿到一份Data Science的证书.美国三个MOOC网站,Udacity上的课程已经被分成了数个nanodegree,每个nanodegree都是目前 ...
- CentOS:设置系统级代理(转)
原文地址:http://www.cnblogs.com/cocowool/archive/2012/07/05/2578487.html YUM代理设置 编辑/etc/yum.conf,在最后加入 # ...