机器指令翻译成 JavaScript —— No.4 动态跳转
上一篇,我们用模拟流程的方式,解决了跳转问题。
不过静态跳转,好歹事先是知道来龙去脉的。而动态跳转,只有运行时才知道要去哪。既然流程都是未知的,翻译从何谈起?
动态跳转,平时出现的多吗?非常多!除了 JMP 指令,还有一个更常用的,就是 RTS 指令。
它用于子流程的返回 —— 从栈上取出数据给程序计数器 PC,回到之前执行 JSR 指令的位置(相当于 call / return)。如果把栈上数据改了,那也是可以任意跳转的。
动态跳转很常用,因此必须得支持。
已有流程
动态跳转,理论上可以跳到任意位置,但事实上很少会乱跳。大多数时候,跳转的仍然是某个已有的流程。
比如 RTS 指令,跳转的就是之前执行 JSR 时的位置。(除非破坏了栈上的数据,跳到未知流程,但这是极小概率情况)
所以我们在翻译时,记录下每个 block_xxx 对应的原始位置:
addr_block_map = {
0x0600: block_0,
0x0612: block_1,
0x0618: block_2,
...
}
这样就可在运行时,通过「目标地址」查询对应的 JS 流程块。例如:
JMP ($00f0)
翻译成类似如下的 JS 代码:
pc = mem_read_uint16(0x00f0)
nextFn = addr_block_map[pc]
虽然 pc 的值不确定,但 addr_block_map[pc] 通常还是存在的。
使用这种方式,就能处理大多数情况下的「动态跳转」了!
未知流程
但是,总会有不存在的情况。最极端的,就是跳到栈内存上,将动态的数据当指令执行。。。这时,光靠翻译显然是做不到了。
不过,上一篇已给我们启示:如果翻译做不到,就用模拟凑合。现在完全无法翻译,那就 100% 模拟吧!
我们把模拟器、原始二进制指令,都打包在一起。运行过程中,一旦进入未知流程,就切换至模拟:
nextFn = addr_block_map[pc]
if (!nextFn) { // 没有对应的流程,进入解释模式
nextFn = interpreter
return
}
模拟虽然很慢,但总比不支持好啊!
事实上,不必一直模拟下去,只要抓住机会,还是有可能翻身的:
function interpreter() {
do { // 解释模式
opcode = MEM[pc++]
switch (opcode) {
case 0xA9: // LDA
...
case 0x85: // STA
...
case 0x4C: // JMP
pc = ...
nextFn = addr_block_map[pc]
}
} while(...)
}
一旦解释到「跳转指令」,并且跳到已有的 JS 流程上,这时就可以退出解释器,重回翻译模式了!
有了模拟器这个后备方案,我们总能活下去。并且大多数情况下,只是用来应急而已,不会模拟太久,因此性能损失不会太大。
到此,任意跳转的问题,就这样解决了。
结尾
前面提到,跳到栈上可以执行动态指令。事实上还有一种情况,不用跳转也可以,那就是:修改已有的指令。
下一篇,将讨论动态指令相关的问题。
机器指令翻译成 JavaScript —— No.4 动态跳转的更多相关文章
- 【探索】机器指令翻译成 JavaScript
前言 前些时候研究脚本混淆时,打算先学一些「程序流程」相关的概念.为了不因太枯燥而放弃,决定想一个有趣的案例,可以边探索边学. 于是想了一个话题:尝试将机器指令 1:1 翻译 成 JavaScript ...
- 机器指令翻译成 JavaScript —— No.5 指令变化
上一篇,我们通过内置解释器的方案,解决任意跳转的问题.同时,也提到另一个问题:如果指令发生变化,又该如何应对. 指令自改 如果指令加载到 RAM 中,那就和普通数据一样,也是可以随意修改的.然而,对应 ...
- 机器指令翻译成 JavaScript —— No.2 跳转处理
上一篇,我们发现大多数 6502 指令都可以直接 1:1 翻译成 JS 代码,但除了「跳转指令」. 跳转指令,分无条件跳转.条件跳转.从另一个角度,也可分: 静态跳转:目标地址已知 动态跳转:目标地址 ...
- 机器指令翻译成 JavaScript —— No.7 过渡语言
上一篇,我们决定使用 LLVM 来优化程序,并打算用 C 作为输入语言.现在我们来研究一下,将 6502 指令转换成 C 的可行性. 跳转支持 翻译成 C 语言,可比 JS 容易多了.因为 C 支持 ...
- 机器指令翻译成 JavaScript —— 终极目标
上一篇,我们顺利将 6502 指令翻译成 C 代码,并演示了一个案例. 现在,我们来完成最后的目标 -- 转换成 JavaScript. 中间码输出 我们之所以选择 C,就是为了使用 LLVM.现在来 ...
- 机器指令翻译成 JavaScript —— No.3 流程分割
上一篇 我们讨论了跳转指令,并实现「正跳转」的翻译,但最终困在「负跳转」上.而且,由于线程模型的差异,我们不能 1:1 的翻译,必须对流程进行一些改造. 当初之所以选择翻译,而不是模拟,就是出于性能考 ...
- 机器指令翻译成 JavaScript —— No.6 深度优化
第一篇 中我们曾提到,JavaScript 最终还得经过浏览器来解析.因此可以把一些优化工作,交给脚本引擎来完成. 现代浏览器的优化能力确实很强,但是,运行时的优化终归是有限的.如果能在事先实现,则可 ...
- 四十年前的 6502 CPU 指令翻译成 JS 代码会是怎样
去年折腾的一个东西,之前 blog 里也写过,不过那时边琢磨边写,所以比较杂乱,现在简单完整地讲解一下. 前言 当时看到一本虚拟机相关的书,正好又在想 JS 混淆相关的事,无意中冒出个问题:能不能把某 ...
- [书籍翻译] 《JavaScript并发编程》第一章 JavaScript并发简介
> 本文是我翻译<JavaScript Concurrency>书籍的第一章,该书主要以Promises.Generator.Web workers等技术来讲解JavaScript并 ...
随机推荐
- 操作系统篇-调用门与特权级(CPL、DPL和RPL)
|| 版权声明:本文为博主原创文章,未经博主允许不得转载. 一.前言 在前两篇文章(<操作系统篇-浅谈实模式与保护模式>和<操作系统篇-分段机制与GDT|LDT>)中,我们提到 ...
- JS核心系列:浅谈原型对象和原型链
在Javascript中,万物皆对象,但对象也有区别,大致可以分为两类,即:普通对象(Object)和函数对象(Function). 一般而言,通过new Function产生的对象是函数对象,其他对 ...
- 终于等到你:CYQ.Data V5系列 (ORM数据层)最新版本开源了
前言: 不要问我框架为什么从收费授权转到免费开源,人生没有那么多为什么,这些年我开源的东西并不少,虽然这个是最核心的,看淡了就也没什么了. 群里的网友:太平说: 记得一年前你开源另一个项目的时候我就说 ...
- Logstash实践: 分布式系统的日志监控
文/赵杰 2015.11.04 1. 前言 服务端日志你有多重视? 我们没有日志 有日志,但基本不去控制需要输出的内容 经常微调日志,只输出我们想看和有用的 经常监控日志,一方面帮助日志微调,一方面及 ...
- ASP.NET MVC5+EF6+EasyUI 后台管理系统(70)-微信公众平台开发-成为开发者
系列目录 前言: 一.阅读这段系列之前,你必须花半天时间大致阅读微信公众平台的API文档,我尽量以简短快速的语言与大家分享一个过程 二.借助微信公众平台SDK Senparc.Weixin for C ...
- Spring中Bean的实例化
Spring中Bean的实例化 在介绍Bean的三种实例化的方式之前,我们首先需要介绍一下什么是Bean,以及Bean的配置方式. 如果 ...
- JavaScript基础知识总结(一)
当我们接触一种新语言时,首先要先了解它,对它有一定的理论认识. 那么,什么是JavaScript呢? JavaScript是一种脚本语言,由web浏览器进行解释和执行.它包括ECMAScript.DO ...
- c#比较两个数组的差异
将DataTable中某一列数据直接转换成数组进行比较,使用的Linq,要引用命名空间using System.Linq; string[] arrRate = dtRate.AsEnumerable ...
- javaScript之BOM操作1
<!doctype html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- Android中ListView实现图文并列并且自定义分割线(完善仿微信APP)
昨天的(今天凌晨)的博文<Android中Fragment和ViewPager那点事儿>中,我们通过使用Fragment和ViewPager模仿实现了微信的布局框架.今天我们来通过使用Li ...