程序本质

回忆上次内容

  • ​python3​​ 的程序是一个 5.3M 的可执行文件
  • 我们通过which命令找到这个python3.8的位置
  • 将这个python3.8复制到我们的用户目录下
  • 这个文件还是能够执行的
  • 将这个文件转化为字节形态
  • 确实可以转化
  • 但是这个文件我们看不懂啊!!!

编辑

  • 怎么才能看懂这些东西呢?
  • 这个东西我们确实看不懂
  • 但是有人能看懂
  • 谁呢?

真实的cpu

  • 无论手机还是计算机
  • 最核心器件的器件就是cpu

编辑

  • 这个东西是个实实在在存在的实体
  • 这个cpu就能看懂这些字节码吗?

cpu

  • cpu能看懂这些字节码!!!
  • 这些字节码
  • 我们看不懂的
  • cpu能看懂
  • 这是属于cpu的机器语言
  • 这就是cpu的一条条的机器指令(instruction)

编辑

  • 机器指令码都是二进制字节形式的
  • 我们尝试把python3.8转化为字节表现形式

反汇编-汇编语言助记符

#先把~/python3对应的机器语言输出为汇编指令形式(反汇编)
objdump -d python3.8 > python3.8.asm
vi python3.8.asm
  • 这次真的可以看懂了
  • 减法(sub)
  • 移动(mov)
  • 这些指令

编辑

  • 可以发现当前系统的架构(指令集)是x86-64
  • 这些和我们刚才的字节形态有关系吗?

对比

  • 用vi分窗口分别打开打开python3 和 python3.asm
vi -o python3.8hex python3.8.asm
  • 下图中上半部分是机器语言

编辑

  • 上图下半部分是机器语言对应的汇编指令助记符
  • ctrl+j、ctrl+k可以上下窗口切换
  • 我们来试着找找
  • python3.8文件中
  • 机器语言的0101和cpu的汇编指令的对应关系

找到了

  • 下面窗格
  • 先跳到第8行
  • endbr64 意味着 64位结束分支
  • 下面就是第9行

编辑

  • 第9行
  • ​/48 83​​ 找到上下的对应关系
  • 也就是第一条执行的汇编指令sub
  • sub对应substract 是减法
  • 汇编指令是计算机 cpu 机器指令的助记符

查找对应关系

  • ​423000​​ 就是初始化(init)的 cpu 开始执行指令的地址
  • 我们在上面查找48 83
  • 看有没有对应的字节
  • /4883 ec08 488b...
  • 在上面的窗格中
  • 搜索这些字节形态

编辑

  • 好像找到了对应关系
  • 具体怎么对应的呢?
  • 这台计算机用的是什么指令集呢?
  • 什么是指令集来着?

指令集

  • 指令集就是指令的集合

编辑

  • 指令集也叫计算机的架构
  • 不同架构的 cpu 有不同的指令集
  • 我们目前的这个浏览器里面的系统用的是 ​​x86-64​
  • 除此之外 ​​arm​​、​​MIPS​​、​​RISC-V​​ 也是常用的指令集
  • 指令助记符和机器语言到底是则怎么对应的呢?

回到代码

  • 代码会有不同的 ​​section​​ 模块
  • 入口是 ​​init​
  • 作用是初始化​​initialization​

编辑

  • 模块里面是具体的指令
  • 比如第一句 ​​48 83 ec 08​
  • 为什么48 83 就可以代表减法
  • 这是谁规定的呢?

查看指令集

  • 这是cpu架构规定的
  • 首先要明确到当前机器的cpu的架构
  • 反汇编里面说是x86-64

编辑

  • 到shell里面验证一下

编辑

  • 当前机器所用的架构指令集确实是x86-64
  • 这是谁的架构呢?

搜索

  • 不会了就去搜索

编辑

  • 去intel官网找指令集

查询x86_64指令集

  • 找到cpu的手册
  • 可以找到指令和二进制状态之间的关系么?
  • 先要找到x86-64指令集中 48 83 这条指令

编辑

  • 注意上图中
  • 100B中的B是0或1
  • 100B可以是1000
  • 也可以是1001
  • 这确实是一条减法指令
  • 而且是8位立即数和寄存器的减法运算

逐步搜索

编辑

  • 找起来真的很费劲
  • ​48 83 ec 08​​ 对应 ​​sub $0x8,%rsp​
  • 确实是一条减法指令
  • 确实是8位立即数和寄存器的减法运算

编辑

  • 和objdump的结果是一致的
  • 废话!!!
  • 除了减法指令sub之外
  • 还有什么别的指令呢?

更多cpu指令

  • 指令那可还有很多的
  • 有运算的
  • 有移位的
  • 加减乘除都有

编辑

  • 这些指令的集合就是指令集
  • 指令集就是cpu运行的基础!
  • 这些机器语言的指令不能在别的指令集架构上运行么?

移植 port

  • 想在别的指令集架构上运行程序
  • 就需要移植(port)
  • 移植(port)指的是从一种指令集移植到另一种指令集
  • 从这个词的词源
  • 可以看出欧美的航海文化基础
  • port 港口
  • 也可以看出我们的农耕文化基础
  • 移植

编辑

  • 不移植会如何呢?

不移植

  • 这是playstation2的架构图
  • cpu是mips架构的

编辑

  • 不移植的话
  • 就是让x86架构的pc
  • 去直接执行这些基于mips架构的的0101... 字节码
  • 就像让一个意大利泥瓦匠看一份中文写成的烹饪书来砌墙
  • 鸡同鸭讲
  • 驴唇不对马嘴
  • 0101的文件执行出来全是乱的
  • 完全不能用
  • 而且不全是软件的问题
  • 也涉及到硬件等方面
  • 可能某个寄存器在新架构中根本就不存在

架构师

  • 这个时候架构师要解决相当多的问题
  • 很不容易的

编辑

  • 落实到我们的python3.8游乐场
  • 我们的python3.8就是这样的一系列的cpu指令
  • 可以解释py文件的
  • python3.8 又是如何解释py文件的来着?

python3 执行过程

  • 不管是python3.8这个游乐场
  • 还是hello.py这个python程序
  • 都在我们的硬盘上

编辑

  • 先得把文件从硬盘读到内存

python3 执行的过程大致是这样

  • 先把python3.8这个主解释器加载到内存中
  • 然后在x86-64的cpu上执行
  • 模拟出一台python虚拟机

编辑

  • 对py文件解释执行
  • 那为什么py程序可以跨架构跨平台呢?

架构的层次

  • 不同架构的 cpu 都可以运行 python
  • risc-v
  • arm
  • x64
  • mips
  • 龙芯

编辑

  • 不同系统的环境都可以运行 python
  • win
  • mac
  • linux
  • freebsd

跨架构跨平台原理

  • 由于python3.8 的源文件
  • 被不同的架构的编译器 编译后
  • 被部署到 不同的cpu架构和系统上
  • 所以同样的py文件被加载之后
  • python程序可以对py文件跨架构、跨系统进行解释执行
  • 一次编写到处运行

编辑

  • 不同的架构下
  • 汇编指令都不一样
  • 怎么能正确解释执行同样的python程序呢?

跨架构跨平台原理

  • ​/usr/bin/python3.8​​ 本身是二进制文件
  • 是基于当前操作系统当前架构编译出来的
  • 可执行二进制文件
  • 不同的架构有不同的编译器
  • 不同的编译器编译出来的python3.8
  • 是不同的二进制指令序列

编辑

  • ​python3.8​​ 构建了一个运行时环境
  • 这个环境可以解释读到的​​python语句​
  • 把​​python语句​​翻译成系统能读懂输入输出
  • 翻译成当前架构能够执行的代码
  • 然后边解释边执行
  • 恭喜您完成了非常烧脑一个实验!
  • 我们去总结吧!!!

总结

  • ​python3​​ 的程序是一个 5.3M 的可执行文件
  • ​python3​​ 里面全都是 cpu 指令
  • 可以执行的那种
  • 我们可以把指令对应的汇编找到
  • ​objdump -d ~/python3 > python3.asm​
  • 汇编语句是和当前机器架构的指令集相关的
  • ​uname -a​​可以查询指令集
  • 我们执行的过程其实就
  • 系统执行​​python3​​这个可执行文件
  • 给了​​python3​​一个参数​​hello.py​
  • ​python3​​对于​​hello.py​​一句句的解释执行
  • 在显示器输出了​​hello world​
  • ​python3​​执行完毕
  • 把控制权交回给 shell
  • 这就是我们执行​​hello.py​​的过程
  • 我想输出个稍微复杂点的东西
  • 可以做下面这个框架标题吗?

编辑

[oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言的更多相关文章

  1. python的exe反编译

    目录 python的exe反编译 方法一.使用archive_viewer.py提取pyc 方法二.使用pyinstxtractor.py提取pyc python的exe反编译 驱动人生样本为pyth ...

  2. C#代码反编译 得到项目可运行源码

    C#代码反编译 得到项目可运行源码 摘自:http://www.cnblogs.com/know/archive/2011/03/15/1985026.html 谈到"C#代码反编译&quo ...

  3. Android逆向之旅---反编译利器Apktool和Jadx源码分析以及错误纠正

    Android逆向之旅---反编译利器Apktool和Jadx源码分析以及错误纠正 http://blog.csdn.net/jiangwei0910410003/article/details/51 ...

  4. 解决AndroidKiller APK 反编译失败,无法继续下一步源码反编译!

    报错背景 今天使用AndroidKiller V1.3.1,反编译一个APK,遇到如下报错: 当前 Apktool 使用版本:Android Killer Default APKTOOL 正在反编译 ...

  5. ubuntu下把python脚本转为二进制字节码文件

    ubuntu下把python脚本转为二进制字节码文件 听语音 原创 | 浏览:354 | 更新:2017-12-22 14:48 1 2 3 4 5 6 7 分步阅读 自己拥有个几个python脚本文 ...

  6. python调用java&反编译地址

    反编译工具地址: https://github.com/java-decompiler/jd-gui/releases 你想知道的JPype全在这里∞   先总结自己趟的坑 1. python进程是6 ...

  7. Java逆向武器库_反编译工具

    1.反编译工具之_jd-gui 官网下载地址:http://java-decompiler.github.io/#jd-gui-download 使用: 下载后解压直接使用即可. jd-gui的优势是 ...

  8. class文件直接修改_反编译修改class文件变量

    今天笔者同事遇到一个问题,客户同事的数据库连接信息直接写在代码中,连接的密码改了,但是又没有源代码,所以只能直接修改Java class文件. 记录一下修改步骤: 1.下载JClassLib_wind ...

  9. 使用Eclipse中的反编译插件jadClipse查看Class源码

    功安装完插件jadClipse 之后便可以查看源码class文件了 但是对于自己代码的class文件,直接复制过来却看不到,需要以下操作. 将此文件以及文件夹直接拷贝到Eclipse中发现 右击项目- ...

  10. Python - 浅谈Python的编译与反编译

    1 - Python编译过程涉及的文件 py 源代码文件,由python.exe解释,可在控制台下运行,可用文本编辑器进行编辑: pyc 源代码文件经过编译后生成的二进制文件,无法用文本编辑器进行编辑 ...

随机推荐

  1. 【超强SQL】WordPress批量修改指定分类下所有文章状态

    前阵子主题君的某一个手游下载站的某一个分类,被百度K了,导致整个分类的文章收录都没了,这时候如果想要回复权重,就需要把这个分类的文章都删除了. 下面主题君给大家分享一段巨牛逼的SQL, WordPre ...

  2. phpstorm对laravel开发的配置

    摘自:https://www.cnblogs.com/Richard-Tang/p/10218178.html phpstorm对laravel开发的配置   一.安装Laravel 1.下载comp ...

  3. 开发人员必知的5种开源协议(GPL、LGPL、BSD、MIT、Apache License)

    软件开源是许多软件企业需要关注的问题,不同的开源软件协议,对应不同的源代码使用限制.只有了解这些开源软件协议,才能更好地使用和回馈开源软件,否则就有可能触犯法律.今天介绍四种常见的开源软件协议: GP ...

  4. SpringBoot自定义注解失效原因(2022-10-3)

    长话短说,我负责的是一个多模块项目,接手的时候没有注意 @ComponentScan 注解的扫描范围,所以打包的时候,没有扫到我新加包. 所以,重点检查下 @ComponentScan 注解的范围

  5. 8.19考试总结(NOIP模拟44)[Emotional Flutter·Medium Counting·Huge Counting·字符消除2 ]

    在自称善意的之时,即存恶意. 前言 几乎是大暑假的最后一次考试了. 我也迎来了我的第一次报零(雾 T1 Emotional Flutter 解题思路 比较考验思维能力,其实就是区间覆盖问题. 我考场上 ...

  6. 8.17考试总结(NOIP模拟42)[卷·简单题·粉丝·字符串]

    你的败因只有一个,就是与我为敌. ­ T1 卷 解题思路 乍一看,简单的树形 DP . 后来一看数据范围,发现事实并非如此.(\((10^9)^{2\times 10^5}\)????) 毕竟取 \( ...

  7. 什么是LLM大模型训练,详解Transformer结构模型

    本文分享自华为云社区<LLM 大模型学习必知必会系列(四):LLM训练理论篇以及Transformer结构模型详解>,作者:汀丶. 1.模型/训练/推理知识介绍 深度学习领域所谓的&quo ...

  8. Java 获取当前时间的年、月、日、小时、分钟、秒数

    public static void getDateTime() throws ParseException{ Calendar now = Calendar.getInstance(); Syste ...

  9. 在 Wed 中应用 MyBatis(同时使用MVC架构模式,以及ThreadLocal 事务控制)

    1. 在 Wed 中应用 MyBatis(同时使用MVC架构模式,以及ThreadLocal 事务控制) @ 目录 1. 在 Wed 中应用 MyBatis(同时使用MVC架构模式,以及ThreadL ...

  10. 1003 我要通过! PTA Basic Level

    我的个人博客 azoux's blog 题目 我要通过! (20 分) "答案正确"是自动判题系统给出的最令人欢喜的回复.本题属于 PAT 的"答案正确"大派送 ...