语义分析_抽象语法树_反汇编 回忆
  • 上次回顾了一下历史
  • python 是如何从无到有的
  • 看到 Guido 长期的坚持和努力
 

 
添加图片注释,不超过 140 字(可选)
 
  • python究竟是如何理解
  • print("hello")的?
  • 这些ascii字母如何被组织起来执行?
 
纯文本
  • 首先编写Guido的简历
print("1982------Guido in cwi") print("1995------Guido in cnri") print("2000------Guido in beopen") print("2005------Guido in google") print("2012------Guido in dropbox") print("2020------Guido in microsoft")
  • 并保存为Guido.py
生成token流
  • 回到shell之后
  • 从字符流生成token流
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这个过程叫做分词
分词
  • 首先把一个个字符组成词
  • 分析一下哪些字可以组成词
  • 术语叫词法分析(lexical analysis)
 

 
添加图片注释,不超过 140 字(可选)
 
  • 词分析出来之后呢?
组词
  • 词分析出来就是怎么组词的问题
  • 哪些词和哪些词先组合
  • 哪些词和哪些词后组合
 
  • 生成一棵抽象语法树
  • AST(Abstract Syntax Tree)
 

 
添加图片注释,不超过 140 字(可选)
 
  • 我能看看这棵ast树么?
引入ast模块

 
添加图片注释,不超过 140 字(可选)
 
  • 具体怎么做呢?
流程
  • 先把这个ast模块导入(import)进来
  • 第一句就是import ast
  • 回车之后没有任何报错
  • 那就是执行成功了
  • 后面也一样
  • 没有报错就是执行成功了
 

 
添加图片注释,不超过 140 字(可选)
 
  • 然后读取guido.py并送到s
  • 然后对于s进行语法分析(parse)

 
添加图片注释,不超过 140 字(可选)
 
  • 再把分析(parse)的结果进行转储(dump)
  • 看起来有点乱
  • 可以清晰一些么?
 
升级Python
  • 目前lanqiao.cn上面的python是3.8
  • 这个清晰缩进的格式需要在3.9以上完成
  • 需要升级
sudo apt update sudo apt install python3.9
  • 升级之后就可以使用Python3.9了

 
添加图片注释,不超过 140 字(可选)
缩进换行
  • 只能在本地演示一下

 
添加图片注释,不超过 140 字(可选)
 
  • 这个就是把词组成语法树的样子
  • 如何理解这棵树呢?
  • 我们看一个例子
表达式运算
  • 如果给的表达式为 1 2 3

 
添加图片注释,不超过 140 字(可选)
 
  • 结合序为下图

 
添加图片注释,不超过 140 字(可选)
 
  • 前两个先结合
  • 得到的结果作为下一个运算的左操作数
  • 然后和第3个结合
结合序
  • 如果把 第一个* 改成 + 号
  • 其他什么也没加

 
添加图片注释,不超过 140 字(可选)
 
  • 表达式是1 + 2 * 3

 
添加图片注释,不超过 140 字(可选)
 
  • 后两个会先结合
  • 得到的结果 作为下一个运算的 右操作数
  • 然后再和1 进行 加法运算
 
  • 有了 语法树
  • 下一步 要做什么呢?
 
  • 这棵语法树 我们能看懂
  • 但是cpu 需要的是
  • 能执行的 一条条字节码指令
 
 
翻译成 字节码
  • 要把源程序 翻译成字节码 才能执行
  • 字节码 对应着cpu的指令
 
  • 怎么把ast 转化为字节码(指令) 呢?
  • 需要 编译(compile)
 
  • 从一种语言 到 另一种语言
  • 从py文件
  • 到字节码(指令)
  • 就是编译
  • compile
 
 

 
添加图片注释,不超过 140 字(可选)
compile

 
添加图片注释,不超过 140 字(可选)
 
  • 我可以看看这个编译过程么?
指令
  • instruction
  • python3 -m dis Guido.py
  • -m 代表使用模块
  • dis 代表反编译(disassemble)
 

 
添加图片注释,不超过 140 字(可选)
 
  • 我们可以看见
  • 前面是行号
  • 每行对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈
 
 
编译结果
  • 先看看这个pyc文件
  • 注意他在__pycache__文件夹下
 

 
添加图片注释,不超过 140 字(可选)
 
  • :%!xxd
  • 把文件转化为字节形态
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这纯纯的机器语言字节形态
  • 实在是看不懂啊
  • 这真的是指令么?
 
  • 究竟什么是指令呢?
指令
  • py文件每行print 对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这样 我们 能否找到
  • 4条指令 分别对应的 字节状态值
 
找到对应关系
指令助记符
指令含义
十进制状态
十六进制状态
LOAD_NAME
装载函数名称
101
0x65
LOAD_CONST
装载参数
100
0x64
CALL_FUNCTION
调用函数
142
0x8e
POP_TOP
弹栈返回
1
0x01
  • 可以找对应关系

 
添加图片注释,不超过 140 字(可选)
 
  • 我们从头捋一下
python3 执行过程
  • 不管是python3这个游乐场
  • 还是Guido.py这个python程序
  • 都在我们的硬盘上
 

 
添加图片注释,不超过 140 字(可选)
 
  • 先得把文件从硬盘读到内存
python3 执行的过程大致是这样
  • 先把python3.8这个主解释器
  • 加载到内存中
 
  • 然后 在x86-64的cpu上 执行
  • 模拟出 一台python虚拟机
 

 
添加图片注释,不超过 140 字(可选)
 
  • 准备开始 对py文件 解释执行
先编译
  • 然后把参数 Guido.py 这个需要执行的程序 加载到内存
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 编译 得到 字节码 (byte_code)
 

 
添加图片注释,不超过 140 字(可选)
 
  • 也就是编译后 的pyc文件
解释执行
  • 不过 这个pyc指令文件
  • 是基于python虚拟机的 虚拟cpu的 指令集的
 

 
添加图片注释,不超过 140 字(可选)
 
  • 需要放到 模拟好的 python虚拟机中
  • 一条条指令 进行执行
换句话说
  • 简化版的 hello.py 的执行过程是:
  • 给了 python3 一个参数 Guido.py
  • 使用 python3 这个解释器来解释执行 Guido.py
  • Guido.py中的语句一句句地依次解释执行
 
  • 全解释完成 后
  • 退出python这个程序
  • 把控制权交回到shell
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这些 都是基于 解释器python3的
  • 所谓的 解释器python3
  • 先编译成 python虚拟机的 虚拟指令字节码
  • 然后用 python虚拟机 直接执行虚拟指令
 
 
  • 而解释器(python3) 是
  • 在不同系统 不同架构的cpu语言上 运行的
 

 
添加图片注释,不超过 140 字(可选)
 
  • 那不同的系统、cpu架构
  • python3 为什么 都能正确地解释?
 
总结
  • 这次把py源文件
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 这里确立了优先级
 
  • 编译 得到 字节码 (bytecode)
 
  • 字节码我们看不懂
  • 所以反编译 得到 指令文件(opcode)
  • 指令文件是基于python虚拟机的虚拟cpu的指令集
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 先从 python3最基础的
  • 变量声明和赋值来看看
  • python虚拟机是如何做的?
 
 


[oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree的更多相关文章

  1. 从零写一个编译器(九):语义分析之构造抽象语法树(AST)

    项目的完整代码在 C2j-Compiler 前言 在上一篇完成了符号表的构建,下一步就是输出抽象语法树(Abstract Syntax Tree,AST) 抽象语法树(abstract syntax ...

  2. 编译器开发系列--Ocelot语言1.抽象语法树

    从今天开始研究开发自己的编程语言Ocelot,从<自制编译器>出发,然后再自己不断完善功能并优化. 编译器前端简单,就不深入研究了,直接用现成的一款工具叫JavaCC,它可以生成抽象语法树 ...

  3. AST抽象语法树

    抽象语法树简介 (一)简介 抽象语法树(abstract syntax code,AST)是源代码的抽象语法结构的树状表示,树上的每个节点都表示源代码中的一种结构,这所以说是抽象的,是因为抽象语法树并 ...

  4. 理解Babel是如何编译JS代码的及理解抽象语法树(AST)

    Babel是如何编译JS代码的及理解抽象语法树(AST) 1. Babel的作用是?   很多浏览器目前还不支持ES6的代码,但是我们可以通过Babel将ES6的代码转译成ES5代码,让所有的浏览器都 ...

  5. JavaScript的工作原理:解析、抽象语法树(AST)+ 提升编译速度5个技巧

    这是专门探索 JavaScript 及其所构建的组件的系列文章的第 14 篇. 如果你错过了前面的章节,可以在这里找到它们: JavaScript 是如何工作的:引擎,运行时和调用堆栈的概述! Jav ...

  6. javascript编写一个简单的编译器(理解抽象语法树AST)

    javascript编写一个简单的编译器(理解抽象语法树AST) 编译器 是一种接收一段代码,然后把它转成一些其他一种机制.我们现在来做一个在一张纸上画出一条线,那么我们画出一条线需要定义的条件如下: ...

  7. 【Static Program Analysis - Chapter 2】 代码的表征之抽象语法树

    抽象语法树:AbstractSyntaxTrees 定义(wiki): 在计算机科学中,抽象语法树(abstract syntax tree或者缩写为AST),或者语法树(syntax tree),是 ...

  8. 抽象语法树(AST)

    AST描述 在计算机科学中,抽象语法树(AST)或语法树是用编程语言编写的源代码的抽象语法结构的树表示.树的每个节点表示在源代码中出现的构造.语法是“抽象的”,因为它不代表真实语法中出现的每个细节,而 ...

  9. Babel(抽象语法树,又称AST)

    文章:https://juejin.im/post/5a9315e46fb9a0633a711f25 https://github.com/jamiebuilds/babel-handbook/blo ...

  10. OpenJDK源码研究笔记(十一):浅析Javac编译过程中的抽象语法树(IfElse,While,Switch等语句的抽象和封装)

    浅析OpenJDK源码编译器Javac的语法树包com.sun.source.tree. 抽象语法树,是编译原理中的经典问题,有点难,本文只是随便写写. 0.赋值语句 public interface ...

随机推荐

  1. EDP .Net开发框架--业务模型

    平台下载地址:https://gitee.com/alwaysinsist/edp 业务模型概述 业务模型管理中所涉及的业务模型,业务模型的属性,业务模型的视图都是可以通过权限设置来实现数据的行(视图 ...

  2. [数字华容道] Html+css+js 实现小游戏

    [数字华容道] Html+css+js 实现小游戏 效果图 代码预览 在线预览地址 代码示例 <!DOCTYPE html> <html> <head> <m ...

  3. 全网最全100个AI工具导航网站合集

    随着ChatGPT年前的爆火,人工智能也变成当今最热门的领域之一,它正在改变着我们的生活和工作方式.无论你是想要学习人工智能的基础知识,还是想要利用人工智能来提升你的业务效率和创新能力,都需要找到合适 ...

  4. 腾讯消息队列CMQ一键化部署脚本

    CMQ-1.0.2-软件包.tar安装包放在家目录,脚本也放在家目录,然后执行:sh -x cmq_install.sh [ip1] [ip2] [ip3] 即可 下列脚本代码保存为:cmq_inst ...

  5. 8.19考试总结(NOIP模拟44)[Emotional Flutter·Medium Counting·Huge Counting·字符消除2 ]

    在自称善意的之时,即存恶意. 前言 几乎是大暑假的最后一次考试了. 我也迎来了我的第一次报零(雾 T1 Emotional Flutter 解题思路 比较考验思维能力,其实就是区间覆盖问题. 我考场上 ...

  6. 8.11考试总结(NOIP模拟36)[Dove 打扑克·Cicada 与排序·Cicada 拿衣服]

    我会化作人间的风雨陪在你的身边 T1 Dove 打扑克 解题思路 考场上是想了一个树状数组维护的打法,但是竟然和 \(qn^2\) 的算法一样是 65pts 暴力就是对于每一次 2 询问重新建一下树状 ...

  7. IMX6ULL基本环境搭建

    基本环境搭建 1 交叉编译工具 在虚拟机中安装交叉编译工具,为后续开发做准备. 1.1 工具版本 工具版本:Linaro Releases 当前虚拟机为64位系统,因此下载64位系统的工具: $ un ...

  8. react withRouter高阶组件

    作用:把不是通过路由切换过来的组件中,将react-router 的 history.location.match 三个对象传入props对象上 默认情况下必须是经过路由匹配渲染的组件才存在this. ...

  9. 如果设备不支持vulkan,就用swiftshader,否则就加载系统的vulkan的正确姿势(让程序能够智能的在vulkan-1.dll和libvk_swiftshader.dll之间切换)

    一些老的显卡设备没有更新驱动,甚至根本就不支持Vulkan的显卡,遇到静态链接的vulkan-1.lib文件,启动exe就会崩溃. 你以为从别的机器拷贝这个vulkan-1.dll就可以了吗? 太傻太 ...

  10. Mysql慢sql优化

    Mysql慢sql优化 index1.MySQL的执行过程2.索引的定义3.MySQL执行计划explain or desc4.索引使用/创建规则5.弊端6.设计规范7.SQL建议 1. MySQL ...