翻译文章“AST 模块:用 Python 修改 Python 代码”---!!注意ironpathyon未实现此功能
https://github.com/upsuper/blog/commit/0214fdd084c4adf2de2ed9912d644fb59ce13a1c
+Title: [翻译] AST 模块:用 Python 修改 Python 代码
+Date: 2012-03-03 16:47
+Tags: Python
Category: Technique
Slug: static-modification-of-python-with-python-the-ast-module
Author: Xidorn Quan
原文:[Static Modification of Python With Python: The AST Module](http://blueprintforge.com/blog/2012/02/27/static-modification-of-python-with-python-the-ast-module/)
修改代码在有时会变的十分有用,比如在进行测试和分析的时候。在这篇文章中,我们将看到如何使用 `ast` 模块对 Python 代码进行修改,同时还将看到一些使用了这个技术的工具。
1、CPython 的编译过程
<div style="float: left; margin-right: 20px;"><img src="|filename|/images/pep339.png" /></div>
在开始之前,我们应该先看看 CPython 的编译过程,这个过程在 http://www.python.org/dev/peps/pep-0339/ 中有详细的描述。
当然,在读这篇文章的时候,你并不需要对这个步骤有很深入的理解,不过这可以帮助你对整个过程有一个大体的了解。
首先,编译器会根据源代码生成一棵语法分析树 (Parse Tree),随后,再根据语法分析树建立抽象语法树 (AST, Abstract Syntax Tree)。从 AST 中可以生成出控制流图 (CFG, Control Flow Graph),最后再将控制流图编译为代码对象 (Code Object)。
图中标蓝的部分就是 AST 这一步,也就是我们今天所关注的部分。Python(注意:不是ironPython) 从 2.6 开始就提供了现在这样的 `ast` 模块,它提供了一种访问和修改 AST 的简单方式。
通过这个,我们可以从 AST 中生成代码对象,也可以出于某些原因,根据修改过的 AST 重新生成源代码。
## 创建 AST
先来写一点简单的代码,我们写一个叫做 `add` 的函数,然后观察它所生成的 AST。
:::python
>>> import ast
>>> expr = """
... def add(arg1, arg2):
... return arg1 + arg2
... """
>>> expr_ast = ast.parse(expr)
>>> expr_ast
<_ast.Module object at 0x10a7a09d0>
现在我们已经生成了一个 `ast.Module` 对象,我们来看看它的内容:
:::python
>>> ast.dump(expr_ast)
"Module(
body=[
FunctionDef(
name='add', args=arguments(
args=[
Name(id='arg1', ctx=Param()),
Name(id='arg2', ctx=Param())
],
vararg=None,
kwarg=None,
defaults=[]),
body=[
Return(
value=BinOp(
left=Name(id='arg1', ctx=Load()),
op=Add(),
right=Name(id='arg2', ctx=Load())))
],
decorator_list=[])
])"
正如我们所见,`Module` 是父节点,它的 `body` 中包含了一个函数定义的元素,这个函数定义包含了函数名、参数列表和函数体。函数体又包含了一个单独的 `Return` 节点,节点中含有一个 `Add` 运算。
## 修改 AST
我们如何修改这棵树以改变代码的作用呢?为了说明这个问题,我们来做点也许你永远也不会在你自己代码中做的疯狂的事情吧。我们将遍历这棵树,并且将 `Add` 运算修改为 `Mult` 运算。看,我说过这很疯狂吧!
我们要先建立一个 `NodeTransformer` 变换器的子类,并且定义 `visit_BinOp` 方法。每当这个变换器访问到一个二元运算符节点时,就会调用这个方法。
:::python
class CrazyTransformer(ast.NodeTransformer):
def visit_BinOp(self, node):
print node.__dict__
node.op = ast.Mult()
print node.__dict__
return node
现在我们已经定义好了我们这个奇怪的变换器,让我们看看将它应用于我们开始时写的那些代码会怎么样:
:::python
>>> transformer = CrazyTransformer()
>>> transformer.visit(expr_ast)
{
'op': <_ast.Add object at 0x10a8321d0>,
'right': <_ast.Name object at 0x10a839390>,
'lineno': 3, 'col_offset': 8,
'left': <_ast.Name object at 0x10a839350>}
{
'op': <_ast.Mult object at 0x10a839510>,
'right': <_ast.Name object at 0x10a839390>,
'lineno': 3, 'col_offset': 8,
'left': <_ast.Name object at 0x10a839350>}
你可以从输出的结果对比发现,`Add` 节点已经被替换成了一个 `Mult`。我们有许多方法没有提到,比如访问子节点,不过这个例子已经足以刻画出它的基本原理。
## 编译和执行修改后的 AST
我们在最初的代码后面加上一个调用,比如:
:::python
print add(4, 5)
让我们看看这些代码是如何运行的:
:::python
>>> unmodified = ast.parse(expr)
>>> exec compile(unmodified, '<string>', 'exec')
9
>>> transformer = CrazyTransformer()
>>> modified = transformer.visit(unmodified)
>>> exec compile(modified, '<string>', 'exec')
20
我们可以看到,未修改的和修改后的 AST 所编译出的代码,一个输出了9,一个输出了20。
## 重新翻译回源代码
最后,我们可以用 `unparse` 模块将修改后的代码转换回对应的源代码,`unparse` 模块可以在[这里](http://svn.python.org/projects/python/trunk/Demo/parser/unparse.py "unparse.py")找到。
:::python
>>> unparse.Unparser(modified, sys.stdout)
def add(arg1, arg2):
return (arg1 * arg2)
print add(4, 5)
正如我们所看到的,`*` 运算符取代了 `+`。在这个反解析工具对于理解你的 AST 变换器如何修改代码很有帮助。
## 实践应用
显然,我们上面的例子在实际应用中几乎没有意义。然而静态分析和修改代码却是十分有用的。
比如你可以为测试程序而注入一些代码。你可以看看[这篇 Pycon 演讲][pycon-talk-ast]以理解如何使用一个节点转换器注入指令代码来测试程序。
除此之外,[Pythonscope 项目](http://pythoscope.org/)也使用了 AST 访问器 (visitor) 来处理源代码并根据函数签名生成测试。
还有像 pylint 这样的项目使用 AST 步移法 (walking method) 来分析源代码。在 pylint 中,Logilab 还建立了一个模块专门用于:
> 提供一个通用的 Python 源代码基本表示方式以为如 pychecker、pyreverse 或 pylint 等项目的开发提供方便。
你可以在[这里](http://www.logilab.org/project/logilab-astng "logilab-astng (Python Abstract Syntax Tree New Generation)")看到更多关于这个项目的信息。
## 引用
Matthew J Desmarais 的[这篇 Pycon 演讲][pycon-talk-ast]以及 Eli Bendersky 的[这篇博客][blog-ast]对于本文的帮助是无可估量的。
[pycon-talk-ast]: http://www.tudou.com/programs/view/5IHp-wxyt3c/ "PyCon 2011: What would you do with an ast?"
[blog-ast]: http://eli.thegreenplace.net/2009/11/28/python-internals-working-with-python-asts/ "Python internals: Working with Python ASTs"
翻译文章“AST 模块:用 Python 修改 Python 代码”---!!注意ironpathyon未实现此功能的更多相关文章
- python修改python unittest的运行顺序
正常是一个测试类中按函数名字运行, 下面修改成直接按每个测试方法的代码顺序执行 文件 unittest_util.py import time import unittest from app.uti ...
- 第二种方式,修改python unittest的执行顺序,使用猴子补丁
1.按照测试用例的上下顺序,而不是按方法的名称的字母顺序来执行测试用例. 之前的文章链接 python修改python unittest的运行顺序 之前写的,不是猴子补丁,而是要把Test用例的类名传 ...
- 嵌入Python | 调用Python模块中无参数的函数
开发环境 Python版本:3.6.4 (32-bit) 编辑器:Visual Studio Code C++环境:Visual Studio 2013 需求说明 在用VS2013编写的Win32程序 ...
- python 全栈开发,Day29(昨日作业讲解,模块搜索路径,编译python文件,包以及包的import和from,软件开发规范)
一.昨日作业讲解 先来回顾一下昨日的内容 1.os模块 和操作系统交互 工作目录 文件夹 文件 操作系统命令 路径相关的 2.模块 最本质的区别 import会创建一个专属于模块的名字, 所有导入模块 ...
- PyCharm 配置远程python解释器和在本地修改服务器代码
PyCharm 配置远程python解释器和在本地修改服务器代码 最近在学习机器学习的过程中,常常需要将本地写的代码传到GPU服务器中,然后在服务器上运行.之前的做法一直是先在本地写好代码,然后通过F ...
- python函数,模块及eclipse配置python开发环境
一.eclipse的使用 1.作用 (1)最好用的IDE (2)可调式debug (3)查看可执行过程 (4)可查看源代码 2.安装eclipse及配置 目录安装Pythonpython for ec ...
- 【Python】Python学习----第一模块笔记
1.python是什么? python是动态解释型的强类型定义语言. python官方版本的解释器是CPython.该解释器使用C语言开发. 当前主要使用3.x版本的python. 2.第一个pyth ...
- 超牛 猴子补丁,修改python内置的print
猴子补丁一般是用于修改三方包或官方包,也可以用来修改自己或者他人的代码. 但也可以用来修改python 语言内置的关键字. 本篇博客修改python最常用的内置print,使你使用print时候,自动 ...
- Python深入:修改Python搜索路径
当Python执行import语句时,它会在一些路径中搜索Python模块和扩展模块.可以通过sys.path查看这些路径,比如: >>> import sys >>&g ...
随机推荐
- 面试相关的技术问题---java基础
最近在准备秋季校招,将一些常见的技术问题做一个总结!希望对大家有所帮助! 1.面向对象和面向过程的区别是什么? 面向对象是把构成问题的事务分解成各个对象,建立对象的目的不是为了完成一个步骤,而是为了描 ...
- 20160420javaweb之文件上传和下载
一.文件上传 1.提供表单允许用户通过表单选择文件进行上传 表单必须是POST提交 文件输入框必须有name属性,只有有name属性的输入项浏览器才会进行提交 需要设置enctype属性值为multi ...
- linux下源码安装软件
在linux下的很多软件都是通过源码包方式发布的,这样做对于最终用户而言,虽然相对于二进制软件包,配置和编译起来繁琐点,但是它的可移植性却好得多,针对不同的体系结构,软件开发者往往仅需发布同一份源码包 ...
- 学习笔记_Java get和post区别(转载_GET一般用于获取/查询资源信息,而POST一般用于更新资源信息)
转载自:[hyddd(http://www.cnblogs.com/hyddd/)] 总结一下, Get是向服务器发索取数据的一种请求 而Post是向服务器提交数据的一种请求,在F ...
- Asp.Net部分面试题
HTML.javascript部分 1. jQuery的美元符号$有什么作用? 答:个人理解:$指代jquery对象,拥有jquery对象所有的属性和成员 网友理解:在Jquery中,$是JQuery ...
- mediawiki数据库的下载地址及导入方法
mediawiki导入数据库 数据库下载:http://zh.wikipedia.org/wiki/Wikipedia:%E6%95%B0%E6%8D%AE%E5%BA%93%E4%B8%8B%E8% ...
- HDU 4294 A Famous Equation(DP)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4249 题目大意:给一个a+b=c的表达式,但是a.b.c中部分位的数字丢失,并用?代替,问有多少种方案 ...
- STL之优先队列
STL 中优先队列的使用方法(priority_queu) 基本操作: empty() 如果队列为空返回真 pop() 删除对顶元素 push() 加入一个元素 size() 返回优先队列中拥有的元素 ...
- c++ primer复习(三)
1 istream.ostream类型,cin.cout.cerr是istream或ostream类型的具体的对象,<<和>>是操纵符 getline函数的参数是istream ...
- C++类继承内存布局(二)
转自:http://blog.csdn.net/jiangyi711/article/details/4890889# (二 )成员变量 前面介绍完了类布局,接下来考虑不同的继承方式下,访问成员变量的 ...