在Python中,为了解决内存泄露问题,采用了对象引用计数,并基于引用计数实现自动垃圾回

由于Python 有了自动垃圾回收功能,就造成了不少初学者误认为不必再受内存泄漏的骚扰了。但如果仔细查看一下Python文档对 __del__() 函数的描述,就知道这种好日子里也是有阴云的。下面摘抄一点文档内容如下:

Some common situations that may prevent the reference count of an object from going to zero include: circular references between objects (e.g., a doubly-linked list or a tree data structure with parent and child pointers); a reference to the object on the stack frame of a function that caught an exception (the traceback stored in sys.exc_traceback keeps the stack frame alive); or a reference to the object on the stack frame that raised an unhandled exception in interactive mode (the traceback stored in sys.last_traceback keeps the stack frame alive).

  可见, __del__() 函数的对象间的循环引用是导致内存泄漏的主凶。但没有__del__()函数的对象间的循环引用是可以被垃圾回收器回收掉的。

如何知道一个对象是否内存泄露掉了呢?

可以通过Python的扩展模块gc来查看不能回收掉的对象的详细信息。

例1:没有出现内存泄露的

import gc
import sys class CGcLeak(object):
def __init__(self):
self._text = '#' * 10 def __del__(self):
pass def make_circle_ref():
_gcleak = CGcLeak()
print "_gcleak ref count0: %d" %(sys.getrefcount(_gcleak))
del _gcleak
try:
print "_gcleak ref count1 :%d" %(sys.getrefcount(_gcleak))
except UnboundLocalError: # 本地变量xxx引用前没定义
print "_gcleak is invalid!"
def test_gcleak():
gc.enable() #设置垃圾回收器调试标志
gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS) print "begin leak test..."
make_circle_ref() print "\nbegin collect..."
_unreachable = gc.collect()
print "unreachable object num:%d" %(_unreachable)
print "garbage object num:%d" %(len(gc.garbage)) #gc.garbage是一个list对象,列表项是垃圾收集器发现的不可达(即垃圾对象)、但又不能释放(不可回收)的对象,通常gc.garbage中的对象是引用对象还中的对象。因Python不知用什么顺序来调用对象的__del__函数,导致对象始终存活在gc.garbage中,造成内存泄露 if __name__ == "__main__": test_gcleak()。如果知道一个安全次序,那么就可以打破引用焕,再执行del gc.garbage[:]从而清空垃圾对象列表
if __name__ == "__main__":
test_gcleak()

结果

begin leak test...
_gcleak ref count0: 2 #对象_gcleak的引用计数为2
_gcleak is invalid! #因为执行了del函数,_gcleak变为了不可达的对象 begin collect... #开始垃圾回收
unreachable object num:0 #本次垃圾回收发现的不可达的对象个数为0
garbage object num:0 #整个解释器中垃圾对象的个数为0

结论是对象_gcleak的引用计数是正确的,也没发生内存泄漏。

例2:对自己的循环引用造成内存泄露

import gc
import sys class CGcLeak(object):
def __init__(self):
self._text = '#' * 10 def __del__(self):
pass def make_circle_ref():
_gcleak = CGcLeak()
_gcleak._self = _gcleak #自己循环引用自己
print "_gcleak ref count0: %d" %(sys.getrefcount(_gcleak))
del _gcleak
try:
print "_gcleak ref count1 :%d" %(sys.getrefcount(_gcleak))
except UnboundLocalError:
print "_gcleak is invalid!" def test_gcleak():
gc.enable()
gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS) print "begin leak test..."
make_circle_ref() print "\nbegin collect..."
_unreachable = gc.collect()
print "unreachable object num:%d" %(_unreachable)
print "garbage object num:%d" %(len(gc.garbage)) if __name__ == "__main__":
test_gcleak()

结果

begin leak test...
gc: uncollectable <CGcLeak 00000000026366A0>
_gcleak ref count0: 3
_gcleak is invalid!
gc: uncollectable <dict 0000000002667BD8> begin collect...
unreachable object num:2 #本次回收不可达的对象个数为2
garbage object num:1 #整个解释器中垃圾个数为1

例3:多个对象间的循环引用造成内存泄露 

import gc
import sys class CGcLeakA(object):
def __init__(self):
self._text = '$' * 10 def __del__(self):
pass class CGcLeakB(object):
def __init__(self):
self._text = '$' * 10 def __del__(self):
pass def make_circle_ref():
_a = CGcLeakA()
_b = CGcLeakB()
_a.s = _b
_b.d = _a
print "ref count0:a=%d b=%d" %(sys.getrefcount(_a), sys.getrefcount(_b))
del _a
del _b
try:
print "ref count1:a%d" %(sys.getrefcount(_a))
except UnboundLocalError:
print "_a is invalid!" def test_gcleak():
gc.enable()
gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS) print "begin leak test..."
make_circle_ref() print "\nbegin collect..."
_unreachable = gc.collect()
print "unreachable object num:%d" %(_unreachable)
print "garbage object num:%d" %(len(gc.garbage)) if __name__ == "__main__":
test_gcleak()

结果

begin leak test...
ref count0:a=3 b=3
_a is invalid! begin collect...
unreachable object num:4
garbage object num:2
gc: uncollectable <CGcLeakA 00000000022766D8>
gc: uncollectable <CGcLeakB 0000000002276710>
gc: uncollectable <dict 00000000022A7E18>
gc: uncollectable <dict 00000000022DF3C8>

结论

Python 的 gc 有比较强的功能,比如设置 gc.set_debug(gc.DEBUG_LEAK) 就可以进行循环引用导致的内存泄露的检查。如果在开发时进行内存泄露检查;在发布时能够确保不会内存泄露,那么就可以延长 Python 的垃圾回收时间间隔、甚至主动关闭垃圾回收机制,从而提高运行效率。

有待于深入研究的知识:监控Python中的引用计数

参考:Python的内存泄漏及gc模块的使用分析

Python垃圾回收机制:gc模块的更多相关文章

  1. Python垃圾回收机制:gc模块(zz)

    在Python中,为了解决内存泄露问题,采用了对象引用计数,并基于引用计数实现自动垃圾回收. 由于Python 有了自动垃圾回收功能,就造成了不少初学者误认为不必再受内存泄漏的骚扰了.但如果仔细查看一 ...

  2. 浅析Python垃圾回收机制!

    Python垃圾回收机制 目录 Python垃圾回收机制 1. 内存泄露 2. Python什么时候启动垃圾回收机制? 2.1 计数引用 2.2 循环引用 问题:引用计数是0是启动垃圾回收的充要条件吗 ...

  3. 简述Python垃圾回收机制和常量池的验证

    目录 通过代码验证python解释器内部使用了常量池 Python的引入 变量的引入 为什么要有变量 定义变量 常量引入 常量池引入 Python解释器 Python变量存储机制 Python垃圾回收 ...

  4. 垃圾回收机制GC

    垃圾回收机制GC 我们已经知道,name = 'leethon'这一赋值变量的操作,是将变量与数据值相绑定. 而数据值是存储到内存中的,有时变量会重新赋值即绑定其他数据值,而使得原本的数据值无法通过变 ...

  5. 垃圾回收机制GC知识再总结兼谈如何用好GC

    一.为什么需要GC 应用程序对资源操作,通常简单分为以下几个步骤: 1.为对应的资源分配内存 2.初始化内存 3.使用资源 4.清理资源 5.释放内存 应用程序对资源(内存使用)管理的方式,常见的一般 ...

  6. 垃圾回收机制GC知识再总结兼谈如何用好GC(转)

    作者:Jeff Wong 出处:http://jeffwongishandsome.cnblogs.com/ 本文版权归作者和博客园共有,欢迎围观转载.转载时请您务必在文章明显位置给出原文链接,谢谢您 ...

  7. python垃圾回收机制与小整数池

    python垃圾回收机制 当引用计数为0时,python会删除这个值. 引用计数 x = 10 y = x del x print(y) 10 引用计数+1,引用计数+1,引用计数-1,此时引用计数为 ...

  8. python垃圾回收机制:引用计数 VS js垃圾回收机制:标记清除

    js垃圾回收机制:标记清除 Js具有自动垃圾回收机制.垃圾收集器会按照固定的时间间隔周期性的执行. JS中最常见的垃圾回收方式是标记清除. 工作原理 当变量进入环境时,将这个变量标记为"进入 ...

  9. 垃圾回收机制GC知识再总结兼谈如何用好GC(其他信息: 内存不足)

    来源 图像操作,易内存泄露,边界像素 一.为什么需要GC 应用程序对资源操作,通常简单分为以下几个步骤: 1.为对应的资源分配内存 2.初始化内存 3.使用资源 4.清理资源 5.释放内存 应用程序对 ...

随机推荐

  1. QT 文本html显示格式的问题,如在QTextBrowser.setText用tr(),其中为html格式

    QObject::tr("<h1><font color = green>%1</font>的人品指数:<font color = orange&g ...

  2. QT 利用QSplitter 分割区域, 并添加QScrollArea 滚动区域,滚动条

    1. QSplitter 分割区域, 可以分割区域中可以随意添加自己的布局 2. #include "dialog.h" #include <QApplication> ...

  3. java多线程模拟停车位问题

    /** * */ package Synchronized; /** * @author libin * */ public class CarTest { public static void ma ...

  4. tyvj 1057 金明的预算方案 背包dp

    P1057 金明的预算方案 时间: 1000ms / 空间: 131072KiB / Java类名: Main 背景 NOIP2006 提高组 第二道 描述 金明今天很开心,家里购置的新房就要领钥匙了 ...

  5. spring boot: 计划任务@ EnableScheduling和@Scheduled

    spring boot: 计划任务@ EnableScheduling和@Scheduled @Scheduled中的参数说明 @Scheduled(fixedRate=2000):上一次开始执行时间 ...

  6. [Alfred]为Baidu Weather Workflow更新图标

    Alfred workflow:百度天气,修改更新图标显示: 下载:https://github.com/BobSte/weather-workflow 原始代码是php脚本,为其增加了一个取图片的函 ...

  7. spring boot + thymeleaf 报错 org.thymeleaf.exceptions.TemplateInputException

    org.thymeleaf.exceptions.TemplateInputException: Error resolving template "admin/verifyPassword ...

  8. 继续吐槽XE5中的boost::thread问题:找不到CC32130MT.DLL

    在XE5中,随便创建一个HelloWorld程序,加入boost::thread的功能,编译链接后,无法运行,无法调试,提示找不到CC32130MT.DLL 这个DLL名字看上去好像是跟多线程有关的, ...

  9. 格式化SQL和逆格式SQL

    上篇说过SQLyog中的计算合适数据类型的功能,现在说下Navicat格式化SQL和逆格式化SQL 啥也不说了,一看图,一目了然,Beautify SQL(格式化,即变成最美的语句)和Minify S ...

  10. 15 Python 迭代器和生成器

    什么是迭代 (iterable) 字符串.列表.元组.字典.集合都可以被for循环,说明他们都是可迭代的. 可以直接作用于for循环的对象统称为可迭代对象(Iterable). 可以被next()函数 ...