php的垃圾回收机制主要参考了http://blog.csdn.net/phpkernel/article/details/5734743 这文章。

变量对应的值,比如 $a="abc"  abc在内核是以一个zval 的形式存在的,下面列出其zval 的定义

287 typedef struct _zval_struct zval;

307 typedef union _zvalue_value {
308 long lval; /* long value */
309 double dval; /* double value */
310 struct {
311 char *val;
312 int len;
313 } str;
314 HashTable *ht; /* hash table value */
315 zend_object_value obj;
316 } zvalue_value;

318 struct _zval_struct {
319 /* Variable information */
320 zvalue_value value; /* value */
321 zend_uint refcount__gc;
322 zend_uchar type; /* active type */
323 zend_uchar is_ref__gc;
324 };

变量$a本身也要开辟一段内存,在另外一篇文章里会讲到 变量的内存分配,这里先略过

$a="abc";

内核使用宏ALLOC_ZVAL和 INIT_ZVAL 对abc 分配一段内存,并进行初始化

因为有引号的出现,所以php内核会认为这是一个字符串,于是 zval.type=IS_STRING , zval.str.val="abc", zval.str.len=3, zval.refcount_gc=1 ,zval.is_ref_gc=0

$b=$a; 那么php内核不会为 $b再分配一段内存,避免了内存浪费,而是将$b指向了 "abc"  这个zval ,  也就是说在变量符号表(HashTable实现)中 key为b的,value 为 "abc"所在的 zval的指针,即内存地址 这里:"abc" 的 refcont_gc=2, is_ref_gc=0

$b=2; 这个时候,$b发生了变化,那么不至于影响到 $a的使用, 内核会把 "abc"所在的zval 的 refcount_gc -1, (abc的refcount_gc=1,is_ref=0 )再把abc对应的zval 复制一份,并在变量符号表中更新key为b 的value值,也就是常说的 COPY ON WRITE(写时复制)  2的refcount_gc=1 , is_ref_gc=0

$a=&$b; $a会直接指i向$b对应的zval,  值为2 的 refcount=2 , is_ref=1

unset($a); 值为2的 refcount=1 ,is_ref=1 注:unset,把变量$a本身 从符号表中删除,同时refcount_gc-1,如果减后的refcount_gc为0,则进行收回内存

如果 是 数组,或者对象可能就会出问题

$a=array(1); $a对应的zval : refcount_gc=1, is_ref=0 , $a[0]对应的zval: refcount_gc=1,is_ref=0

$a[]=&$a;   $a对应的zval : refcount_gc=2 ,is_ref=1 , $a[1] 对应的zval: refcount_gc=2, is_ref=1

unset($a);  符号表中的key='a'的变量删除了,php内核尝试将$a对应的zval:refcount_gc-1, refcount_gc结果为1,不等于0,内核则无法回收内存,这时发生了内存泄漏 (其实最终也回收了内存 ,当请求结束时,内核会回收所的内存,但是当php以daemon形式除外)

下面,php新的垃圾回收机制出场了

先看下php5.2为zval分配内存的方式

内核使用宏:MAKE_STD_ZVAL(z),该宏又包含两个宏ALLOC_ZVAL(z)和INIT_PZVAL(z)

宏ALLOC_ZVAL(z)展开后为

(z)=(zval *)emalloc(sizeof(zval)); //位于zend_alloc.h

宏INIT_PZVAL(z)展开为后://位于zend.h

(z)->refcount_gc=1;

(z)->is_ref_gc=0;

现在php5.3是用下面的方法

#undef ALLOC_ZVAL

#define ALLOC_ZVAL(z)

do{\

(z)=(zval *)emalloc(sizeof(zval_gc_info))\

GC_ZVAL_INIT(z)\

} while(0)

其中zval_gc_info是个结构体

#typedef _zval_gc_info{

  zval z;

  union{

    gc_root_buffer *buffer;

    struct _zval_gc_info *next;

  }u;

}zval_gc_info;

gc_root_buffet 也是个结构体

#typedef _gc_root_buffer{

  struct _gc_root_buffet *next;

  struct _gc_root_buffet *prev;

  union{

    zval  *pz;

  }u;

}gc_root_buffer;

还是以这个为例

$a=array(1);

$a[]=&$a;

unset($a);

php 5.3垃圾处理原理是:
1)当调用unset后,将 $a对应的zval的refcount_gc减1,这时,refcount_gc=1

2)因为1>0,zval还不能被释放 ,因为没有变量要使用zva了,unset($a),变量$a已经为空, 所以是垃圾数据,设置zval.u.buffer 这个指针的为紫色,放入一个缓冲区)

2.1)若refcount_gc=0,说明没有别的变量在使用了,可以释放了

3)当缓冲区满的时候,开始在缓冲区中遍历,将结点对应的zval的refcount_gc减1,如果节点对应的zvzl中包括的zval又指向了前面的zval(环形引用),也要refcount-1,即将zval的每一个元素都将refcount_gc减1 ,为避免重复操作,减后,将颜色置为灰色

4)再次遍历缓冲区,如果refcount_gc的值不为0,说明不是垃圾,垃圾被其他变量使用,因为将颜色为黑色,

5)如果refcount=0,说明是垃圾,设置颜色为白色,将回收内存

当缓冲区满了以后,才进行垃圾回收,因为垃圾回收也是消耗资源的,这跟生活中的垃圾箱一样,只有当垃圾箱满了以后,清洁工才过来清理垃圾。

当调用unset($a)后,内核会调用下面的方法

static zend_always_inline void i_zval_ptr_dtor(zval *zval_ptr ZEND_FILE_LINE_DC)
{
  if (!Z_DELREF_P(zval_ptr)) {
    TSRMLS_FETCH();

    ZEND_ASSERT(zval_ptr != &EG(uninitialized_zval));
    GC_REMOVE_ZVAL_FROM_BUFFER(zval_ptr);
    zval_dtor(zval_ptr);
    efree_rel(zval_ptr);
} else {
    TSRMLS_FETCH();

    if (Z_REFCOUNT_P(zval_ptr) == 1) {
    Z_UNSET_ISREF_P(zval_ptr);
  }  

  GC_ZVAL_CHECK_POSSIBLE_ROOT(zval_ptr);
}
}

static zend_always_inline void _zval_dtor(zval *zvalue ZEND_FILE_LINE_DC)
{
if (zvalue->type <= IS_BOOL) {
return;
}
_zval_dtor_func(zvalue ZEND_FILE_LINE_RELAY_CC);
}

zend_variables.c

ZEND_API void _zval_dtor_func(zval *zvalue ZEND_FILE_LINE_DC)
{
switch (Z_TYPE_P(zvalue) & IS_CONSTANT_TYPE_MASK) {
case IS_STRING:
case IS_CONSTANT:
CHECK_ZVAL_STRING_REL(zvalue);
STR_FREE_REL(zvalue->value.str.val);
break;
case IS_ARRAY:
case IS_CONSTANT_ARRAY: {
TSRMLS_FETCH();

if (zvalue->value.ht && (zvalue->value.ht != &EG(symbol_table))) {
/* break possible cycles */
Z_TYPE_P(zvalue) = IS_NULL;
zend_hash_destroy(zvalue->value.ht);
FREE_HASHTABLE(zvalue->value.ht);
}
}
break;
case IS_OBJECT:
{
TSRMLS_FETCH();

Z_OBJ_HT_P(zvalue)->del_ref(zvalue TSRMLS_CC);
}
break;
case IS_RESOURCE:
{
TSRMLS_FETCH();

/* destroy resource */
zend_list_delete(zvalue->value.lval);
}
break;
case IS_LONG:
case IS_DOUBLE:
case IS_BOOL:
case IS_NULL:
default:
return;
break;
}
}

2428 ZEND_API void _efree(void *ptr ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC)
2429 {
2430 TSRMLS_FETCH();
2431
2432 if (UNEXPECTED(!AG(mm_heap)->use_zend_alloc)) {
2433 AG(mm_heap)->_free(ptr);
2434 return;
2435 }
2436 _zend_mm_free_int(AG(mm_heap), ptr ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC);
2437 }

2428 ZEND_API void _efree(void *ptr ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC)
2429 {
2430 TSRMLS_FETCH();
2431
2432 if (UNEXPECTED(!AG(mm_heap)->use_zend_alloc)) {
2433 AG(mm_heap)->_free(ptr);
2434 return;
2435 }
2436 _zend_mm_free_int(AG(mm_heap), ptr ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC);
2437 }

zend_alloc.c

php5.3新垃圾回收机制详解的更多相关文章

  1. PHP的垃圾回收机制详解

    原文:PHP的垃圾回收机制详解 最近由于使用php编写了一个脚本,模拟实现了一个守护进程,因此需要深入理解php中的垃圾回收机制.本文参考了PHP手册. 在理解PHP垃圾回收机制(GC)之前,先了解一 ...

  2. JVM的垃圾回收机制详解和调优

    JVM的垃圾回收机制详解和调优 gc即垃圾收集机制是指jvm用于释放那些不再使用的对象所占用的内存.java语言并不要求jvm有gc,也没有规定gc如何工作.不过常用的jvm都有gc,而且大多数gc都 ...

  3. java面试题之----JVM架构和GC垃圾回收机制详解

    JVM架构和GC垃圾回收机制详解 jvm,jre,jdk三者之间的关系 JRE (Java Run Environment):JRE包含了java底层的类库,该类库是由c/c++编写实现的 JDK ( ...

  4. GC垃圾回收机制详解

    JVM堆相关知识    为什么先说JVM堆?  JVM的堆是Java对象的活动空间,程序中的类的对象从中分配空间,其存储着正在运行着的应用程序用到的所有对象.这些对象的建立方式就是那些new一类的操作 ...

  5. PHP 垃圾回收机制详解

    前言:之前对PHP的GC只是了解了个大概,这次详细了解下PHP的垃圾回收机制(GC). 介于网上大部分都是PHP5.X的GC,虽然 php5 到 php7 GC部分做出的改动较小,但我觉得还是一起写下 ...

  6. Python垃圾回收机制详解

    一.垃圾回收机制 Python中的垃圾回收是以引用计数为主,分代收集为辅.引用计数的缺陷是循环引用的问题. 在Python中,如果一个对象的引用数为0,Python虚拟机就会回收这个对象的内存. #e ...

  7. JVM的内存区域划分以及垃圾回收机制详解

    在我们写Java代码时,大部分情况下是不用关心你New的对象是否被释放掉,或者什么时候被释放掉.因为JVM中有垃圾自动回收机制.在之前的博客中我们聊过Objective-C中的MRC(手动引用计数)以 ...

  8. Python垃圾回收机制详解转自--Kevin Lu

    一.垃圾回收机制 Python中的垃圾回收是以引用计数为主,分代收集为辅.引用计数的缺陷是循环引用的问题. 在Python中,如果一个对象的引用数为0,Python虚拟机就会回收这个对象的内存. #e ...

  9. Java垃圾回收机制详解和调优

    gc即垃圾收集机制是指jvm用于释放那些不再使用的对象所占用的内存.java语言并不要求jvm有gc,也没有规定gc如何工作.不过常用的jvm都有gc,而且大多数gc都使用类似的算法管理内存和执行收集 ...

随机推荐

  1. Linux网桥模式配置

    Linux网关模式下将有线LAN和无线LAN共享网段实现局域网内互联: 思路其实很简单:就是将虚拟出一个bridge口,将对应的有线LAN和无线LAN都绑定在这个虚拟bridge口上,并给这个brid ...

  2. 鲍姆-韦尔奇算法求解HMM参数

    1. HMM模型参数求解概述 HMM模型参数求解根据已知的条件可以分为两种情况. 第一种情况较为简单,就是我们已知DD个长度为TT的观测序列和对应的隐藏状态序列,即{(O1,I1),(O2,I2),. ...

  3. 2019.01.08 bzoj4543: [POI2014]Hotel加强版(长链剖分+dp)

    传送门 代码: 长链剖分好题. 题意:给你一棵树,问树上选三个互不相同的节点,使得这个三个点两两之间距离相等的方案数. 思路: 先考虑dpdpdp. fi,jf_{i,j}fi,j​表示iii子树中离 ...

  4. 2018.12.15 spoj1812 Longest Common Substring(后缀自动机)

    传送门 后缀自动机模板题. 题意简述:求两个字串的最长公共子串长度. 对其中一个构建后缀自动机,用另外一个在上面跑即可. 代码: #include<bits/stdc++.h> #defi ...

  5. TCP/IP协议(5):传输层之TCP

    一.TCP报文 上图为TCP报文的格式,可以看到TCP头部占20个字节,其中红色圆圈中每一项占一位,表示TCP报文的类型,置1表示该项有效. SYN表示建立连接.    FIN表示关闭连接.    A ...

  6. jitter

    release jitter of tasks there is a distinction between the real activation request and the actual ac ...

  7. #微码分享#C++变参字符串格式化函数format_string

    在C和C++中,变参格式化函数虽然非类型安全,但却十分便利,因为得到广泛使用.对于常见的size_t类型要用“%zu”,ssize_t用”%zd“,int64_t用“% ”PRId64,uint64_ ...

  8. 批处理FINDSTR正则表达式用法实例分析

    1.findstr . 2.txt 或 Findstr "." 2.txt 从文件2.txt中查找任意字符,不包括空字符或空行 2.findstr .* 2.txt 或 finds ...

  9. LRU ,LRUW,CKPT-Q

    原文出处:http://www.itpub.net/thread-1631537-1-1.html    http://www.linuxidc.com/Linux/2012-07/66767.htm ...

  10. _编程语言_C++_setw()

    C++ 中使用setw(int n) 来控制输出间隔. 例如: cout<<)<<'a'<<endl;//s与a之间有7个空格,setw()只对后面紧跟的输出产生作 ...