深入理解 PHP7 中全新的 zval 容器和引用计数机制

最近在查阅 PHP7 垃圾回收的资料的时候,网上的一些代码示例在本地环境下运行时出现了不同的结果,使我一度非常迷惑。 仔细一想不难发现问题所在:这些文章大多是 PHP5.x 时代的,而 PHP7 发布后,采用了新的 zval 结构,相关的资料也比较贫瘠,所以我结合一些资料做了一个总结, 主要侧重于解释新 zval 容器中的引用计数机制 ,如有谬误,还望不吝指教。

PHP7 中新的 zval 结构

明人不说暗话,先看代码!

  1. struct _zval_struct{
  2. union {
  3. zend_long     lval;       /* long value */
  4. double      dval;       /* double value */
  5. zend_refcounted *counted;
  6. zend_string   *str;
  7. zend_array    *arr;
  8. zend_object   *obj;
  9. zend_resource  *res;
  10. zend_reference*ref;
  11. zend_ast_ref   *ast;
  12. zval       *zv;
  13. void       *ptr;
  14. zend_class_entry *ce;
  15. zend_function  *func;
  16. struct {
  17. uint32_t w1;
  18. uint32_t w2;
  19. } ww;
  20. } value;
  21. union {
  22. struct {
  23. ZEND_ENDIAN_LOHI_4(
  24. zend_uchar  type,     /* active type */
  25. zend_uchar  type_flags,
  26. zend_uchar  const_flags,
  27. zend_uchar  reserved)   /* call info for EX(This) */
  28. } v;
  29. uint32_t type_info;
  30. } u1;
  31. union {
  32. uint32_t   var_flags;
  33. uint32_t   next;         /* hash collision chain */
  34. uint32_t   cache_slot;      /* literal cache slot */
  35. uint32_t   lineno;        /* line number (for ast nodes) */
  36. uint32_t   num_args;       /* arguments number for EX(This) */
  37. uint32_t   fe_pos;        /* foreach position */
  38. uint32_t   fe_iter_idx;     /* foreach iterator index */
  39. } u2;
  40. };

对于该结构的详细描述可以参考文末鸟哥的文章,写的非常详细,我就不关公面前耍大刀了,这里我只提出几个比较关键的点:

  1. PHP7 中的变量分为 变量名 和 变量值 两部分,分别对应 zval_struct和在其中声明的 value
  2. zval_struct.value中的 zend_long 、 double 都是 简单数据类型 ,能够直接储存具体的值,而其他复杂数据类型储存一个指向其他数据结构的 指针
  3. PHP7 中,引用计数器储存在 value 中而不是 zval_struct
  4. NULL 、 布尔型 都属于 没有值 的数据类型(其中布尔型通过 IS_FALSE 和 IS_TRUE 两个常量来标记),自然也就没有引用计数
  5. 引用 (REFERENCE)变为了一种数据结构而不再只是一个标记位了,它的结构如下:
  1. struct _zend_reference{
  2. zend_refcounted_h gc;
  3. zval       val;
  4. }

6.

zend_reference作为 zval_struct中包含的一种 value 类型,也拥有自己的 val 值,这个值是指向一个 zval_struct.value的。他们都拥有自己的 引用计数器 。

引用计数器用来记录当前有多少 zval 指向同一个 zend_value 。

针对第六点,请看如下代码:

  1. $a = 'foo';
  2. $b = &$a;
  3. $c = $a;

此时的数据结构是这样的:

$a 与 $b 各拥有一个 zval_struct容器,并且其中的 value 都指向同一个

zend_reference结构, zend_reference内嵌一个 val 结构, 指向同一个 zend_string , 字符串的内容 就储存在其中。

而 $c 也拥有一个 zval_struct,而它的 value 在初始化的时候可以直接指向上面提到的 zend_string ,这样在拷贝时就不会产生复制。

下面我们就聊一聊在这种全新的 zval 结构中,会出现的种种现象,和这些现象背后的原因。

问题

一. 为什么某些变量的引用计数器的初始值为 0

现象

  1. $var_int = 233;
  2. $var_float = 233.3;
  3. $var_str = '233';
  4. xdebug_debug_zval('var_int');
  5. xdebug_debug_zval('var_float');
  6. xdebug_debug_zval('var_str');
  7. /** 输出 **
  8. var_int:
  9. (refcount=0, is_ref=0)int 233
  10. var_float:
  11. (refcount=0, is_ref=0)float 233.3
  12. var_str:
  13. (refcount=0, is_ref=0)string '233' (length=3)
  14. **********/

原因

在 PHP7 中,为一个变量赋值的时候,包含了两部分操作:

  1. 为符号量(即变量名)申请一个 zval_struct结构
  2. 将变量的值储存到 zval_struct.value中 对于 zval 在 value 字段中能保存下的值,就不会在对他们进行引用计数, 而是在拷贝的时候直接赋值 ,这部分类型有:
  • IS_LONG
  • IS_DOUBLE

即我们在 PHP 中的 整形 与 浮点型 。

那么 var_str 的 refcount 为什么也是 0 呢?

这就牵扯到 PHP 中字符串的两种类型:

1.interned string 内部字符串(函数名、类名、变量名、静态字符串):

$str = '233';    // 静态字符串

2.普通字符串:

$str = '233' . time();

对于 内部字符串 而言,字符串的内容是唯一不变的,相当于 C 语言中定义在静态变量区的字符串, 他们的生存周期存在于整个请求期间,request 完成后会统一销毁释放 ,自然也就无需通过引用计数进行内存管理。

二. 为什么在对整形、浮点型和静态字符串型变量进行引用赋值时,计数器的值会直接变为2

现象

  1. $var_int_1 = 233;
  2. $var_int_2 = &var_int;
  3. xdebug_debug_zval('var_int_1');
  4. /** 输出 **
  5. var_int:
  6. (refcount=2, is_ref=1)int 233
  7. **********/

原因

回忆一下我们开头讲的 zval_struct中 value 的数据结构,当为一个变量赋 整形 、 浮点型 或 静态字符串 类型的值时,value 的数据类型为 zend_long 、 double 或 zend_string ,这时值是可以直接储存在 value 中的。而按值拷贝时,会开辟一个新的 zval_struct以同样的方式将值储存到相同数据类型的 value 中,所以 refcount 的值一直都会为 0。

但是当使用 & 操作符进行引用拷贝时,情况就不一样了:

  1. PHP 为 & 操作符操作的变量申请一个 zend_reference结构
  2. 将 zend_reference.value 指向原来的 zval_struct.value
  3. zval_struct.value的数据类型会被修改为 zend_refrence
  4. 将 zval_struct.value指向刚刚申请并初始化后的 zend_reference
  5. 为新变量申请 zval_struct结构,将他的 value 指向刚刚创建的 zend_reference

此时: var_int_2 都拥有一个 zval_struct结构体,并且他们的 zval_struct.value都指向了同一个 zend_reference结构,所以该结构的引用计数器的值为 2。

题外话:zend_reference又指向了一个整形或浮点型的 value,如果指向的 value 类型是 zend_string,那么该 value 引用计数器的值为 1。而 xdebug 出来的 refcount 显示的是 zend_reference的计数器值(即 2)

三. 为什么初始数组的引用计数器的值为 2

现象

  1. $var_empty_arr = [1, 2, '3'];
  2. xdebug_debug_zval('var_empty_arr');
  3. /** 输出 **
  4. var_arr:
  5. (refcount=3, is_ref=0)
  6. array (size=3)
  7. 0 => (refcount=0, is_ref=0)int 1
  8. 1 => (refcount=0, is_ref=0)int 2
  9. 2 => (refcount=1, is_ref=0)string '3' (length=1)
  10. **********/

原因

这牵扯到 PHP7 中的另一个概念,叫做 immutable array (不可变数组)。 关于 immutable array 的详细介绍我放到下篇文章中讲,这里我们只需要知道,这样定义的数组,叫做 不可变数组 。

For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.

不可变数组和我们上面讲到的 内部字符串 一样,都是 不使用引用计数 的,但是不同点是,内部字符串的计数值恒为 0,而不可变数组会使用一个 伪计数值 2。

参考文章:

深入理解 PHP7 中全新的 zval 容器和引用计数机制的更多相关文章

  1. 理解JavaScript中的事件路由冒泡过程及委托代理机制

    当我用纯CSS实现这个以后.我开始用JavaScript和样式类来完善功能. 然后,我有一些想法,我想使用Delegated Events (事件委托)但是我不想有任何依赖,插入任何库,包括jQuer ...

  2. 深入理解PHP7之zval

    PHP7已经发布, 如承诺, 我也要开始这个系列的文章的编写, 今天我想先和大家聊聊zval的变化. 在讲zval变化的之前我们先来看看zval在PHP5下面是什么样子 PHP5zval回顾在PHP5 ...

  3. 深入理解PHP中赋值与引用

    原文:深入理解PHP中赋值与引用 先看下面的问题: <?php $a = 10;//将常量值赋给变量,会为a分配内存空间 $b = $a;//变量赋值给变量,是不是copy了一份副本,b也分配了 ...

  4. iOS中引用计数内存管理机制分析

    在 iOS 中引用计数是内存的管理方式,虽然在 iOS5 版本中,已经支持了自动引用计数管理模式,但理解它的运行方式有助于我们了解程序的运行原理,有助于 debug 程序. 操作系统的内存管理分成堆和 ...

  5. 在page cache中的页,如果当时没有进程read或者write,引用计数到底该为多少

    在一次偶然的机会,在研究如何降低pagecache占用的过程中,走查了 invalidate_mapping_pages的代码: 通过调用 __pagevec_lookup 在radix树中收集一部分 ...

  6. Objective-C中的引用计数

    导言 Objective-C语言使用引用计数来管理内存,也就是说,每个对象都有个可以递增或递减的计数器.如果想使某个对象继续存活,那就递增其引用计数:用完了之后,就递减其计数.计数为0,就表示没人关注 ...

  7. 简单理解Struts2中拦截器与过滤器的区别及执行顺序

    简单理解Struts2中拦截器与过滤器的区别及执行顺序 当接收到一个httprequest , a) 当外部的httpservletrequest到来时 b) 初始到了servlet容器 传递给一个标 ...

  8. 深入理解CSS中的层叠上下文和层叠顺序(转)

    by zhangxinxu from http://www.zhangxinxu.com 本文地址:http://www.zhangxinxu.com/wordpress/?p=5115 零.世间的道 ...

  9. 深入理解css中的margin属性

    深入理解css中的margin属性 之前我一直认为margin属性是一个非常简单的属性,但是最近做项目时遇到了一些问题,才发现margin属性还是有一些“坑”的,下面我会介绍margin的基本知识以及 ...

随机推荐

  1. VMware vRealize Suite 8.3 发布 - 多云环境的云计算管理解决方案

    概述 VMware vRealize Suite 是一种多云环境的云计算管理解决方案,为 IT 组织提供了一个基于 DevOps 和 ML 原则的基础架构自动化.一致运维和监管的现代平台. vReal ...

  2. scrapy使用response.body时编码问题

    scrapy使用response.body时编码问题 摘要:scrapy使用response.body时编码问题.如果在使用responses.body获取数据时,需要将其编码转换成unicode,即 ...

  3. Xilinx FPGA全局介绍

    Xilinx FPGA全局介绍 现场可编程门阵列 (FPGA) 具有诸多特性,无论是单独使用,抑或采用多样化架构,皆可作为宝贵的计算资产:许多设计人员并不熟悉 FPGA,亦不清楚如何将这类器件整合到设 ...

  4. 模糊视频帧插值:CVPR2020论文点评

    模糊视频帧插值:CVPR2020论文点评 Blurry Video Frame Interpolation 论文链接:https://arxiv.org/pdf/2002.12259.pdf 摘要 现 ...

  5. AlexeyAB DarkNet YOLOv3框架解析与应用实践(二)

    AlexeyAB DarkNet YOLOv3框架解析与应用实践(二) 版本3有什么新功能? YOLOv3使用了一些技巧来改进训练和提高性能,包括:多尺度预测.更好的主干分类器等等.全部细节都在我们的 ...

  6. 72 个网络应用安全实操要点,全方位保护 Web 应用的安全

    原文地址:Web Application Security Checklist 原文作者:Teo Selenius(已授权) 译者 & 校正:HelloGitHub-小熊熊 & 卤蛋 ...

  7. 教你在Kubernetes中快速部署ES集群

    摘要:ES集群是进行大数据存储和分析,快速检索的利器,本文简述了ES的集群架构,并提供了在Kubernetes中快速部署ES集群的样例:对ES集群的监控运维工具进行了介绍,并提供了部分问题定位经验,最 ...

  8. python+selenium基础篇,切入切出frame

    1.首先制作一个html的文件,代码如下 <!DOCTYPE html> <html> <head> <title>Frame_test</tit ...

  9. 读HikariCP源码学Java(二)—— 因地制宜的改装版ArrayList:FastList

    前言 如前文所述,HikariCP为了提高性能不遗余力,其中一个比较特别的优化是它没有直接使用ArrayList,而是自己实现了FastList,因地制宜,让数组的读写性能都有了一定程度的提高. 构造 ...

  10. 【python学习小知识】求绝对值和numpy和tensor的相互转换

    一.python求绝对值的三种方法 1.条件判断 2.内置函数abs() 3.内置模块 math.fabs 1.条件判段,判断大于0还是小于0,小于0则输出相反数即可 # 法1:使用条件判断求绝对值 ...