[PHP源码阅读]empty和isset函数
近日被问到PHP中empty和isset函数时怎么判断变量的,刚开始我是一脸懵逼的,因为我自己也只是一知半解,为了弄懂其真正的原理,赶紧翻开源码研究研究。经过分析可发现两个函数调用的都是同一个函数,因此本文将对两个函数一起分析。
我在github有对PHP源码更详细的注解。感兴趣的可以围观一下,给个star。PHP5.4源码注解。可以通过commit记录查看已添加的注解。
函数使用格式
empty
bool empty ( mixed $var )
判断变量是否为空。
isset
bool isset ( mixed $var [ , mixed $... ] )
判断变量是否被设置且不为NULL。
参数说明
对于empty,在PHP5.5版本以前,empty只支持变量参数,其他类型的参数会导致解析错误,比如函数调用的结果不能作为参数。
对于isset,如果变量被如unset的函数设为NULL,则函数会返回false。如果多个参数被传递到isset函数,那么只有所有参数都被设置isset函数才会返回true。从左到右计算,一旦遇到没被设置的变量就停止。
运行示例
$result = empty(0); // true $result = empty(null); // true$result = empty(false); // true $result = empty(array()); // true $result = empty('0'); // true $result = empty(1); // false $result = empty(callback function); // 报错 $a = null;$result = isset($a); // false; $a = 1;$result = isset($a); // true; $a = 1;$b = 2;$c = 3;$result = isset($a, $b, $c); // true
$a = 1;$b = null;$c = 3;$result = isset($a, $b, $c); // false
找到函数的定义位置
实际上,empty不是一个函数,而是一个语言结构。语言结构是在PHP程序运行前编译好的,因此不能像之前那样简单地搜索"PHP_FUNCTION empty"或"ZEND_FUNCTION empty"查看其源码。要想看empty等语言结构的源码,先要理解PHP代码执行的机制。
PHP执行代码会经过4个步骤,其流程图如下所示:
在第一个阶段,即Scanning阶段,程序会扫描zend_language_scanner.l文件将代码文件转换成语言片段。对于isset和empty函数来说,在zend_language_scanner.l文件中搜索empty和isset可以得到函数在此文件中的宏定义如下:
<ST_IN_SCRIPTING>"isset" { return T_ISSET; } <ST_IN_SCRIPTING>"empty" { return T_EMPTY; }
接下来就到了Parsing阶段,这个阶段,程序将T_ISSET和T_EMPTY等Tokens转换成有意义的表达式,此时会做语法分析,Tokens的yacc保存在zend_language_parser.y文件中,可以找到T_ISSET和T_EMPTY的定义:
internal_functions_in_yacc: T_ISSET ; } | T_EMPTY TSRMLS_CC); } | T_INCLUDE expr { zend_do_include_or_eval(ZEND_INCLUDE, &$$, &$ TSRMLS_CC); } | T_INCLUDE_ONCE expr { zend_do_include_or_eval(ZEND_INCLUDE_ONCE, &$$, &$ TSRMLS_CC); } | T_EVAL TSRMLS_CC); } | T_REQUIRE expr { zend_do_include_or_eval(ZEND_REQUIRE, &$$, &$ TSRMLS_CC); } | T_REQUIRE_ONCE expr { zend_do_include_or_eval(ZEND_REQUIRE_ONCE, &$$, &$ TSRMLS_CC); } ;
isset和empty函数最终都执行了zend_do_isset_or_isempty函数,继续查找
grep -rn "zend_do_isset_or_isempty"
可以发现,此函数在zend_compile.c文件中定义。
函数执行步骤
1、解析参数
2、检查是否为可写变量
3、如果是变量的op_type是IS_CV(编译时期的变量),则设置其opcode为ZEND_ISSET_ISEMPTY_VAR;否则从active_op_array中获取下一个op值,根据其op值设置last_op的opcode。
4、设置了opcode之后,之后会交给zend_excute执行。
源码解读
IS_CV是编译器使用的一种cache机制,这种变量保存着它被引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后这个变量的引用就不需要再去查找active符号表了。
对于empty函数,到了opcode的步骤后,参阅opcode处理函数,可以知道,isset和empty在excute的时候执行的是ZEND_ISSET_ISEMPTY_VAR等一系列函数,以ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER为例,找到这个函数的定义在zend_vm_execute.h。查看函数可以知道,empty函数的最终执行函数是i_zend_is_true(),而i_zend_is_true函数定义在zend_execute.h。i_zend_is_true函数的核心代码如下:
switch (Z_TYPE_P(op)) { case IS_NULL: result = ; break; case IS_LONG: case IS_BOOL: case IS_RESOURCE: // empty参数为整数时非0的话就为false result = (Z_LVAL_P(op)?:); break; case IS_DOUBLE: result = (Z_DVAL_P(op) ? : ); break; case IS_STRING: || (Z_STRLEN_P(op)== && Z_STRVAL_P(op)[]==')) { // empty("0") == true result = ; } else { result = ; } break; case IS_ARRAY: // empty(array) 是根据数组的数量来判断 result = (zend_hash_num_elements(Z_ARRVAL_P(op))?:); break; case IS_OBJECT: if(IS_ZEND_STD_OBJECT(*op)) { TSRMLS_FETCH(); if (Z_OBJ_HT_P(op)->cast_object) { zval tmp; if (Z_OBJ_HT_P(op)->cast_object(op, &tmp, IS_BOOL TSRMLS_CC) == SUCCESS) { result = Z_LVAL(tmp); break; } } else if (Z_OBJ_HT_P(op)->get) { zval *tmp = Z_OBJ_HT_P(op)->get(op TSRMLS_CC); if(Z_TYPE_P(tmp) != IS_OBJECT) { /* for safety - avoid loop */ convert_to_boolean(tmp); result = Z_LVAL_P(tmp); zval_ptr_dtor(&tmp); break; } } } result = ; break; default: result = ; break; }
这段代码比较直观,函数没有对检测值做任何的转换,通过这段代码来进一步分析示例中的empty函数做分析:
empty(null),到IS_NULL分支,result=0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(false),到IS_BOOL分支,result = ZLVAL_P(false) = 0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(array()),到IS_ARRAY分支,result = zend_hash_num_elements(Z_ARRVAL_P(op)) ? 1 : 0),zend_hash_num_elements返回数组元素的数量,array为空,因此result为0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty('0'),到IS_STRING分支,因为Z_STRLENP(op) == 1 且 Z_STRVAL_P(op)[0] == '0',因此result为0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(1),到IS_LONG分支,result = Z_LVAL_P(op) = 1,i_zend_is_true == 1,!i_zend_is_true() == 0,因此返回false。
对于isset函数,最终实现判断的代码是:
if (isset && Z_TYPE_PP(value) != IS_NULL) { ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1); } else { ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0); }
只要value被设置了且不为NULL,isset函数就返回true。
小结
这次阅读这两个函数的源码,学习到了:
1、PHP代码在编译期间的执行步骤
2、如何查找PHP语言结构的源码位置
3、如何查找opcode处理函数的具体函数
学无止境,每个人都有自己的短板,只有通过不断学习才能将自己的短板补上。
原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。
如果本文对你有帮助,请点下推荐吧,谢谢^_^
最后再安利一下,我在github有对PHP源码更详细的注解。感兴趣的可以围观一下,给个star。PHP5.4源码注解。可以通过commit记录查看已添加的注解。
参考文章
opcode处理函数查找:http://www.laruence.com/2008/06/18/221.html
PHPopcode深入理解及PHP代码执行步骤:http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler
更多源码文章,欢迎访问个人主页继续查看:hoohack
[PHP源码阅读]empty和isset函数的更多相关文章
- CI框架源码阅读笔记3 全局函数Common.php
从本篇开始,将深入CI框架的内部,一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说,全局函数具有最高的加载优先权,因此大多数的框架中BootStrap ...
- [PHP源码阅读]explode和implode函数
explode和implode函数主要用作字符串和数组间转换的操作,比如获取一段参数后根据某个字符分割字符串,或者将一个数组的结果使用一个字符合并成一个字符串输出.在PHP中经常会用到这两个函数,因此 ...
- [PHP源码阅读]array_pop和array_shift函数
上篇文章介绍了PHP添加元素到数组的函数,那么当然有从数组中删除元素.array_pop和array_shift只从数组的头或尾删除一个元素.经过阅读源码,发现这两个函数的实现都是调用了同一个函数-- ...
- [PHP源码阅读]array_push和array_unshift函数
在PHP中,在数组中添加元素也是一种很常用的操作,分别有在数组尾部和头部添加元素,看看PHP内部是如何实现数组插入的操作. 我在github有对PHP源码更详细的注解.感兴趣的可以围观一下,给个sta ...
- PHP源码阅读(一):str_split函数
注:源码版本:php5.6.33. 函数简介 str_split 原型: array str_split ( string $string [, int $split_length = 1 ] ) 说 ...
- [PHP源码阅读]array_slice和array_splice函数
array_slice和array_splice函数是用在取出数组的一段切片,array_splice还有用新的切片替换原删除切片位置的功能.类似javascript中的Array.prototype ...
- [PHP源码阅读]strtolower和strtoupper函数
字符串的操作函数中,字符串的大小写转换也算是比较常用的函数,其底层实现也比较简单,下面来一探究竟. 我在github上有对PHP源码更详细的注解.感兴趣的可以围观一下,给个star.PHP5.4源码注 ...
- ONNX Runtime 源码阅读:Graph::SetGraphInputsOutputs() 函数
目录 前言 正文 总结 前言 为了深入理解ONNX Runtime的底层机制,本文将对 Graph::SetGraphInputsOutputs() 的代码逐行分析. 正文 首先判断Graph是否从O ...
- CI框架源码阅读笔记4 引导文件CodeIgniter.php
到了这里,终于进入CI框架的核心了.既然是“引导”文件,那么就是对用户的请求.参数等做相应的导向,让用户请求和数据流按照正确的线路各就各位.例如,用户的请求url: http://you.host.c ...
随机推荐
- .NET Core 首例 Office 开源跨平台组件(NPOI Core)
前言 最近项目中,需要使用到 Excel 导出,找了一圈发现没有适用于 .NET Core的,不依赖Office和操作系统限制的 Office 组件,于是萌生了把 NPOI 适配并移植到 .NET C ...
- Logstash实践: 分布式系统的日志监控
文/赵杰 2015.11.04 1. 前言 服务端日志你有多重视? 我们没有日志 有日志,但基本不去控制需要输出的内容 经常微调日志,只输出我们想看和有用的 经常监控日志,一方面帮助日志微调,一方面及 ...
- 非关系型数据库(NoSql)
最近了解了一点非关系型数据库,刚刚接触,觉得这是一个很好的方向,对于大数据 方面的处理,非关系型数据库能起到至关重要的地位.这里我主要是整理了一些前辈的经验,仅供参考. 关系型数据库的特点 1.关系型 ...
- enote笔记法使用范例(2)——指针(1)智能指针
要知道什么是智能指针,首先了解什么称为 “资源分配即初始化” what RAII:RAII—Resource Acquisition Is Initialization,即“资源分配即初始化” 在&l ...
- Jqprint实现页面打印
好些项目需要实现页面打印,特别是一些后台管理类系统,下面介绍一款轻量级的打印插件: 1.实现页面打印要引入jQuery和Jqprint.点击下载Jqprint插件 <script languag ...
- CSS常见技巧
一.CSS Sprite(雪碧图|精灵图)指什么? 有什么作用? CSS雪碧 即CSS Sprite,也有人叫它CSS精灵,是一种CSS图像合并技术,该方法是将小图像和背景图片合并到一张图片上,然后利 ...
- ORA-00821: Specified value of sga_target 3072M is too small, needs to be at least 12896M
在测试PlateSpine克隆的数据库服务器时,由于资源有限,克隆过来的数据库服务器只给了9G的内存,结果在测试时,老是会出现OOMkiller导致宕机,即out of memory killer,是 ...
- win7,Mindmanager2012使用模板时弹出Runtime error R6025解决方法
Mindjet.MindManager2012.v10.0在应用个别模板时提示"参数错误",然后自动关闭. 解决办法: 如果是win7系统,可以进入C:\Users\(用户名)\A ...
- 如玫瑰一般的PHP与C#混合编程
故事背景是这样的,有一套项目,服务器端是用C#写的,为了完成某种事情,它需要使用到一个组件,这个组件很小但很重要,很不巧的是,这个这个组件是用PHP语言写的,如果为了使用这个组件而专门搭建一个PHP的 ...
- HTPC家庭娱乐和XBOX未来发展畅想<另:创业工作机会>
微软中国在上海举办新闻发布会,正式宣布Xbox One将于9月23日在中国开始销售,定价3699元起.这款早在2001年就发布的电视游戏机终于在经历了14年的等待后,进军中国大陆市场.此次Xbox O ...