什么是opcode

opcode(operate code)是计算机指令中的一部分,用于指定要执行的操作,指令的格式和规范由处理器的指定规范指定

opcode是一种php脚本编译后的中间语言,就像java的ByteCode,或者.NET的MSL

为什么要使用opcode缓存

opcode cache的目的是避免重复编译,减少CPU和内存开销的。如果动态内容的性能瓶颈不在于CPU和内容,而在于IO操作,比如数据库查询带来的IO开销,这个时候opcode cache的性能提升是非常有局限的。无论如何既然opcode cache 可以降低cpu和内存的开销,这当然是好事了

目前PHP中常见的opcode cahce模块如下

  1. APC

  2. Optimizer+(目前已开源并与php5.5+集成了opcache)

  3. xcache

  4. eAccelerator

Opcode原理

例如有如下一段代码

<?php
echo 'Hello World';
$a = 1 + 1;
echo $a;
?>

php执行这段代码会经过如下4个步骤(准确的说,通过php的语言引擎Zend)

Scanning(Lexing)将php代码转化为语言片段(Tokens)
Parsing,将Tokens转化为简单而有意义的表达式
Complilation,将表达式编译成Opcode
Execution,顺序执行Opcode,每次一条,从而实现php脚本的功能

如下图

Lexing阶段

Lex 就是一个词法分析的依据表。Zend引擎会会对输入的php代码进行词法分析(切确的说是: Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件) ),从而得到一个一个的词,php中提供了一个函数:token_get_all可以将一段php代码解析成tokens

如果用这个函数分析上面的示例代码,结果如下:

Array
(
    [0] => Array
        (
            [0] => 374
            [1] => <?php
            [2] => 1
        )     [1] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [2] => Array
        (
            [0] => 317
            [1] => echo
            [2] => 1
        )     [3] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [4] => Array
        (
            [0] => 316
            [1] => "Hello World"
            [2] => 1
        )     [5] => ;
    [6] => Array
        (
            [0] => 310
            [1] => $a
            [2] => 1
        )     [7] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [8] => =
    [9] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [10] => Array
        (
            [0] => 306
            [1] => 1
            [2] => 1
        )     [11] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [12] => +
    [13] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [14] => Array
        (
            [0] => 306
            [1] => 1
            [2] => 1
        )     [15] => ;
    [16] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [17] => Array
        (
            [0] => 317
            [1] => echo
            [2] => 1
        )     [18] => Array
        (
            [0] => 377
            [1] =>
            [2] => 1
        )     [19] => Array
        (
            [0] => 310
            [1] => $a
            [2] => 1
        )     [20] => ;
    [21] => Array
        (
            [0] => 376
            [1] => ?>
            [2] => 1
        ) )

分析这个返回结果我们可以发现,源码中的字符串,字符,空格都会原样返回。每个源代码的字符都会出现在相应的顺序处。而其他的例如标签,操作符,语句 都被转化成一个包含;两部分的array:Token ID(也就是在Zend内部的该Token的对应码,比如T_ECHO,T_STRING)和 源码中原来的内容

Parsing阶段

Parsing阶段首先会丢弃Tokens array中的多余空格,然后将剩余的Tokens转换成一个一个简单的表达式

echo a contanst string
add two numbers together
store the result of the prior expression to a variable
echo a variable

Complilation阶段

Complilation阶段会把Tokens编译成一个个op_array,每个op_array包含如下5个部分

Opcode数字的标示,指明了每个op_array的操作类型,比如add,echo
结果  存放Opcode的结果
操作数1 给Opcode的操作数
操作数2
扩展值 1个整形用来区别被重载的操作符

比如我的php代码会被Parsing成:

ZEND_ECHO 'Hello World'
ZEND_ADD   ~0 1 1
ZEND_ASSIGN !0 ~0
ZEND_ECHI ~0

在上面的代码我们并没有看到 $a,去哪里了?

这个就要介绍操作数了,每个操作数都是由以下两个部分组成:

  1. op_type :为IS_CONST,IS_TMP_VAR,IS_VAR,IS_UNUESED or IS_CV

  2. u 一个联合体,根据op_type不同 分别用不同的类型保存这个操作数的值(const)或者左值(var)

而对于var来说,每个var也不一样

IS_TMP_VAR 顾名思义就是这是一个临时变量,保存一些op_array 的结果,以便接下来的op_array 使用,这种的操作数u保存着一个指向变量表的一个句柄(整数),这个操作数一般用~ 开头 ,比如 ~0 表示 变量表中0号的未知的临时变量

IS_VAR 这是我们一般意义上的变量,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被应用的变量地址,当一个变量第一次被应用的时候 ,就会被CV起来,以后对这个变量的引用就不需要再去查找active符号表了,CV变量已!开头表示

这么开来 我的$a 被优化成了!0了

Opcode Cache原理

通过上面的介绍,我们了解了opcode,关于opcode cache的原理图大致如下

我们可以看到除了 Lexing,Parsing,Complilation,Execution阶段 还多了一个阶段:检测文件是否有更新

如果没有更新直接获取缓存的opcode,直接进入Execution阶段然后返回结果

如果更新了就按照原来流程(加入一个环节:图中红色部分 缓存opcode)

原文地址:深入了解php opcode缓存原理
标签:php   opcache   opcode   apc   token_get_all   缓存

智能推荐

深入了解php opcode缓存原理的更多相关文章

  1. 【转载】深入理解PHP Opcode缓存原理

    转载地址:深入理解PHP Opcode缓存原理 什么是opcode缓存? 当解释器完成对脚本代码的分析后,便将它们生成可以直接运行的中间代码,也称为操作码(Operate Code,opcode).O ...

  2. 黄聪:深入理解PHP Opcode缓存原理

    什么是opcode缓存? 当解释器完成对脚本代码的分析后,便将它们生成可以直接运行的中间代码,也称为操作码(Operate Code,opcode).Opcode cache的目地是避免重复编译,减少 ...

  3. 深入理解PHP Opcode缓存原理

    什么是opcode缓存? 当解释器完成对脚本代码的分析后,便将它们生成可以直接运行的中间代码,也称为操作码(Operate Code,opcode).Opcode cache的目地是避免重复编译,减少 ...

  4. php的opcode缓存原理

    opcode是什么? 它是一种PHP脚本编译后的中间语言,类似java的字节码.   PHP代码执行(Zend引擎)的步骤如下: 1.Scanning(Lexing) ,将PHP代码转换为语言片段(T ...

  5. php opcode缓存

    本文移至:http://www.phpgay.com/Article/detail/classid/2/id/61.html 1.什么是opcode 解释器分析代码之后,生成可以直接运行的中间代码,就 ...

  6. PHP-深入理解Opcode缓存

    1.什么是opcode缓存? 当解释器完成对脚本代码的分析后,便将它们生成可以直接运行的中间代码,也称为操作码(Operate Code,opcode).Opcode cache的目地是避免重复编译, ...

  7. 浏览器HTTP缓存原理分析

    以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器资源的速度和资源有效性.最近仔细看了下http协议中和缓存相关的一些属性,总结一下. 浏览器缓存原理 ...

  8. ahjesus 前端缓存原理 转载

    LAMP缓存图 从图中我们可以看到网站缓存主要分为五部分 服务器缓存:主要是基于web反向代理的静态服务器nginx和squid,还有apache2的mod_proxy和mod_cache模 浏览器缓 ...

  9. Hibernate缓存原理与策略

    Hibernate缓存原理: 对于Hibernate这类ORM而言,缓存显的尤为重要,它是持久层性能提升的关键.简单来讲Hibernate就是对JDBC进行封装,以实现内部状态的管理,OR关系的映射等 ...

随机推荐

  1. nodeAPI--HTTP

    HTTP:   //超文本协议,是属于TCP上层的协议 http协议构建在请求和响应概念上,node.js中对应http.ServerRequest,http.ServerResponse; 当用户浏 ...

  2. js:数据结构笔记9--二叉树

    树:以分层的方式存储数据:节点:根节点,子节点,父节点,叶子节点(没有任何子节点的节点):层:根节点开始0层: 二叉树:每个节点子节点不超过两个:查找快(比链表),添加,删除快(比数组): BST:二 ...

  3. Xamarin Android提示找不到资源属性定义

    Xamarin Android提示找不到资源属性定义 错误信息:”Resource.Attribute”未包含”actonBarSize”的定义Xamarin Android经常会出现找不到资源属性的 ...

  4. 大牛之路II

    时间限制:500MS  内存限制:1000K 提交次数:138 通过次数:31 题型: 编程题   语言: C++;C Description 要成为ACM大牛,要掌握很多必需的知识点.某些知识点可以 ...

  5. HDU3657 Game(最小割)

    题目大概说,给一个n×m的格子,每个格子都有数字,选择一个格子就能加上格子数字的分数,有k个格子必须选择,如果两个相邻的格子都被选择了那分数要减去两个格子数字的与再乘2.问能取得的最大分数. 已经知道 ...

  6. FZU2215 Simple Polynomial Problem(中缀表达求值)

    比赛时没做出这题太可惜了. 赛后才反应过来这就是个中缀表达式求值,数字栈存的不是数字而是多项式. 而且,中缀表达式求值很水的,几行就可以搞定. #include<cstdio> #incl ...

  7. jsoncpp封装和解析字符串、数字、布尔值和数组

    使用jsoncpp进行字符串.数字.布尔值和数组的封装与解析. 1)下载jsoncpp的代码库 百度网盘地址 :http://pan.baidu.com/s/1ntqQhIT 2)解压缩文件 json ...

  8. C++ unordered_map remove 实现哈希表移除

    使用C++的unordered_map类型时,我们经常要根据关键字查找,并移除一组映射,在Java中直接用remove即可,而STL中居然没有实现remove这个函数,还要自己写循环来查找要删除项,然 ...

  9. ReLU

    预训练的用处:规则化,防止过拟合:压缩数据,去除冗余:强化特征,减小误差:加快收敛速度. 标准的sigmoid输出不具备稀疏性,需要用一些惩罚因子来训练出一大堆接近0的冗余数据来,从而产生稀疏数据,例 ...

  10. lucene索引日期和数字

    1.用途. 索引数字的场景主要有两种:一是把它们当作字符串一样处理,比如“要是搁以前,术士能暴击10000多,有木有!”中的"10000",它和其它的词没什么区别,你可以把它仅仅想 ...