您的位置:首页 > 运维架构

底层存储变量的写时复制机制(copy on write)

2016-12-26 12:16 573 查看
首先我们回顾一下zval的结构:

struct _zval_struct {
/* Variable information */
zvalue_value value;             /* value */
zend_uint refcount;
zend_uchar type;        /* active type */
zend_uchar is_ref;
};


其中的refcount和is_ref字段我们一直都没有介绍过,我们知道PHP是一个长时间运行的服务器端的脚本解释器。那么对于它来说,效率和资源占用率是一个很重要的衡量标准,也就是说,PHP必须尽量减少内存占用率,考虑下面这段代码:

<?php
$var = "laruence";
$var_dup = $var;
unset($var);
?>


第一行代码创建了一个字符串变量,申请了一个大小为9字节的内存,保存了字符串”laruence”和一个NULL(\0)的结尾。

第二行定义了一个新的字符串变量,并将变量var的值”复制”给这个新的变量。

第三行unset了变量var

对于上面的代码来说,我们完全可以让”var”和”var_dup”对应的指针都指向同一个zval就可以了。

这个时候就需要介绍我们之前一直没有介绍过的zval结构中的refcount字段了。

refcount,顾名思义,记录了当前的zval被引用的计数。

比如对于代码:

<?php
$var = 1;
$var_dup = $var;
?>


第一行,创建了一个整形变量,变量值是1。 此时保存整形1的这个zval的refcount为1。

第二行,创建了一个新的整形变量,变量也指向刚才创建的zval,并将这个zval的refcount加1,此时这个zval的refcount为2。

PHP提供了一个函数可以帮助我们了解这个过程debug_zval_dump:

<?php
$var = 1;
debug_zval_dump($var);
$var_dup = $var;
debug_zval_dump($var);
?>
输出:
long(1) refcount(2)
long(1) refcount(3)


如果你奇怪 ,var的refcount应该是1啊?

我们知道,对于简单变量,PHP是以传值的形式穿参数的。也就是说,当执行debug_zval_dump(var)的时候,var会以传值的方式传递给debug_zval_dump,也就是会导致var的refcount加1,所以我们只要能看到,当变量赋值给一个变量以后,能导致zval的refcount加1这个事实即可。

现在我们回头看文章开头的代码, 当执行了最后一行unset($var)以后,会发生什么呢? 对,既是refcount减1,上代码:

<?php
$var = "laruence";
$var_dup = $var;
unset($var);
debug_zval_dump($var_dup);
?>
输出:

string(8) "laruence" refcount(2)
但是,对于下面的代码呢?

<?php
$var = "laruence";
$var_dup = $var;
$var = 1;
?>


很明显在这段代码执行以后,$var_dup的值应该还是”laruence”, 那么这又是怎么实现的呢?

这就是PHP的copy on write机制:

PHP在修改一个变量以前,会首先查看这个变量的refcount,如果refcount大于1,PHP就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP发现var指向的zval的refcount大于1,那么PHP就会复制一个新的zval出来,将原zval的refcount减1,并修改symboltable,使得var和$var_dup分离(Separation)。这个机制就是所谓的copy on write(写时复制)。

上代码测试:

<?php
$var = "laruence";
$var_dup = $var;
$var = 1;
debug_zval_dump($var);
debug_zval_dump($var_dup);
?>
输出:

long(1) refcount(2)
string(8) "laruence" refcount(2)


debug_zval_dump $val为实参,对于refcount个数会增加,当调用完后对于refcount个数会相应-1.

现在我们知道,当使用变量复制的时候 ,PHP内部并不是真正的复制,而是采用指向相同的结构来尽量节约开销。那么,对于PHP中的引用,那又是如何实现呢?

<?php
$var = "laruence";
$var_ref = &$var;
$var_ref = 1;
?>


这段代码结束以后,
$var也会被间接的修改为1,这个过程称作(change on write:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?
这个时候就要用到zval中的is_ref字段了:
对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为1,并且同时置is_ref为1。
到第三行的时候,PHP先检查var_ref代表的zval的is_ref字段,如果为1,则不分离,大体逻辑示意如下:
if((*val)->is_ref || (*val)->refcount<2){
//不执行Separation
... ;//process
}


但是,问题又来了,对于如下的代码,又会怎样呢?

<?php
$var = "laruence";
$var_dup = $var;
$var_ref = &$var;
?>


对于上面的代码,存在一对copy on write的变量var和var_dup, 又有一对change on write机制的变量对var和var_ref,这个情况又是如何运作的呢?

当第二行执行的时候,和前面讲过的一样,vardup和var 指向相同的zval, refcount为2.

当执行第三行的时候,PHP发现要操作的zval的refcount大于1,则,PHP会执行Separation, 将vardup分离出去,并将var和$var_ref做change on write关联。也就是,refcount=2, is_ref=1;

基于这样的分析,我们就可以让debug_zval_dump出refcount为1的结果来:

<?php
$var = "laruence";
$var_dup = &$var;
debug_zval_dump($var);
?>
输出:

string(8) "laruence" refcount(1)


详细原因,读者你只要稍加分析就能得出,我就不越俎代庖了。;)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息