您的位置:首页 > 编程语言 > PHP开发

php源码之路第四章第一节( 函数的内部结构)

2016-10-30 22:39 453 查看
函数是一种可以在任何被需要的时候执行的代码块。它不仅仅包括用户自定义的函数,还包括程序语言实现的库函数。

用户定义的函数
如下所示手册中的展示函数用途的伪代码


function foo($arg_1, $arg_2, ..., $arg_n) {
echo "Example function.\n";
return $retval;
}


任何有效的 PHP 代码都可以编写在函数内部,甚至包括其它函数和类定义。

内部函数

PHP 有很多标准的函数和结构。如我们常见的count、strpos、implode等函数,这些都是标准函数,它们都是由标准扩展提供的;如我们经常用到的isset、empty、eval等函数,这些结构被称之为语言结构。还有一些函数需要和特定的PHP扩展模块一起编译并开启,否则无法使用。也就是有些扩展是可选的。

标准函数的实现存放在ext/standard扩展目录中。

匿名函数

有时我们的一代代码并不需要为它指定一个名称,而只需要它完成特定的工作,匿名函数的作用是为了扩大函数的使用功能,在PHP 5.3以前,传递函数回调的方式,我们只有两种选择:

字符串的函数名

使用create_function创建的返回
在PHP5.3以后,我们多了一个选择--Closure。在实现上PHP 5.3中对匿名函数的支持,采用的是把要保持的外部变量,做为Closure对象的”Static属性”来实现的。

变量函数
PHP 支持变量函数的概念。这意味着如果一个变量名后有圆括号,PHP 将寻找与变量的值同名的函数,并且将尝试执行它。除此之外,这个可以被用于实现回调函数,函数表等。一个变量函数的简单例子:


$func = 'print_r';
$func('i am print_r function.');


变量函数不能用于语言结构(echo等)

下面我们将开始关注函数在PHP中具体实现,函数的内部结构,函数的调用,参数传递以及函数返回值等。

函数的内部结构

在PHP中,函数有自己的作用域,同时在其内部可以实现各种语句的执行,最后返回最终结果值。在PHP的源码中可以发现,Zend引擎将函数分为以下类型:


#define ZEND_INTERNAL_FUNCTION              1
#define ZEND_USER_FUNCTION                  2
#define ZEND_OVERLOADED_FUNCTION            3
#define ZEND_EVAL_CODE                      4
#define ZEND_OVERLOADED_FUNCTION_TEMPORARY  5


其中的ZEND_USER_FUNCTION是用户函数,ZEND_INTERNAL_FUNCTION是内置的函数。也就是说PHP将内置的函数和用户定义的函数分别保存。

1.用户函数(ZEND_USER_FUNCTION)
用户自定义函数是非常常用的函数种类,如下面的代码,定义了一个用户自定义的函数:


<?php

function tipi( $name ){
$return = "Hi! " . $name;
echo $return;
return $return;
}

?>


这个示例中,对自定义函数传入了一个参数,并将其与Hi! 一起输出并做为返回值返回。从这个例子可以看出函数的基本特点:运行时声明、可以传参数、有值返回。当然,有些函数只是进行一些操作,并不一定显式的有返回值,在PHP的实现中,即使没有显式的返回, Zend引擎也会“帮你“返回NULL。

ZE在执行过程中,会将运行时信息存储于_zend_execute_data中:


struct _zend_execute_data {
//...省略部分代码
zend_function_state function_state;
zend_function *fbc; /* Function Being Called */
//...省略部分代码
};


在程序初始化的过程中,function_state也会进行初始化,function_state由两个部分组成:


typedef struct _zend_function_state {
zend_function *function;
void **arguments;
} zend_function_state;


**arguments是一个指向函数参数的指针,而函数体本身则存储于*function中, *function是一个zend_function结构体,它最终存储了用户自定义函数的一切信息,它的具体结构是这样的:


typedef union _zend_function {
zend_uchar type;    /* 如用户自定义则为 #define ZEND_USER_FUNCTION 2
MUST be the first element of this struct! */

struct {
zend_uchar type;  /* never used */
char *function_name;    //函数名称
zend_class_entry *scope; //函数所在的类作用域
zend_uint fn_flags;     // 作为方法时的访问类型等,如ZEND_ACC_STATIC等
union _zend_function *prototype; //函数原型
zend_uint num_args;     //参数数目
zend_uint required_num_args; //需要的参数数目
zend_arg_info *arg_info;  //参数信息指针
zend_bool pass_rest_by_reference;
unsigned char return_reference;  //返回值
} common;

zend_op_array op_array;   //函数中的操作
zend_internal_function internal_function;
} zend_function;


zend_function的结构中的op_array存储了该函数中所有的操作,当函数被调用时,ZE就会将这个op_array中的opline一条条顺次执行,并将最后的返回值返回。从VLD扩展中查看的关于函数的信息可以看出,函数的定义和执行是分开的,一个函数可以作为一个独立的运行单元而存在。

2.内部函数(ZEND_INTERNAL_FUNCTION)

ZEND_INTERNAL_FUNCTION函数是由扩展、PHP内核、Zend引擎提供的内部函数,一般用“C/C++”编写,可以直接在用户脚本中调用的函数。如下为内部函数的结构:


typedef struct _zend_internal_function {
/* Common elements */
zend_uchar type;
char * function_name;
zend_class_entry *scope;
zend_uint fn_flags;
union _zend_function *prototype;
zend_uint num_args;
zend_uint required_num_args;
zend_arg_info *arg_info;
zend_bool pass_rest_by_reference;
unsigned char return_reference;
/* END of common elements */

void (*handler)(INTERNAL_FUNCTION_PARAMETERS);
struct _zend_module_entry *module;
} zend_internal_function;


最常见的操作是在模块初始化时,ZE会遍历每个载入的扩展模块,然后将模块中function_entry中指明的每一个函数(module->functions),创建一个zend_internal_function结构, 并将其type设置为ZEND_INTERNAL_FUNCTION,将这个结构填入全局的函数表(HashTable结构); 函数设置及注册过程见 Zend/zend_API.c文件中的 zend_register_functions函数。这个函数除了处理函数,也处理类的方法,包括那些魔术方法。

内部函数的结构与用户自定义的函数结构基本类似,有一些不同,

调用方法,handler字段. 如果是ZEND_INTERNAL_FUNCTION, 那么ZE就调用zend_execute_internal,通过zend_internal_function.handler来执行这个函数。而用户自定义的函数需要生成中间代码,然后通过中间代码映射到相对就把方法调用。
内置函数在结构中多了一个module字段,表示属于哪个模块。不同的扩展其模块不同。
type字段,在用户自定义的函数中,type字段几乎无用,而内置函数中的type字段作为几种内部函数的区分。

3.变量函数

PHP 支持变量函数的概念。这意味着如果一个变量名后有圆括号,PHP 将寻找与变量的值同名的函数,并且将尝试执行它。除此之外,这个可以被用于实现回调函数,函数表等。对比使用变量函数和内部函数的调用:

变量函数$func


    $func = 'print_r';
$func('i am print_r function.');


通过VLD来查看这段代码编译后的中间代码:




内部函数print_r


print_r('i am print_r function.');


通过VLD来查看这段代码编译后的中间代码:




对比发现,二者在调用的中间代码上存在一些区别。变量函数是DO_FCALL_BY_NAME,而内部函数是DO_FCALL。这在语法解析时就已经决定了,见Zend/zend_complie.c文件的zend_do_end_function_call函数中部分代码:


if (!is_method && !is_dynamic_fcall && function_name->op_type==IS_CONST) {
opline->opcode = ZEND_DO_FCALL;
opline->op1 = *function_name;
ZVAL_LONG(&opline->op2.u.constant, zend_hash_func(Z_STRVAL(function_name->u.constant), Z_STRLEN(function_name->u.constant) + 1));
} else {
opline->opcode = ZEND_DO_FCALL_BY_NAME;
SET_UNUSED(opline->op1);
}


如果不是方法,并且不是动态调用,并且函数名为字符串常量,则其生成的中间代码为ZEND_DO_FCALL。其它情况则为ZEND_DO_FCALL_BY_NAME。另外将变量函数作为回调函数,其处理过程在Zend/zend_complie.c文件的zend_do_pass_param函数中。最终会体现在中间代码执行过程中的 ZEND_SEND_VAL_SPEC_CONST_HANDLER 等函数中。

4.匿名函数
匿名函数是一类不需要指定表示符,而又可以被调用的函数或子例程,匿名函数可以方便的作为参数传递给其他函数。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  函数 php 源码