PHP传参原理深入解析

在编写php扩展时，似乎参数（即传给zend_parse_parameters的变量）是不需要free的。举例：
php_function(test)
{ char* str; int str_len; if (zend_parse_parameters(zend_num_args() tsrmls_cc, s, &str, &str_len) == failure) {
return_false; } php_printf(str);
// 无需free(str) }
复制代码
运行正常：test(hello world); // 打印hello world这里不用担心test函数会发生内存泄露，php会自动帮我们回收这些用于保存参数的变量。
那php究竟是如何做到的呢？要解释这个问题，还是得看php是怎么传递参数的。
eg(argument_stack)简介简单来讲，在php中的eg中保存了一个专门用于存放参数的栈，名为argument_stack。每当发生函数调用时，php会将传入的参数压进eg(argument_stack)。一旦函数调用结束，则eg(argument_stack)被清理，并且等待下一次的函数调用。
关于eg(argument_stack)的struct结构、用途，php5.2和5.3实现有一些区别。本文主要以5.2为例，5.3+的变化后面抽空再说。
上图是5.2中argument_stack的大概示意图，看起来简单明了。其中，栈顶和栈底固定为null。函数接收的参数按照从左到右的顺序，依次被压入栈。注意，最后会被额外压入一个long型的值，表示栈里的参数个数（上图中为10）。
那被压入argument_stack的参数究竟是什么呢？其实是一个个zval类型的指针。它们指向的zva有可能是cv变量，有可能是is_ref=1的变量，还有可能是一个常量数字，或者常量字符串。
eg(argument_stack)在php5.2中被具体实现为zend_ptr_stack类型:
typedef struct _zend_ptr_stack { int top; // 栈中当前元素的个数 int max; // 栈中最多存放元素的个数 void **elements; // 栈底 void **top_element; // 栈顶} zend_ptr_stack;
复制代码
初始化argument_stack初始化argument_stack的工作是发生在php处理具体的请求之前，更准确说是处于php解释器的启动过程之中。
在init_executor函数里我们发现如下2行：
zend_ptr_stack_init(&eg(argument_stack));zend_ptr_stack_push(&eg(argument_stack), (void *) null);
复制代码
这2行分别代表着，初始化eg(argument_stack)，紧接着压入一个null。由于eg是个全局变量，因此在实际调用zend_ptr_stack_init之前，eg(argument_stack)中的所有数据全部为0。
zend_ptr_stack_init实现很简单。
zend_api void zend_ptr_stack_init(zend_ptr_stack *stack){ stack->top_element = stack->elements = (void **) emalloc(sizeof(void *)*ptr_stack_block_size); stack->max = ptr_stack_block_size; // 栈的大小被初始化成64 stack->top = 0; // 当前元素个数为0}
复制代码
一旦argument_stack被初始化完，则立即会被压入null。这里无须深究，这个null其实没有任何的含义。
null入栈之后，整个argument_stack的实际内存分布如下：
参数入栈在压入第一个null之后，一旦再有参数入栈，则argument_stack会发生如下动作：stack->top++;*(stack->top_element++) = 参数;
用一段简单的php代码来说明问题：
function foo( $str ){ print_r(123);}foo(hello world);
复制代码
上述代码在调用foo时，传入了一个字符串常量。因此，实际上被压入栈的是一个指向存储“hello world”的zval。用vld来查看编译之后的opcode：
line # * op fetch ext return operands--------------------------------------------------------------------------------- 3 0 > nop 6 1 send_val op1[ is_const (458754) 'hello world' ] 2 do_fcall 1 op1[ is_const (458752) 'foo' ] 15 3 > return op1[ is_const (0) 1 ]
复制代码
send_val指令实际上做的事情就是将“hello world”压入argument_stack。
int zend_send_val_spec_const_handler(zend_opcode_handler_args)
{ …… zval *valptr, *value; value = &opline->op1.u.constant;
alloc_zval(valptr); init_pzval_copy(valptr, value); if (!0) { zval_copy_ctor(valptr); } // 入栈，valptr指向存放hello world的zval
zend_ptr_stack_push(&eg(argument_stack), valptr); ……}
复制代码
入栈完成之后的argument_stack为：
参数个数前文说到，实际上并非把所有参数入栈就完事了。php还会额外压入一个数字，表示参数的个数，这个工作并非发生在send_xxx指令时。实际上，在真正执行函数之前，php会将参数个数入栈。
继续沿用上面的例子，do_fcall 指令用于调用foo函数。在调用foo之前，php会自动填入argument_stack最后一块。
static int zend_do_fcall_common_helper_spec(zend_opcode_handler_args){ …… // 在argument_stack中压入2个值 // 一个是参数个数（即opline->extended_value） // 一个是标识栈顶的null zend_ptr_stack_2_push(&eg(argument_stack), (void *)(zend_uintptr_t)opline->extended_value, null); …… if (ex(function_state).function->type == zend_internal_function) { …… } else if (ex(function_state).function->type == zend_user_function) { …… // 调用foo函数 zend_execute(eg(active_op_array) tsrmls_cc); } else { /* zend_overloaded_function */ …… } …… // 清理argument_stack zend_ptr_stack_clear_multiple(tsrmls_c); …… zend_vm_next_opcode();}
复制代码
压入参数个数和null之后，用于foo调用的整个argument_stack已然完成。获取参数继续跟进上面的例子。深入到foo函数，看看foo的opcode是什么样子的。
line # * op fetch ext return operands--------------------------------------------------------------------------------- 3 0 > recv op1[ is_const (0) 1 ] 4 1 send_val op1[ is_const (5) 123 ] 2 do_fcall 1 op1[ is_const (459027) 'print_r' ] 5 3 > return op1[ is_const (0) null ]
复制代码
第一条指令是recv，从字面上理解便是用于获取栈中参数的。实际上，send_val和recv有点对应的感觉。每次函数调用之前send_val，在函数内部进行recv。为什么不说是完全对应，实际上recv指令并非一定需要。只有当用户定义的函数被调用是，才会产生recv。我们编写的扩展函数，php自带的内建函数，都不会有recv。
需要额外指出的是，每次send_val和recv 均只能处理一个参数。也就是说如果传参的过程中有多个参数，那么会产生若干send_val以及若干recv。这里引出一个很有趣的话题，传入参数和获取参数的顺序是怎样的呢？
答案是，send_val会将参数从左至右的进行压栈，而recv一样的从左至右获取参数。
static int zend_recv_spec_handler(zend_opcode_handler_args)
{ ……// param拿参数的顺序是沿着栈顶-->栈底 if (zend_ptr_stack_get_arg(arg_num, (void **) ¶m tsrmls_cc)==failure) { …… } else { zend_free_op free_res; zval **var_ptr; // 验证参数
zend_verify_arg_type((zend_function *) eg(active_op_array), arg_num, *param tsrmls_cc); var_ptr = get_zval_ptr_ptr(&opline->result, ex(ts), &free_res, bp_var_w); // 获取参数 if (pzval_is_ref(*param)) { zend_assign_to_variable_reference(var_ptr, param tsrmls_cc); } else { zend_receive(var_ptr, *param tsrmls_cc); } } zend_vm_next_opcode();
}
复制代码
zend_assign_to_variable_reference 和 zend_receive 都会完成“获取参数” 。“获取参数”不太好理解，实际它究竟是做哪些事情呢？
说到底很简单，“获取参数”就是将这个参数添加到当前函数执行期间的“符号表”中，具体对应为eg(current_execute_data)->symbol_table。本示例中，recv完成之后，函数体内的symbol_table中有了一个符号‘str’，它的值为“hello world”。
但argument_stack并没有发生一丝变化，因为recv仅仅是读取参数，而不会对栈产生类似pop操作。
清理argument_stackfoo内部的print_r也是一个函数调用，因此也会产生压栈-->清栈的操作。因此print_r执行之前的argument_stack为：
print_r执行之后argument_stack又回到了foo刚recv完的状态。
具体调用print_r的过程并非本文阐述的重点。我们关心的是当调用foo结束之后，php是如何清理argument_stack的。
上面展示的do_fcall代码片段中可以看出，清理工作由zend_ptr_stack_clear_multiple完成的。
static inline void zend_ptr_stack_clear_multiple(tsrmls_d){ void **p = eg(argument_stack).top_element-2; // 取栈顶保存的参数个数 int delete_count = (int)(zend_uintptr_t) *p; eg(argument_stack).top -= (delete_count+2); // 从上至下，依次清理 while (--delete_count>=0) { zval *q = *(zval **)(--p); *p = null; zval_ptr_dtor(&q); } eg(argument_stack).top_element = p;}
复制代码
注意这里清理栈中zval指针，使用的是zval_ptr_dtor。zval_ptr_dtor会将refcount减1，一旦refcount减为0，则保存该变量的内存区域会被真正的回收掉。
在本文示例中，foo调用完毕之后，保存“hello world”的zval状态为：
value hello worldrefcount 1type 6is_ref 0
复制代码
由于refcount只剩1，因此，zval_ptr_dtor会将“hello world”真正从内存中销毁。
消栈完毕之后的argument_stack内存状态为：
可以看出上图中的argument_stack与刚被初始化之后是一样的。此时argument_stack真正做好了迎接下一次函数调用的准备。
回到文章刚开始的问题...为何无需free(str)呢？弄明白了argument_stack之后就很好理解这个问题了。
因为str指向的是zval中实际存放“hello world”的内存地址。假设扩展函数如下：
php_function(test)
{ char* str; int str_len; if (zend_parse_parameters(zend_num_args() tsrmls_cc, s, &str, &str_len) == failure) {
return_false; } str[0] = 'h';
}
复制代码
则调用
$a = hello world;test($a);echo $a;
复制代码
会输出“hello world”。尽管我们调用test时，并非是传$a的引用，但实际效果相当于test(&$a)。
简单来说，内存中只有一份$a，不管是cv数组中，还是在argument_stack中。而zend_parse_parameters并没有拷贝一份数据用于函数执行，事实上它也不能这么做。因此，当函数完毕之后，如果没有其他地方会用到$a，php清理argument_stack时会帮我们free。如果仍然其他代码在使用，就更加不能手动free了，否则会破坏$a的内存区域。
注意，并非写扩展函数中用到的每个变量，php都会自动回收。所以该free时，切勿手软:)

PHP传参原理深入解析

推荐信息