什么是nop nop 是一个特殊的opcode,表示空操作,在很多地方存在,汇编中的nop含义也一样,机器指令中的空操作通常用来将内存地址进行对齐,以提高cpu访问内存的效率,gcc等编译器也会将特定的语句进行优化而产生空操作。 php中的空操作opcode nop: zend_nop
什么是nopnop 是一个特殊的opcode,表示空操作,在很多地方存在,汇编中的nop含义也一样,机器指令中的空操作通常用来将内存地址进行对齐,以提高cpu访问内存的效率,gcc等编译器也会将特定的语句进行优化而产生空操作。
php中的空操作opcode nop: zend_nopphp基于zend虚拟机,其他基于虚拟机的语言中大都会有类似nop的指令,php文档有对此的简单说明:
/* vld 的输出结果 */line # op fetch ext return operands6 0 nop 7 1 return 1function name: acompiled variables: noneline # op fetch ext return operands6 0 return null
上面的vld结果可以看出,函数a()的声明编译后变成了nop操作。
zend虚拟机是高级抽象,不要考虑内存对齐等的问题,为什么还需要空操作这样的opcode呢?
原因简单讲就是:编译过程优化的结果。有的内容由于可以在编译时就可确定(称为提早绑定early binding),那么一部分opcode可以在编译时替换成空操作。
我们来看看这段代码的编译结果:
> jmpz true, ->3 3 1 > zend_declare_class $0 '%00foo%2fusers%2freeze%2fopensource%2fphp-test%2fphp-src-5.4%2ftest.php0x106cd601f', 'foo' 4 2 > jmp ->3 6 3 > zend_fetch_class 4 :1 'bar' 4 new :1 5 do_fcall_by_name 0 7 6 nop 9 7 > return
和前面官方函数定义代码一样,上面vld输出的第7行看到类bar的opcode变成了nop,不过请留意第3行,这一行类foo定义的opcode是zend_declare_class,也就是类的声明。
为什么同样是类的声明,第一个类声明的opcode和第二个的不一样呢?
上例中的代码,在bar类声明之前是可以执行的new bar,但是此时bar类的声明并没有执行到,那为什么可以访问到bar类呢,这是因为bar类的声明在编译时就已经完成了,因为bar类已经在编译时声明好了,所以在真正执行的时候就不需要再次执行声明类的操作了,所以它所对应的opcode被替换成nop了。
而foo这个类由于处在条件判断块之中,编译期无法确定foo类是否一定会被执行,所以还是需要在执行时来声明这个类,所以opcode没有改变。
对于使用了opcode缓存的代码来说,把函数和类的声明移到了编译时,也就减少了执行时的opcode执行,这能加快代码的执行。
优化你可能会想,既然类及函数的声明可以优化掉,为什么不能直接丢弃这个opcode呢?一能减少opcode占用的内容,比如很多的框架中有大量的类定义,也能减少执行时间,因为空操作并不是0成本的,执行nop的时候还是需要消耗cpu的。
先看看opcode编译过程的一个重要函数:
zend_op *get_next_op(zend_op_array *op_array tsrmls_dc){ zend_uint next_op_num = op_array->last++; zend_op *next_op; if (next_op_num >= cg(context).opcodes_size) { if (op_array->fn_flags & zend_acc_interactive) { /* we messed up */ zend_printf(ran out of opcode space!\n you should probably consider writing this huge script into a file!\n); zend_bailout(); } cg(context).opcodes_size *= 4; op_array_alloc_ops(op_array, cg(context).opcodes_size); } next_op = &(op_array->opcodes[next_op_num]); init_op(next_op tsrmls_cc); return next_op;}
这个函数每次会返回一个zend_op(也就是opcode一个最小单位),opcode的存储空间申请和哈希表类似,通过预先申请空间的方式,如果空间不足则适当扩容。在编译时,opcode是以文件为单位的,而通常在一个文件中函数或类声明的个数是不会太多的。而在编译时opcode数组已经是预先申请好的,所以及时优化掉这个opcode,而实际在编译时的内存占用也不会有任何的优化。
目前只有少数几处使用了zend_nop这个opcode。读者可以参考zend/zend_compile.c: zend_do_early_binding(),这个函数进行就是在确定在编译时能确定的函数以及类声明,在完成函数或类的声明后将当前编译的opcode设置为zend_nop。因为后续在执行是并需要再次对该函数或类进行声明了。
note当然也并不是所有的全局类或者方法都会进行提早绑定,具体可以参考前面提到的zend_compile.c文件的实现
在这个函数中其实可以将生成的zend_nop优化掉的,比如eaccelarator扩展中就对opcode进行了优化,将zend_nop从opcode_array数组中移除了,因为使用了opcode cache扩展优化只进行一次,而执行对多次执行,这样的优化是值得的。目前zend引擎并没有进行任何的优化,首先从代码上来看,类和函数声明的数量和其他指令的数量之间差很多个等级,所以至少这个地方优化的收益是有限的,为了保证zend引擎的简洁它没有进行优化。
目前apc扩展已经基本确定为将要进入php默认opcode缓存的官方扩展了,那么这些优化都可以在扩展中进行,保证zend引擎的简单易维护更为重要。
原文地址:php中的nop及为什么有这个opcode, 感谢原作者分享。