PHP中的NOP及为什么有这个opcode

什么是nop nop 是一个特殊的opcode，表示空操作，在很多地方存在，汇编中的nop含义也一样，机器指令中的空操作通常用来将内存地址进行对齐，以提高cpu访问内存的效率，gcc等编译器也会将特定的语句进行优化而产生空操作。 php中的空操作opcode nop: zend_nop
什么是nopnop 是一个特殊的opcode，表示空操作，在很多地方存在，汇编中的nop含义也一样，机器指令中的空操作通常用来将内存地址进行对齐，以提高cpu访问内存的效率，gcc等编译器也会将特定的语句进行优化而产生空操作。
php中的空操作opcode nop: zend_nopphp基于zend虚拟机，其他基于虚拟机的语言中大都会有类似nop的指令，php文档有对此的简单说明：
/* vld 的输出结果 */line # op fetch ext return operands6 0 nop 7 1 return 1function name: acompiled variables: noneline # op fetch ext return operands6 0 return null
上面的vld结果可以看出，函数a()的声明编译后变成了nop操作。
zend虚拟机是高级抽象，不要考虑内存对齐等的问题，为什么还需要空操作这样的opcode呢？
原因简单讲就是：编译过程优化的结果。有的内容由于可以在编译时就可确定(称为提早绑定early binding)，那么一部分opcode可以在编译时替换成空操作。
我们来看看这段代码的编译结果：
> jmpz true, ->3 3 1 > zend_declare_class $0 '%00foo%2fusers%2freeze%2fopensource%2fphp-test%2fphp-src-5.4%2ftest.php0x106cd601f', 'foo' 4 2 > jmp ->3 6 3 > zend_fetch_class 4 :1 'bar' 4 new :1 5 do_fcall_by_name 0 7 6 nop 9 7 > return
和前面官方函数定义代码一样，上面vld输出的第7行看到类bar的opcode变成了nop，不过请留意第3行，这一行类foo定义的opcode是zend_declare_class，也就是类的声明。
为什么同样是类的声明，第一个类声明的opcode和第二个的不一样呢？
上例中的代码，在bar类声明之前是可以执行的new bar，但是此时bar类的声明并没有执行到，那为什么可以访问到bar类呢，这是因为bar类的声明在编译时就已经完成了，因为bar类已经在编译时声明好了，所以在真正执行的时候就不需要再次执行声明类的操作了，所以它所对应的opcode被替换成nop了。
而foo这个类由于处在条件判断块之中，编译期无法确定foo类是否一定会被执行，所以还是需要在执行时来声明这个类，所以opcode没有改变。
对于使用了opcode缓存的代码来说，把函数和类的声明移到了编译时，也就减少了执行时的opcode执行，这能加快代码的执行。
优化你可能会想，既然类及函数的声明可以优化掉，为什么不能直接丢弃这个opcode呢？一能减少opcode占用的内容，比如很多的框架中有大量的类定义，也能减少执行时间，因为空操作并不是0成本的，执行nop的时候还是需要消耗cpu的。
先看看opcode编译过程的一个重要函数：
zend_op *get_next_op(zend_op_array *op_array tsrmls_dc){ zend_uint next_op_num = op_array->last++; zend_op *next_op; if (next_op_num >= cg(context).opcodes_size) { if (op_array->fn_flags & zend_acc_interactive) { /* we messed up */ zend_printf(ran out of opcode space!\n you should probably consider writing this huge script into a file!\n); zend_bailout(); } cg(context).opcodes_size *= 4; op_array_alloc_ops(op_array, cg(context).opcodes_size); } next_op = &(op_array->opcodes[next_op_num]); init_op(next_op tsrmls_cc); return next_op;}
这个函数每次会返回一个zend_op(也就是opcode一个最小单位)，opcode的存储空间申请和哈希表类似，通过预先申请空间的方式，如果空间不足则适当扩容。在编译时，opcode是以文件为单位的，而通常在一个文件中函数或类声明的个数是不会太多的。而在编译时opcode数组已经是预先申请好的，所以及时优化掉这个opcode，而实际在编译时的内存占用也不会有任何的优化。
目前只有少数几处使用了zend_nop这个opcode。读者可以参考zend/zend_compile.c: zend_do_early_binding()，这个函数进行就是在确定在编译时能确定的函数以及类声明，在完成函数或类的声明后将当前编译的opcode设置为zend_nop。因为后续在执行是并需要再次对该函数或类进行声明了。
note当然也并不是所有的全局类或者方法都会进行提早绑定,具体可以参考前面提到的zend_compile.c文件的实现
在这个函数中其实可以将生成的zend_nop优化掉的，比如eaccelarator扩展中就对opcode进行了优化，将zend_nop从opcode_array数组中移除了，因为使用了opcode cache扩展优化只进行一次，而执行对多次执行，这样的优化是值得的。目前zend引擎并没有进行任何的优化，首先从代码上来看，类和函数声明的数量和其他指令的数量之间差很多个等级，所以至少这个地方优化的收益是有限的，为了保证zend引擎的简洁它没有进行优化。
目前apc扩展已经基本确定为将要进入php默认opcode缓存的官方扩展了，那么这些优化都可以在扩展中进行，保证zend引擎的简单易维护更为重要。
原文地址：php中的nop及为什么有这个opcode, 感谢原作者分享。

PHP中的NOP及为什么有这个opcode

推荐信息