我尝试用php来做一个dht爬虫,由于数据的传输使用的是bencode,这个是没问题的,可以正确编码解码,但是其中如果发送find_node数据,获取到的数据中有一个nodes,这是一个使用struct结构的二进制流编码的数据,根据dht协议所说,是:20字节的node id + 4字节的ip + 2字节的端口,我看过python里的编码解码方式,但无法转换为php中的,python中是这样转换的:
def decodenodes(nodes): 把收到的nodes转成例表. 数据格式: [ (node id, ip, port),(node id, ip, port),(node id, ip, port).... ] n = [] nrnodes = len(nodes) / 26 nodes = unpack(! + 20sih * nrnodes, nodes) for i in xrange(nrnodes): nid, ip, port = nodes[i * 3], numtodottedquad(nodes[i * 3 + 1]), nodes[i * 3 + 2] print nid n.append((nid, ip, port)) return ndef encodenodes(nodes): 编码nodes 与decodenodes相反 n = [] for node in nodes: n.extend([node.nid, dottedquadtonum(node.ip), node.port]) return pack(! + 20sih * len(nodes), *n)
请问在php里要如何才能够这样转换呢?
回复讨论(解决方案) 20字节的node id : a20 或 a20 如果是用空格充填不足就用后者
4字节的ip: l ip 地址用 ip2long 转换成无符号长整形数
2字节的端口: s
打包
$s = pack('a20ls', $nodeid, ip2logn($ip), 456);
解包
$d = unpack('a20nodeid/lip/sport', $s);
$d['ip'] = logn2ip($d['ip']);
print_r($d); //就清楚了
20字节的node id : a20 或 a20 如果是用空格充填不足就用后者
4字节的ip: l ip 地址用 ip2long 转换成无符号长整形数
2字节的端口: s
打包
$s = pack('a20ls', $nodeid, ip2logn($ip), 456);
解包
$d = unpack('a20nodeid/lip/sport', $s);
$d['ip'] = logn2ip($d['ip']);
print_r($d); //就清楚了
非常感谢,解决了