高分!php网页抓取的问题
http://www.zootoo.com/petnews/canineheroesamemorialdaysalute-1612
http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611
http://www.zootoo.com/petnews/mothersdaygiftsforthepetloving-1592
比如这三个网页
第一个是分页内容,不用管分页
需要把正文部分抓取出来,如何处理?
php不是很熟,高分求教,谢谢
------解决方案--------------------
留下邮箱,我给你发个例子
------解决方案--------------------
php codeheader(content-type:text/html;charset=utf-8);$url=http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611; $contents=file_get_contents($url);$contents=preg_replace('/>(\s+)/','>',$contents);$contents=str_replace(\r\n,'',$contents);$contents=str_replace(\t,'',$contents);//echo $contents;preg_match_all('~(.*?)
(.*?)
~is',$contents,$p);print_r($p[1]);print_r($p[2]);
