近经常需要采集一些网上的数据,发现一个php处理html的利器 simple html dom,看了一下文档,使用非常方便,关键是能够用css选择器来访问dom树,和jquery相似,实在是难得的利器.
入门级
simple_html_dom插件
用dom处理html文件的利器
使用:加载simple_html_dom.php文件
require_once 'simple_html_dom.php'new simple_html_dom对象$dom = new simple_html_dom()
加载html:
$dom->load($html);find()方法$dom->find('div.lookleftname', 0)->plaintextclass='lookleftname'的div中的纯文本$dom->find('div.lookleftname', 0)->innertextclass='lookleftname'的div中的内部文本
完整测试实例,代码如下:
plaintext != 分店) { $a->href = http://www.xx.com . $a->href; echo $a->outertext . ------ . $a->href . -------
; $sum++; } } echo
第 {$i} 页结束 ,数目:{$sum}; }?>