您好,欢迎访问一九零五行业门户网

curl 和 file_get_contents 抓取网页乱码的解决之道 filegetcontents超时 js file get contents wp file get contents

今天用 curl_init 函数抓取搜狐的网页时,发现采集的网页时乱码,经过分析发现原来是服务器开启了gzip压缩功能。只要往函数 curl_setopt 添加多个选项 curlopt_encoding 解析 gzip 就可以正确解码了。
    还有如果抓取的网页时 gbk 编码,但是脚本确是 utf-8 编码,还得把抓取的网页再用函数 mb_convert_encoding 转换下。
原文:http://woqilin.blogspot.com/2014/05/curl-filegetcontents.html
以上就介绍了curl 和 file_get_contents 抓取网页乱码的解决之道,包括了file_get_contents方面的内容,希望对php教程有兴趣的朋友有所帮助。
其它类似信息

推荐信息