php如何过滤特殊汉字? 或替换16进制。。
在计算一个dom的过程中,由于body中有了一个不知道是什么汉字的汉子
结果导致如下代码出现如下错误
代码:
php code$dq = new zend_dom_query($body); $dq->query(*);
原来的body是gb2312编码的,出现的错误是:
[0]=>
object(libxmlerror)#45 (6) {
[level]=>
int(3)
[code]=>
int(6003)
[column]=>
int(0)
[message]=>
string(70) input conversion failed due to input error, bytes 0xcb 0x87 0xca 0xfb
[file]=>
string(0)
[line]=>
int(0)
}
错误中0xcb 0x87 0xca 0xfb是 (藝墅) 两个字 , 我不知道这个帖子提交后这个汉字是否能正确显示 ,反正是百度搜索不了。。。
有没有办法替换掉这两个汉字
我str_replace了下 , 没成功
preg_replace好像也不行。。
ps 能在ultraedit中能看到。。。。。
就是如何在16进制下替换???
------解决方案--------------------
body 换成gbk?
------解决方案--------------------
转成编码形式
$str = '中华人民共和国';
$str = mb_convert_encoding($str, html-entities,utf-8 );//结果:哪一队优先开球