在php中利用mb_detect_encoding可以判断给我们的字符是那个类型的编码了,从而我们就可以利用inconv进行字符转换了,下面给大家介绍几个例子。
例子,利用mb_detect_encoding()判断字符是否为uft-8编码。
代码如下 复制代码
$encode = mb_detect_encoding($q, array('gb2312','gbk','utf-8'));
echo $encode.
;
if($encode==gb2312)
{
$q = iconv(gbk,utf-8,$q);
}
else if($encode==gbk)
{
$q = iconv(gbk,utf-8,$q);
}
else if($encode==euc-cn)
{
$q = iconv(gbk,utf-8,$q);
}
else//cp936
{
//$q = iconv(gb2312,utf-8,$q);
}
可是 mb_detect_encoding 存在一个硬伤,经常出现判断不准确的情况。或许这样就可以解决:
代码如下 复制代码
// 使用 iconv 转换并判断是否等值,效率不高
function is_utf8 ($str) {
if ($str === iconv('utf-8', 'utf-8//ignore', $str)) {
return 'utf-8';
}
}
// 多种编码的情况
function detect_encoding ($str) {
foreach (array('gbk', 'utf-8') as $v) {
if ($str === iconv($v, $v . '//ignore', $str)) {
return $v;
}
}
}
通过以上方式得到字符串编码信息后,就可以利用 iconv 或 mb_convert_encoding 来转换编码了
问题
可是当 $keytitle = '%d0%be%c6%ac'; 时。
检测结果却是utf-8,这其实不算是bug,我们不应当过于依赖mb_detect_encoding,当字符串较短时,检测结果产生偏差的可能性很大。
解决方法:
代码如下 复制代码
$encode = mb_detect_encoding($keytitle, array('ascii','gb2312′,'gbk’,'utf-8');
x