您好,欢迎访问一九零五行业门户网

HTML实体与网页编码

汉字都转化为了html实体(十进制表示的unicode编码),这样做的好处就是不管网页的编码是什么,都可以正常的显示汉字,而不会出现乱码,当然也适用于其他字符集。
在php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。
如:
mb_convert_encoding (你好, html-entities, gb2312);    //输出:你好
mb_convert_encoding (你好, gb2312, html-entities);    //输出:你好
如果需要对整个页面转化,则只需要在php文件的头部加上这三行代码:
mb_internal_encoding(gb2312);  // 这里的gb2312是你网站原来的编码
mb_http_output(html-entities);
ob_start('mb_output_handler');
asp版 可以用下面这个函数来实现这个转化:
function htmlentities(str)
    for i = 1 to len(str)
        char = mid(str, i, 1)
        if ascw(char) > 0 then
            htmlentities = htmlentities & &# & ascw(char) & ;
        else
            htmlentities = htmlentities & &# & (65536 + ascw(char)) & ;
        end if
    next
end function
js 版
function htmlentities(str)
 {
      var r = ;
      for( i=0; i       {
           temp = str.charcodeat(i);
           r += &#+temp+;;
      }
//  也可以用一句正则表达式解决
     // r = str.replace(/[\d\d]/g, function($0) { return &# + $0.charcodeat(0) + ;; });
     return r;
 }
asp.net (c#) 版
 private string gethtmlentities(string str)
  {
      string r = string.empty;
       for (int i = 0; i < str.length; i++)
       {
            r += &#+char.converttoutf32(str,i)+;;
       }
       return r;
 }
相关文档:网页中常用html字符实体
以上就是html实体与网页编码的详细内容。
其它类似信息

推荐信息