今天的项目中遇到需要用javascript的escape编码汉字再用unescape解码的情况,测试代码段的时候出现了乱码的情况。
具体情况如下:
首先,用editplus打开测试页面test.html,编辑如下html代码:
unescape测试
页面打印输出:
%ufffd%u0171%ufffd%u05ae%ufffd%ufffd
此时可以看出情况不对,单从汉字对应的字符数量上来说已经不对了!
再使用如下代码测试unescape解码后的汉字:
var relstr=unescape(%ufffd%u0171%ufffd%u05ae%ufffd%ufffd);document.write(relstr);
出现了乱码:�ű�֮��
解决方法:
用dreamweaver打开test.html文件,发现了问题所在!
原先的那段
var teststr=escape(脚本之家);
变成了
var teststr=escape(ű֮);
可见是编辑器的初始编码造成的!
在dreamweaver中将汉字改回来,重新运行test.html,得到了对应的编码:
%u811a%u672c%u4e4b%u5bb6
此时再用unescape解码:
var relstr=unescape(%u811a%u672c%u4e4b%u5bb6);document.write(relstr);
就得到了原先正确的汉字:脚本之家!