这次给大家带来利用node.js进行文件编码格式转换,利用node.js进行文件编码格式转换的注意事项有哪些,下面就是实战案例,一起来看一下。
ascii编码就比较蛋疼,通过搜索网上资源,反复测试对比,最终形成下面比较靠谱的方法(有一些 editplus显示编码为utf-8但node.js库返回的却是其它编码>_<)
判断修改是否无误,只需要在修改完之后,通过svn提交,浏览提交列表,双击任意一项待提交文件,如果显示下图所示的对话框,则说明修改成功,其它都会看到中文反而变成乱码了
var fs = require('fs');
var chardet = require('chardet');
var jschardet = require("jschardet");
var encoding = require("encoding");
var path = "lua目录";
function readdirectory(dirpath) {
if (fs.existssync(dirpath)) {
var files = fs.readdirsync(dirpath);
files.foreach(function (file) {
var filepath = dirpath + "/" + file;
var stats = fs.statsync(filepath);
if (stats.isdirectory()) {
// console.log('/n读取目录:\n', filepath, "\n");
readdirectory(filepath);
} else if (stats.isfile() && /\.lua$/.test(filepath)) {
var buff = fs.readfilesync(filepath);
if (buff.length && buff[0].tostring(16).tolowercase() == "ef" && buff[1].tostring(16).tolowercase() == "bb" && buff[2].tostring(16).tolowercase() == "bf") {
//ef bb bf 239 187 191
console.log('\n发现bom文件:', filepath, "\n");
buff = buff.slice(3);
fs.writefile(filepath, buff.tostring(), "utf8");
}
// { encoding: 'utf-8', confidence: 0.99 }
// var charset = chardet.detectfilesync(filepath);
var info = jschardet.detect(buff);
if (info.encoding == "gb2312" || info.encoding == "ascii") {
var resultbuffer = encoding.convert(buff, "utf-8", info.encoding);
fs.writefile(filepath, resultbuffer, "utf8");
}
else if (info.encoding != "utf-8" && chardet.detectfilesync(filepath) != "utf-8")
{
if (buff.tostring().indexof("\r\n") > -1)
{
var resultbuffer = encoding.convert(buff, utf-8, gbk);
fs.writefile(filepath, resultbuffer, utf8);
}
}
}
});
} else {
console.log('not found path : ', dirpath);
}
}
readdirectory(path);
注意上面的判断,第一个明确是 gb2312或者ascii时,直接将相应的编码转为 utf-8。而如果返回是格式,先判断是否有pc下的换行符,如果有则全部将它视为gbk进行处理。
整个思路其实是比较简单,难点在于如果判断文件编码格式。这个真的很难>_<,获取原编码格式后,调用 encoding.convert(buff, 目标编码格式 , 原始编码格式 ); 便可得到所需要的编码。如果有空而且有兴趣,可以下载notepad++的源码,看它是如何判断文件的编码格式
相信看了本文案例你已经掌握了方法,更多精彩请关注其它相关文章!
推荐阅读:
js基础提升学习之三种内置对象
js基础提升学习之基本数据类型
以上就是利用node.js进行文件编码格式转换的详细内容。