我即将写一个RSS-feed fetcher并遇到一些charset问题.
与编码相比,加载和解析订阅源非常简单.我正在加载Feed,http.get
我将每个数据事件放在一起.后来我用npm-lib解析整个字符串,feedparser
它对给定的字符串工作正常.
可悲的是我已经习惯了像utf8_encode()
php 这样的函数,我在node.js中错过了它们,所以我坚持使用当前没有做我想要的Iconv.
没有编码,有几个utf8?-icons用于错误的字符集,用iconv,字符串被解析错误:/
目前我正在单独编码每个字符串:
//var encoding ? ISO-8859-1 etc. (Is the right one, checked with docs etc.)
// Shortend version
var iconv = new Iconv(encoding, 'UTF-8');
parser.on('article', function(article){
var object = {
title : iconv.convert(article.title).toString('UTF-8'),
description : iconv.convert(article.summary).toString('UTF-8')
}
Articles.push(object);
});
Run Code Online (Sandbox Code Playgroud)
我应该使用数据缓冲区开始编码还是稍后使用完整的字符串?
谢谢!
PS:编码是通过解析xml的头来确定的
如何在node.js中进行编码的模块更容易?