Vit*_*kov 1 html parsing decoding utf dart
我尝试从 url 解析 html。这个页面的字符集是“windows-1251”,我的方法编码的输出内容是utf。
我尝试使用这样的 http 和 html 包:
getContentFrom(String uri, {List selectors}) async {
var htmlForParse, content, html;
Map headers = {'Content-type':'text/html', 'charset':'windows-1251'};
htmlForParse = await http.read(uri, headers: headers);
html = parse(htmlForParse, encoding:'utf-8');
}
Run Code Online (Sandbox Code Playgroud)
http.read 返回:
'<a href="#"><img src="#" alt="Ðîáîò Parrot Jumping Sumo (÷åðíûé)"/></a>'
Run Code Online (Sandbox Code Playgroud)
只有当它尝试从非 utf 字符集页面获取时。
像这样的 Dart 代码:https : //github.com/Rasarts/mini.parser/blob/master/lib/parser.dart
最后输出像这样“鹦鹉跳跃相扑(÷åðíûé)”,但我期望“鹦鹉跳跃相扑(??????)”
我能做些什么来解决那个 ÷åðíûé ?