使用 Dart 解析 html 和解码符号

Vit*_*kov 1 html parsing decoding utf dart

我尝试从 url 解析 html。这个页面的字符集是“windows-1251”,我的方法编码的输出内容是utf。

我尝试使用这样的 http 和 html 包:

getContentFrom(String uri, {List selectors}) async {
    var htmlForParse, content, html;

    Map headers = {'Content-type':'text/html', 'charset':'windows-1251'};

    htmlForParse = await http.read(uri, headers: headers);

    html = parse(htmlForParse, encoding:'utf-8');
}
Run Code Online (Sandbox Code Playgroud)

http.read 返回:

'<a href="#"><img src="#" alt="Ðîáîò Parrot Jumping Sumo (÷åðíûé)"/></a>'
Run Code Online (Sandbox Code Playgroud)

只有当它尝试从非 utf 字符集页面获取时。

像这样的 Dart 代码:https : //github.com/Rasarts/mini.parser/blob/master/lib/parser.dart

最后输出像这样“鹦鹉跳跃相扑(÷åðíûé)”,但我期望“鹦鹉跳跃相扑(??????)”

我能做些什么来解决那个 ÷åðíûé ?