XMLHttpRequest 返回错误编码的字符

Nic*_*mer 5 javascript pdf xmlhttprequest utf-8 character-encoding

我使用 XMLHttpRequest 阅读 PDF 文档 http://www.virtualmechanics.com/support/tutorials-spinner/Simple2.pdf

%PDF-1.3
%âãÏÓ
[...]
Run Code Online (Sandbox Code Playgroud)

并将其内容打印到控制台:

var xhr = new XMLHttpRequest();
xhr.onreadystatechange = function() {
    if (xhr.readyState === 4 && xhr.status === 200) {
      console.log(xhr.responseText);
      console.log('âãÏÓ');
    }
};
xhr.open('GET', 'http://www.virtualmechanics.com/support/tutorials-spinner/Simple2.pdf', true);
xhr.send();
Run Code Online (Sandbox Code Playgroud)

但是,控制台说

%PDF-1.3
%????
[...]
âãÏÓ
Run Code Online (Sandbox Code Playgroud)

(最后一行来自console.log上面的参考,以验证控制台是否可以实际显示这些字符。)显然,这些字符在某些时候被错误地编码。出了什么问题以及如何解决这个问题?

Nic*_*mer 4

XMLHttpRequest 的默认响应类型是text,但这里实际上是处理二进制数据。Eric Bidelman描述了如何使用它。

该问题的解决方案是将数据读取为 a Blob,然后从 blob 中提取数据并将其插入hash.update(..., 'binary')

var xhr = new XMLHttpRequest();
xhr.open('GET', details.url, true);
xhr.responseType = 'blob';
xhr.onload = function() {
  if (this.status === 200) {
    var a = new FileReader();
    a.readAsBinaryString(this.response);
    a.onloadend = function() {
      var hash = crypto.createHash('sha1');
      hash.update(a.result, 'binary');
      console.log(hash.digest('hex'));
    };
  }
};
xhr.send(null);
Run Code Online (Sandbox Code Playgroud)