浏览器缓冲区到字符串的转换在浏览器和nodejs中不一样

Question

浏览器缓冲区到字符串的转换在浏览器和nodejs中不一样

TKF*_*TKF 0 javascript string utf-8 node.js

我遇到了一个有趣的问题。我使用的是节点 v8.1.4

我有以下缓冲区。

[ 191, 164, 235, 131, 30, 28, 164, 179, 101, 138, 94, 36, 115, 176, 83, 193, 9, 177, 85, 228, 189, 193, 127, 71, 165, 16, 211, 132, 228, 241, 57, 207, 254, 152, 122, 98, 100, 71, 67, 100, 29, 218, 165, 101, 25, 17, 177, 173, 92, 173, 162, 186, 198, 1, 80, 94, 228, 165, 124, 171, 78, 49, 145, 158 ]

Run Code Online (Sandbox Code Playgroud)

当我尝试使用 nodejs 和使用浏览器将其转换为 utf8 时，我得到不同的结果。甚至字符串的长度也不一样。

有没有办法像node js一样在浏览器中将字符串转换为utf8？

看来nodejs替换为U+FFFD的某些序列的某些字符比浏览器中替换的序列更长。所以输出的utf8字符串是不同的

我在浏览器和nodejs中使用的代码是相同的我有缓冲区对象 tmpString

  tmpString.toString('utf-8')

Run Code Online (Sandbox Code Playgroud)

对于相同的源字节，tmpString.toString('utf-8').length 在浏览器和 NodeJS 中有所不同。

在nodejs中，我使用本机缓冲区实现，以便浏览器webpack加载polyfill（我认为是feross/buffer）

我认为更准确地说我尝试将缓冲区字节解释为 UTF8 字符串。

Answer 1

jco*_*der 7

您尝试过 TextEncoder/TextDecoder API 吗？我已经使用它们在 Nodejs 和浏览器中转换字符串，但没有看到任何差异。

例如：

const encoder = new TextEncoder('utf-8');
const decoder = new TextDecoder('utf-8');

const foo = 'Hello world!';
const encoded = encoder.encode(foo);
console.log(encoded);

const decoded = decoder.decode(encoded);
console.log(decoded);

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，4 月前
查看次数：	3726 次
最近记录：	8 年，4 月前