我已将 Facebook 数据下载为 json 文件。我的帖子的 json 文件包含表情符号,它们在 json 文件中显示如下:\\u00f0\\u009f\\u0098\\u008a。我想解析这个 json 文件并使用正确的表情符号提取帖子。
\n\n我找不到一种方法将此 json 文件加载到 json 对象中(使用 JavaScript),然后使用正确的表情符号读取(并输出)帖子。
\n\n(最终我将使用 WordPress 的 REST API 将这些帖子上传到 WordPress,我已经弄清楚了如何做。)
\n\n我的程序是用 JavaScript 编写的,并使用 nodejs 从命令行运行。我已经使用以下方法解析了该文件:
\n\nconst fs = require(\'fs\')\nlet filetext = fs.readFileSync(filename, \'utf8\')\nlet jsonObj = JSON.parse(filetext)\nRun Code Online (Sandbox Code Playgroud)\n\n但是,当我输出数据(使用类似jsonObj.status_updates.data[0].post)时,我得到了表情符号的奇怪字符,例如Happy birthday \xe2\x94\x9c\xe2\x96\x91\xe2\x94\xac\xc6\x92\xe2\x94\xac\xc3\xbf\xe2\x94\xac\xc3\xa8而不是Happy birthday 。这不是 Windows 10 控制台显示问题,因为我也将输出通过管道传输到文件。
在解析文件之前,我已使用答案Decode or unescape \\u00f0\\u009f\\u0091\\u008d 来将 json 文件中的 \\uXXXX 序列更改为实际的表情符号。但是,然后JSON.parse不起作用。它给出了这样的消息:
SyntaxError: Unexpected token o in JSON at …Run Code Online (Sandbox Code Playgroud)