我正在 R 中进行一些文本挖掘。我想要分析的文本是德语的。
\n\n问题是德语字符在文本本身或结果中都无法正确显示。
\n\n我正在 Mac 操作系统上工作。
\n\n我在这里找到了类似的线程并尝试了建议的解决方案:
\n\nSys.setlocale("LC_ALL", "de_DE.UTF-8")\nRun Code Online (Sandbox Code Playgroud)\n\n似乎改变了语言(即不给出错误消息),但字符仍然显示不正确,\ne.g。Erste-Hilfe-Ma\\xa7nahmen而不是Erste-Hilfe-Ma\xc3\x9fnahmen。
\n\ntext <- readLines("Erste Hilfe.txt", encoding="de_DE.UTF-8")\nRun Code Online (Sandbox Code Playgroud)\n\n结果:Erste-Hilfe-Ma\\xa7nahmen
\n\ntext <- readLines("Erste Hilfe.txt", encoding="ISO/IEC 8859-15")\nRun Code Online (Sandbox Code Playgroud)\n\n结果:Erste-Hilfe-Ma\\xa7nahmen
\n\n您还有其他解决方案吗?
\n