小编Big*_*ndy的帖子

在文本分析 (R) 中使用德语字符(ü、ö、ä 等)

我正在 R 中进行一些文本挖掘。我想要分析的文本是德语的。

\n\n

问题是德语字符在文本本身或结果中都无法正确显示。

\n\n

我正在 Mac 操作系统上工作。

\n\n

我在这里找到了类似的线程并尝试了建议的解决方案:

\n\n
Sys.setlocale("LC_ALL", "de_DE.UTF-8")\n
Run Code Online (Sandbox Code Playgroud)\n\n

似乎改变了语言(即不给出错误消息),但字符仍然显示不正确,\ne.g。Erste-Hilfe-Ma\\xa7nahmen而不是Erste-Hilfe-Ma\xc3\x9fnahmen

\n\n
text <- readLines("Erste Hilfe.txt", encoding="de_DE.UTF-8")\n
Run Code Online (Sandbox Code Playgroud)\n\n

结果:Erste-Hilfe-Ma\\xa7nahmen

\n\n
text <- readLines("Erste Hilfe.txt", encoding="ISO/IEC 8859-15")\n
Run Code Online (Sandbox Code Playgroud)\n\n

结果:Erste-Hilfe-Ma\\xa7nahmen

\n\n

您还有其他解决方案吗?

\n

text r character-encoding

3
推荐指数
1
解决办法
8341
查看次数

标签 统计

character-encoding ×1

r ×1

text ×1