阿拉伯语文本不显示在 R- 中

Esc*_*sc6 5 nlp r arabic tm

刚开始使用阿拉伯语 R,因为我计划使用圣训语料库进行文本分析和文本挖掘。我一直在阅读与我的问题相关的线程,但仍然无法在这里获得真正的基础知识(抱歉,绝对的初学者)。

所以,我输入:textarabic.v <- scan("data/arabic-text.txt",encoding="UTF-8",what= "character",sep="\n")

出来的textarabic.v当然是符号(图)。在此之前,当我在线程中阅读时,我将文本保存为 utf-8,但仍然没有以阿拉伯语显示。

我可以输入阿拉伯语 R,但扫描会以符号形式显示文本。

在此输入图像描述

还阅读并尝试实现其他用户的代码来实现阿拉伯文本功能,但我什至不知道如何以及在哪里实现它们。我添加到 R、tm 和 NLP 包中。

你建议我接下来做什么?提前致谢,

Six*_*ive 1

我刚刚发布了一个答案,说在我看到你在 OSX 上的评论之前,你肯定在 Windows 上使用 R。在 OSX 上,情况并没有那么可怕。问题是你使用的 R 版本太旧了。如果我没记错的话,3.2 之前的任何版本都不能正确处理 Unicode。尝试从https://cran.r-project.org/bin/macosx/安装 3.3.3 ,如有必要,请重新安装所需的软件包。那么你应该没问题。\xd8\xa8\xd8\xa7\xd9\x84\xd8\xaa\xd9\x88\xd9\x81\xd9\x8a\xd9\x82!

\n