从 R 导出阿拉伯语文本

use*_*000 1 encoding r utf-8 arabic rstudio

我正在尝试在 R 中导出带有阿拉伯语文本的数据框。

当 R 导入阿拉伯文本时,它会将其转换为 UTF-8 代码。像这样:

     <U+0627><U+0644><U+0641><U+0631><U+0639> <U+0627><U+0644><U+062A><U+0634><U+0631><U+064A><U+0639><U+064A><U+060C> <U+0627><U+0644><U+0641><U+0631><U+0639> <U+0627><U+0644><U+062A><U+0646><U+0641><U+064A><U+0630><U+064A><U+060C><U+0627><U+0644><U+0641><U+0631><U+0639> <U+0627><U+0644><U+0642><U+0636><U+0627><U+0626><U+064A>. <U+0627><U+0644><U+062D><U+0643><U+0648><U+0645><U+0629> <U+0627><U+0644><U+0641><U+062F><U+0631><U+0627><U+0644><U+064A>
Run Code Online (Sandbox Code Playgroud)

不幸的是,导出时我无法让它变回可读的阿拉伯语。下面是我正在使用的代码...

    write.csv(my.data,"data.csv", fileEncoding='UTF-8') 
Run Code Online (Sandbox Code Playgroud)

有人有解决方案吗?

另外,这是我的会话信息。

R version 3.0.1 (2013-05-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)

locale:
[1] LC_COLLATE=English_United States.1252  LC_CTYPE=English_United States.1252   
[3] LC_MONETARY=English_United States.1252 LC_NUMERIC=C                          
[5] LC_TIME=English_United States.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] ggplot2_0.9.3.1

loaded via a namespace (and not attached):
[1] colorspace_1.2-2   dichromat_2.0-0    digest_0.6.3       grid_3.0.1   gtable_0.1.2      
[6] labeling_0.2       MASS_7.3-27        munsell_0.4.2      plyr_1.8           proto_0.3-10      
[11] RColorBrewer_1.0-5 reshape2_1.2.2     scales_0.2.3       stringr_0.6.2      tools_3.0.1       
Run Code Online (Sandbox Code Playgroud)

小智 5

这段代码对我有用,所以我分享它:

Sys.setlocale("LC_CTYPE", "arabic" )

write.csv(group$message, file = 'posts.txt', fileEncoding = "UTF-8")
Run Code Online (Sandbox Code Playgroud)

如果您将文件另存为 csv,它将不起作用。您必须将其另存为txt。