R 中的西里尔字母音译

Vik*_*tor 4 r transliteration

R 中是否有将西里尔文文本音译为拉丁文的软件包?我需要将数据框转换为拉丁语以使用因子。在 R 中使用 Cyrillic 因子有点混乱。

Vik*_*tor 5

我终于找到了包裹。

> library(stringi)
> stri_trans_general("???????", "cyrillic-latin")
Run Code Online (Sandbox Code Playgroud)

[1] "žen?ina"

> stri_trans_general("???????", "russian-latin/bgn")
Run Code Online (Sandbox Code Playgroud)

[1] 《振兴》

在那之后,唯一剩下的问题就是“?” 信。

> stri_trans_general("??", "russian-latin/bgn")
Run Code Online (Sandbox Code Playgroud)

[1] 《耶日》

我必须删除所有的“?” 字母

> iconv(stri_trans_general("??", "russian-latin/bgn"),from="UTF8",to="ASCII",sub="")
Run Code Online (Sandbox Code Playgroud)

[1] "yzh"

或者可以删除“?” 和 '?' 之前的字母

> gsub('?','e',gsub('?','E','????? ?? ????'))
Run Code Online (Sandbox Code Playgroud)

[1] “E???? ?? e???”

或音译后。