R 中是否有将西里尔文文本音译为拉丁文的软件包?我需要将数据框转换为拉丁语以使用因子。在 R 中使用 Cyrillic 因子有点混乱。
我终于找到了包裹。
> library(stringi)
> stri_trans_general("???????", "cyrillic-latin")
Run Code Online (Sandbox Code Playgroud)
[1] "žen?ina"
> stri_trans_general("???????", "russian-latin/bgn")
Run Code Online (Sandbox Code Playgroud)
[1] 《振兴》
在那之后,唯一剩下的问题就是“?” 信。
> stri_trans_general("??", "russian-latin/bgn")
Run Code Online (Sandbox Code Playgroud)
[1] 《耶日》
我必须删除所有的“?” 字母
> iconv(stri_trans_general("??", "russian-latin/bgn"),from="UTF8",to="ASCII",sub="")
Run Code Online (Sandbox Code Playgroud)
[1] "yzh"
或者可以删除“?” 和 '?' 之前的字母
> gsub('?','e',gsub('?','E','????? ?? ????'))
Run Code Online (Sandbox Code Playgroud)
[1] “E???? ?? e???”
或音译后。
| 归档时间: |
|
| 查看次数: |
1775 次 |
| 最近记录: |