Hue*_*uey 1 unicode r diacritics transliteration stringi
我正在尝试将特殊字符转换为R中的ASCII.我在这个问题中尝试使用Hadley的建议:
stringi::stri_trans_general('Jos\xe9', 'latin-ascii')
Run Code Online (Sandbox Code Playgroud)
但我得到了"乔斯".我正在使用stringi v1.1.1.
我正在运行Mac.我运行Windows机器的朋友似乎得到了"Jose"的理想结果.
知道发生了什么事吗?
Windows上的默认编码与其他操作系统(UTF-8)上的典型默认编码不同.x ='Jos\xe9'
表示Latin1中的内容,但不是UTF-8中的内容.因此,在Linux或OS X上,您需要告诉R编码是什么:
x ='Jos\xe9'
Encoding(x) <- 'latin1'
stri_trans_general(x, 'Latin-ASCII')
Run Code Online (Sandbox Code Playgroud)