readr :: read_csv问题:汉字变成乱码

X.J*_*Jun 3 r dplyr readr tidyverse

我正在尝试将数据集导入到RStudio,但是我遇到了汉字,因为它们变成了乱码.这是代码:

library(tidyverse)
df <- read_csv("??,??\n??,??")
df
# A tibble: 1 x 2
  `\xd6\xd0\xce\xc4`            `?\xce\xc4`
               <chr>                  <chr>
1 "<U+04E2>\xce\xc4" "<U+00B5>\xc2\xce\xc4"
Run Code Online (Sandbox Code Playgroud)

当我使用基函数read.csv时,它运行良好.我想我必须对编码做错事.但是read_csv中没有编码选项,我该怎么做?

yut*_*ion 7

这是因为字符被标记为,UTF-8而实际编码是系统默认值(您可以通过stringi::stri_enc_get()).

所以,你可以这样做:

1)使用正确的编码读取数据:

df <- read_csv("??,??\n??,??", locale = locale(encoding = stringi::stri_enc_get()))
Run Code Online (Sandbox Code Playgroud)

2)使用不正确的编码读取数据并在以后用正确的编码标记它们(请注意,这并不总是有效):

df <- read_csv("??,??\n??,??")
df <- dplyr::mutate_all(df, `Encoding<-`, value = "unknown")
Run Code Online (Sandbox Code Playgroud)