我正在使用R Studio,需要导入用于文本挖掘的csv文件.文件是windows-1252编码并包含德语变音符号.
但是我无法让R正确导入这些变形金刚.使用read.table(X,fileEncoding ="UTF-8")会导致错误.
我错过了什么?
---- ----更新
我试图阅读的文件是:https: //drive.google.com/file/d/0B4kGh2YwTmb9U3hkei1TTHlUME0/edit?usp=sharing
使用此R代码:
Sys.setlocale("LC_CTYPE", "german")
dataset <- read.table("../processed/DE_all_CDM_201405050001_DE_all_CDM2014-05-05_rcout.csv", encoding="UTF-8", header=TRUE, sep=";", stringsAsFactors=F, as.is=T)
dataset <- dataset[,c(1,11,30)]
Encoding(dataset[,2]) <- "UTF-8"