我在使用大型csv文件阅读read.csv.一些网站建议使用colClasses定义每列的类,以使导入过程更快.
t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got 'NULL'
classes = c("numeric","integer")
Run Code Online (Sandbox Code Playgroud)
我的一些数据显然有空值.有没有办法使用colClasses,其中"numeric"或"integer"包含空值?此外,有关将大型数据集更快地导入R的任何其他提示将非常有用.我拥有SQL数据库中的所有数据,并且我尝试使用RODBC,这比read.csv()慢得多.