我需要加载一个3 GB的csv文件,其中包含大约1800万行和7列从S3到R或RStudio.我从S3读取数据的代码通常是这样的:
library("aws.s3")
obj <-get_object("s3://myBucketName/aFolder/fileName.csv")
csvcharobj <- rawToChar(obj)
con <- textConnection(csvcharobj)
data <- read.csv(file = con)
Run Code Online (Sandbox Code Playgroud)
现在,由于文件比平时大得多,我收到一个错误
> csvcharobj <- rawToChar(obj)
Error in rawToChar(obj) : long vectors not supported yet: raw.c:68
Run Code Online (Sandbox Code Playgroud)
阅读这篇文章,我理解向量太长但在这种情况下如何对数据进行子集化?还有其他建议如何处理从S3读取的较大文件?