小编Rya*_*yan的帖子

从S3读取大型csv文件到R

我需要加载一个3 GB的csv文件,其中包含大约1800万行和7列从S3到R或RStudio.我从S3读取数据的代码通常是这样的:

library("aws.s3")
obj <-get_object("s3://myBucketName/aFolder/fileName.csv")  
csvcharobj <- rawToChar(obj)  
con <- textConnection(csvcharobj)  
data <- read.csv(file = con)
Run Code Online (Sandbox Code Playgroud)

现在,由于文件比平时大得多,我收到一个错误

> csvcharobj <- rawToChar(obj)  
Error in rawToChar(obj) : long vectors not supported yet: raw.c:68
Run Code Online (Sandbox Code Playgroud)

阅读这篇文章,我理解向量太长但在这种情况下如何对数据进行子集化?还有其他建议如何处理从S3读取的较大文件?

csv r amazon-s3

9
推荐指数
2
解决办法
3262
查看次数

标签 统计

amazon-s3 ×1

csv ×1

r ×1