如何在RStudioServer中作为数据集直接访问AWS S3存储桶?

Jos*_*ard 3 r amazon-s3 amazon-ec2 rstudio-server

我的aws帐户上有多个s3存储桶,也有运行Rstudio Pro的EC2计算机。我想访问我的S3存储桶(每个存储桶有几个TB的数据)。

我希望能够设置rstudio来将桶安装为数据集,而不必在每次读取前都将整个内容复制到EBS中。

任何帮助都会很棒。

小智 5

看来你可以试试aws.s3从包装cloudyr项目https://github.com/cloudyr/aws.s3

这样,假设您将数据存储在专用存储桶中,则可以按以下方式访问它:

aws.s3::getbucket(
bucket = 'hpk',
key = YOUR_AWS_ACCESS_KEY,
secret = YOUR_AWS_SECRET_ACCESS_KEY
)
Run Code Online (Sandbox Code Playgroud)

希望这将帮助您从存储桶访问数据。然后,您也可以尝试aws.ec2与您的ec2机器通信。