UsA*_*R33 5 filesystems amazon-s3 s3fs
我在 s3 中存储大型数据集,但在集群中的给定计算机上,我的程序只需要读取一小部分数据。
我首先尝试了 s3fs,但它首先下载整个文件,这需要很长时间。
是否有任何 s3 支持的文件系统使用 S3 API字节参数,以便内部读取(和搜索)命令仅读取文件的所需部分?
作为一个实际示例,如果我运行:
尾-c 1024巨大的文件_on_s3
只应请求最后 1kb(通过 bytes 参数),这意味着我应该很快得到结果。
(我不关心写回 S3;只从它读取)