是否可以将大 .rds 或 .feather 文件的子集导入到 R 中?

Thi*_*ago 1 import r feather

我找到了有关将文件快速导入 R 的好技巧,但我想知道是否可以仅将给定文件的子集导入到变量中。

就我而言,我有一个包含 1600 万行的文件,保存为 .rds(也保存为 .feather,因为我正在尝试两种格式的速度),并且我想导入其中的一个子集(例如,一些行或几列)进行初始分析。

是否可以?readRDS() 似乎不接受任何子集,而 read_feather() 似乎不允许行选择(尽管您可以指定列)。我应该考虑其他数据格式吗?

Thi*_*ago 6

最简洁的答案是不'。一个不错的替代方案是fst文件格式,它允许从大型数据集中检索选定的列和行。更多信息请点击这里