小编Phi*_*hil的帖子

仅当变量等于某个值(20Gb+ csv 文件)时,如何从 csv 文件中读取行

我有一个大约 25Gb 的 csv 文件。我有 64GB 的内存。虽然我的 ram 可以处理这个大文件,但它需要太长时间。此外,我不需要数据中的每一行。所以我想知道

  1. 如果可以只读取第二列等于某个值的行
  2. 此外,我想知道它是否真的会节省时间。因为我猜软件还是会读入整个文件,然后把不满足条件的行去掉。

我更喜欢使用Stata。R和python也不错。

python csv r stata

2
推荐指数
1
解决办法
276
查看次数

标签 统计

csv ×1

python ×1

r ×1

stata ×1