Alp*_*pha 4 python generator dataframe pandas parquet
是否可以使用生成器打开镶木地板文件并逐行迭代?这是为了避免将整个镶木地板文件加载到内存中。
文件的内容是pandas DataFrame。
小智 7
您不能按行迭代,因为它不是存储方式。您可以按如下方式遍历行组:
from fastparquet import ParquetFile pf = ParquetFile('myfile.parq') for df in pf.iter_row_groups(): process sub-data-frame df
归档时间:
7 年,8 月 前
查看次数:
1703 次
最近记录:
4 年,8 月 前