小编PK1*_*123的帖子

将 Pandas DataFrame 序列化为内存缓冲区表示

将 DataFrame 序列化为内存中表示的最快方法是什么?根据一些研究,人们似乎普遍认为Apache Feather格式是大多数指标中最快的可用格式。

我的目标是获取 DataFrame 的序列化字节 - Feather 的唯一问题是我想避免写入磁盘和从磁盘加载的开销,并且 Feather API 似乎只允许文件 I/O。我是否应该为此寻找不同的格式,或者Python中是否有一种方法可以“伪造”文件,强制 Feather 写入内存缓冲区?

python dataframe pandas feather

2
推荐指数
1
解决办法
1457
查看次数

标签 统计

dataframe ×1

feather ×1

pandas ×1

python ×1