小编Ale*_*rin的帖子

迭代 Pyarrow 表的最快方法

我正在使用 Pyarrow 库来优化 Pandas DataFrame 的存储。我需要尽可能快地逐行处理 pyarrow Table 而不将其转换为 Pandas DataFrame(它不适合内存)。Pandas 有 iterrows()/iterrtuples() 方法。除了 for 循环和索引寻址之外,是否有任何快速迭代 Pyarrow Table 的方法?

pandas pyarrow

6
推荐指数
3
解决办法
3893
查看次数

标签 统计

pandas ×1

pyarrow ×1