Python 中的 Polars DataFrame 内存大小

fvg*_*fvg 12 python memory python-polars

想知道特定极坐标数据帧的大小。我尝试过:

from sys import getsizeof

getsizeof(df)
Out[17]: 48
getsizeof(df.to_pandas())
Out[18]: 1602923950
Run Code Online (Sandbox Code Playgroud)

看来所有的极坐标 df 都是 48 字节?使困惑。

Reg*_*Guy 14

使用该polars.DataFrame.estimated_size()方法我们可以获得类似于 的数据帧的大小pandas.info()

请点击链接


cnp*_*yer 7

Python 包polars只是用polarsRust 编写的底层核心库的包装器。因此,我非常确定当您调用时看到的getsizeofDataFramePythongetsizeof对象在polarsPython 包(在包装层)中实现该类型的结果。

pandas函数df.info()将包含内存使用情况。我实际上也在寻找这个polars

我注意到有一些单独的函数可以获取空计数和模式(#2492),但我无法找到DataFrame从实现中打印 a 的内存使用情况的方法polars

我会在不和谐中提出这个问题。如果我没有过度简化的话,这应该是可行的。