小编Kep*_*ain的帖子

是否如预期的那样,Polars 对于简单算术运算的性能比 Numpy 慢?

我进行基准测试的任务只是按元素裁剪值。我已经使用numpy和完成了此操作polars。但是,事实证明,使用numpy比使用要快得多(~5 倍)polars(如下所示)。

所以,我的问题是:

  • 这种行为是否符合预期?
  • 如果是这样,这是否意味着polars(尽管它针对 join/groupby 进行了高度优化),可能不太适合执行相对简单的数值向量/数组操作,例如我的示例中的裁剪?
import timeit
import numpy as np
import polars as pl

N = 10_000_000
x = np.random.normal(size=N)
y = np.random.normal(size=N)
z = y + 0.5
df = pl.DataFrame({"x": x, "y": y, "z": z})

>>> timeit.timeit(lambda: np.minimum(np.maximum(x, y), z), number=10)
0.60923

>>> timeit.timeit(lambda: df.select(pl.min(pl.max(pl.col("x"), pl.col("y")), pl.col("z"))), number=10)
3.39337
Run Code Online (Sandbox Code Playgroud)

numpy python-polars

1
推荐指数
1
解决办法
225
查看次数

标签 统计

numpy ×1

python-polars ×1