小编Aks*_*hay的帖子

在极坐标中使用数据框名称和 pl.col() 选择列之间的区别

我对 Polar 还比较陌生。我对其运作有一些疑问。我可以在 Polars 中执行这样的操作,

df = df.with_columns(((pl.col("netsales")/pl.col("sold_quantity")).alias("net_div"))
Run Code Online (Sandbox Code Playgroud)

同样可以使用以下方法实现,

df = df.with_columns((df["netsales"]/df["sold_quantity"]).alias("net_div"))
Run Code Online (Sandbox Code Playgroud)

就性能而言,它们之间有什么区别吗?

还,

df = df.with_columns((df["netsales"]/df["sold_quantity"]).alias("net_mul"),
(df["netsales"]+df["sold_quantity"]).alias("net_add")
)
Run Code Online (Sandbox Code Playgroud)

上述操作可以像这样单独完成,

df = df.with_columns((df["netsales"]/df["sold_quantity"]).alias("net_mul"))
df = df.with_columns((df["netsales"]+df["sold_quantity"]).alias("net_add"))
Run Code Online (Sandbox Code Playgroud)

上述两种方式执行相同的操作在性能上有什么区别吗?我在网上找不到与此相关的任何答案或文档。如果您能分享一些这方面的知识,我将感谢您的支持。

dataframe python-polars

3
推荐指数
1
解决办法
95
查看次数

标签 统计

dataframe ×1

python-polars ×1