在pyspark中使用agg在同一列上进行多个聚合

sub*_*bro 3 pyspark

我无法使用 agg 获取多个指标,如下所示。

table.select("date_time")\
    .withColumn("date",to_timestamp("date_time"))\
    .agg({'date_time':'max', 'date_time':'min'}).show()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

我看到第二个聚合覆盖了第一个聚合,有人可以帮助我在同一列上获得多个聚合吗?

sop*_*les 5

我无法复制并确保它有效,但我建议不要使用 adict进行聚合,而是像这样尝试:

table.select("date_time")\
    .withColumn("date",to_timestamp("date_time"))\
    .agg(min('date_time'), max('date_time')).show()
Run Code Online (Sandbox Code Playgroud)