相关疑难解决方法(0)

在pyspark中groupBy之后的列别名

我需要在下面一行中得到的数据框,在groupBy之后的max('diff')列中有一个别名"maxDiff".但是,下面的行不做任何改变,也不会抛出错误.

 grpdf = joined_df.groupBy(temp1.datestamp).max('diff').alias("maxDiff")
Run Code Online (Sandbox Code Playgroud)

python scala apache-spark apache-spark-sql pyspark

21
推荐指数
3
解决办法
4万
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

pyspark ×1

python ×1

scala ×1