PySpark:如何获取数据帧中列的最大绝对值?

kww*_*kww 5 pyspark pyspark-sql

假设我有

+----+---+
|  v1| v2|
+----+---+
|-1.0|  0|
| 0.0|  1|
| 1.0|  2|
|-2.0|  3|
+----+---+
Run Code Online (Sandbox Code Playgroud)

我想获得列的最大绝对值v1,这是2.0。谢谢!

Psi*_*dom 5

aggmaxand absfrom 一起使用pyspark.sql.functions

import pyspark.sql.functions as F
df.agg(F.max(F.abs(df.v1))).first()[0]
# 2
Run Code Online (Sandbox Code Playgroud)