如何使用scala从dataframe获取字符串列的最大长度?

Jho*_*hon 4 scala max apache-spark apache-spark-sql

这可能是一个非常简单的问题.我使用Spark 1.6与scala

var DF=hivecontext.sql("select name from myTable")
val name_max_len =DF.agg(max(length($"name"))) // did not work

println(name_max_len)
Run Code Online (Sandbox Code Playgroud)

我怎样才能获得最大长度?

谢谢
侯赛因

小智 10

你应该收集结果:

import org.apache.spark.sql.functions.max

val df = Seq("foo", "bar", "foobar").toDF("name")
df.agg(max(length($"name"))).as[Int].first
// res0: Int = 6
Run Code Online (Sandbox Code Playgroud)