Yan*_*san 2 scala apache-spark
我想用Option
我的函数的输入类型。
udf((oa: Option[String], ob: Option[String])) => \xe2\x80\xa6\n
处理null
以更实用的方式
有没有办法做到这一点 ?
\n据我所知,这不是直接可能的。没有什么可以阻止你用以下方式包装参数Options
:
udf((oa: String, ob: String) => (Option(oa), Option(ob)) match {
...
})
Run Code Online (Sandbox Code Playgroud)
使用Dataset
编码器:
val df = Seq(("a", None), ("b", Some("foo"))).toDF("oa", "ob")
df.as[(Option[String], Option[String])]
Run Code Online (Sandbox Code Playgroud)
或添加一些隐式转换:
implicit def asOption[T](value: T) : Option[T] = Option(value)
def foo(oa: Option[String], ob: Option[String]) = {
oa.flatMap(a => ob.map(b => s"$a - $b"))
}
def wrap[T, U, V](f: (Option[T], Option[U]) => V) =
(t: T, u: U) => f(Option(t), Option(u))
val foo_ = udf(wrap(foo))
df.select(foo_($"oa", $"ob"))
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
1554 次 |
最近记录: |