小编joj*_*ojo的帖子

寻找一种计算spark/scala中数据帧频率分布的方法

我想使用spark和scala计算数据帧的频率分布(返回每列中最常见的元素及其出现的次数).我已经尝试过使用DataFrameStatFunctions库但是在我仅为数字类型列过滤数据帧之后,我无法应用库中的任何函数.这是创建UDF的最佳方法吗?

scala apache-spark

2
推荐指数
1
解决办法
4533
查看次数

标签 统计

apache-spark ×1

scala ×1