当我尝试将我的数据框分组到一列时,然后尝试找到groupbyDatafram.min('timestampCol')它出现的每个分组的最小值我不能在非数字列上进行.那我怎样才能正确过滤groupby上的最小(最早)日期?
groupbyDatafram.min('timestampCol')
我从postgresql S3实例流式传输数据帧,以便已经配置了数据.
sql scala apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
scala ×1
sql ×1