r4s*_*sn4 6 scala apache-spark rdd
我有一个RDD [org.joda.time.DateTime].我想在scala中按日期排序记录.
输入 - 应用下面的collect()后的样本数据 -
res41: Array[org.joda.time.DateTime] = Array(2016-10-19T05:19:07.572Z, 2016-10-12T00:31:07.572Z, 2016-10-18T19:43:07.572Z)
Run Code Online (Sandbox Code Playgroud)
预期产出
2016-10-12T00:31:07.572Z
2016-10-18T19:43:07.572Z
2016-10-19T05:19:07.572Z
Run Code Online (Sandbox Code Playgroud)
我用google搜索并检查了以下链接但无法理解 -
有帮助吗?
如果您收集RDD的记录,则可以应用以下排序:
array.sortBy(_.getMillis)
Run Code Online (Sandbox Code Playgroud)
相反,如果您的RDD很大并且您不想将其收集给驱动程序,则应考虑:
rdd.sortBy(_.getMillis)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3250 次 |
| 最近记录: |