按scala中的dateTime排序

r4s*_*sn4 6 scala apache-spark rdd

我有一个RDD [org.joda.time.DateTime].我想在scala中按日期排序记录.

输入 - 应用下面的collect()后的样本数据 -

res41: Array[org.joda.time.DateTime] = Array(2016-10-19T05:19:07.572Z, 2016-10-12T00:31:07.572Z, 2016-10-18T19:43:07.572Z)
Run Code Online (Sandbox Code Playgroud)

预期产出

2016-10-12T00:31:07.572Z 
2016-10-18T19:43:07.572Z   
2016-10-19T05:19:07.572Z
Run Code Online (Sandbox Code Playgroud)

我用google搜索并检查了以下链接但无法理解 -

如何在Scala中定义订购?

有帮助吗?

Ant*_*hyi 8

如果您收集RDD的记录,则可以应用以下排序:

array.sortBy(_.getMillis)
Run Code Online (Sandbox Code Playgroud)

相反,如果您的RDD很大并且您不想将其收集给驱动程序,则应考虑:

rdd.sortBy(_.getMillis)
Run Code Online (Sandbox Code Playgroud)