我是Apache Spark的新手,我知道核心数据结构是RDD.现在我正在编写一些需要元素位置信息的应用程序.例如,在将ArrayList转换为(Java)RDD之后,对于RDD中的每个整数,我需要知道它的(全局)数组下标.有可能吗?
据我所知,RDD 有一个take(int)函数,所以我相信位置信息仍然保留在RDD中.
我想将所有线程分成两个不同的组,因为我有两个并行的任务来异步运行.例如,如果有8个线程可用,我会想要6个专用于task1的线程,另外2个专用于task2.
如何使用OpenMP实现这一目标?