如何确保Java线程在不同的核心上运行

KBP*_*KBP 13 java multithreading multicore knapsack-problem

我正在用Java编写一个多线程应用程序,以提高顺序版本的性能.它是0/1背包问题的动态编程解决方案的并行版本.我有一个Intel Core 2 Duo,在不同的分区上同时使用Ubuntu和Windows 7 Professional.我在Ubuntu中运行.

我的问题是并行版本实际上需要比顺序版本更长的时间.我想这可能是因为线程都被映射到同一个内核线程或者它们被分配到同一个核心.有没有办法确保每个Java线程映射到一个单独的核心?

我已经阅读了有关此问题的其他帖子,但似乎没有任何帮助.

这是KnapsackThread类(扩展Thread)的main()和run()的结束.请注意,我使用slice和extra来计算myLowBound,myHiBound确保每个线程不会在dynProgMatrix的域中重叠.因此没有竞争条件.

    dynProgMatrix = new int[totalItems+1][capacity+1];
    for (int w = 0; w<= capacity; w++)
        dynProgMatrix[0][w] = 0;
    for(int i=0; i<=totalItems; i++)
        dynProgMatrix[i][0] = 0;
    slice = Math.max(1,
            (int) Math.floor((double)(dynProgMatrix[0].length)/threads.length));
    extra = (dynProgMatrix[0].length) % threads.length;

    barrier = new CyclicBarrier(threads.length);
    for (int i = 0; i <  threads.length; i++){
        threads[i] = new KnapsackThread(Integer.toString(i));
    }
    for (int i = 0; i < threads.length; i++){
        threads[i].start();
    }

    for (int i = 0; i < threads.length; i++){
        try {
            threads[i].join();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

public void run(){
    int myRank = Integer.parseInt(this.getName());

    int myLowBound;
    int myHiBound;

    if (myRank < extra){
        myLowBound = myRank * (slice + 1);
        myHiBound = myLowBound + slice;
    }
    else{
        myLowBound = myRank * slice + extra;
        myHiBound = myLowBound + slice - 1;
    }

    if(myHiBound > capacity){
        myHiBound = capacity;
    }

    for(int i = 1; i <= totalItems; i++){
        for (int w = myLowBound; w <= myHiBound; w++){

            if (allItems[i].weight <= w){
               if (allItems[i].profit + dynProgMatrix[i-1][w-allItems[i].weight]
                        > dynProgMatrix[i-1][w])
                {
                    dynProgMatrix[i][w] = allItems[i].profit +
                                      dynProgMatrix[i-1][w- allItems[i].weight];
                }
                else{
                    dynProgMatrix[i][w] = dynProgMatrix[i-1][w];
                }
            }
            else{
                dynProgMatrix[i][w] = dynProgMatrix[i-1][w];
            }
        }
        // now place a barrier to sync up the threads
        try {
            barrier.await(); 
        } catch (InterruptedException ex) { 
            ex.printStackTrace();
            return;
        } catch (BrokenBarrierException ex) { 
            ex.printStackTrace(); 
            return;
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

更新:

我写了另一个使用蛮力的背包版本.这个版本的同步很少,因为我只需要在单个线程的执行结束时更新bestSoFar变量.因此,每个线程几乎应该完全并行执行,除了最后的那个小关键部分.

我对此顺序蛮力运行,但仍然需要更长时间.我没有看到任何其他解释,因为我的线程正在顺序运行,因为它们被映射到相同的核心或相同的本机线程.

有人有任何见解吗?

Jon*_*eet 21

我怀疑它是由于为所有线程使用相同的核心.调度由操作系统决定,但如果您启动操作系统的性能管理器,您应该能够看到正在发生的事情 - 它通常会显示每个内核的繁忙程度.

延长时间的可能原因:

  • 大量同步(必要或不必要)
  • 这些任务耗时很短,以至于线程创建占用了很大一部分时间
  • 上下文切换,如果您创建了太多线程 - 对于CPU密集型任务,请创建与内核一样多的线程.

  • @Carl:我们还没有真正看到足够的代码来了解.我们不知道`threads`数组有多大,除非我错过了什么. (2认同)

小智 6

我有一段时间遇到同样的问题.我有一个CPU饥饿的程序,我分为2个线程(双核CPU),但一个美好的一天,处理更多的数据,它只是停止使用两个核心.我刚刚提高了堆内存大小(-Xmx1536m在我的情况下),它再次正常工作.