通过列举所有可能的解决方案然后找到最佳解决方案,我有一个似乎可以解决的问题.为了做到这一点,我设计了一个回溯算法,如果找到,它会枚举并存储最佳解决方案.它到目前为止工作正常.
现在,我想将此算法移植到CUDA.因此,我创建了一个生成一些不同基本案例的过程.这些基本情况应该在GPU上并行处理.如果其中一个CUDA线程找到了最佳解决方案,那么所有其他线程当然可以停止工作.
所以,我想要以下类型:找到最佳解决方案的线程应该停止我程序的所有正在运行的CUDA线程,从而完成计算.
经过一些快速搜索后,我发现线程只能在同一个块中进行通信.(所以我认为不可能阻止其他人阻止线程.)
我能想到的唯一方法是我有一个专用标志optimum_found
,在每个内核的开头检查.如果找到最佳解决方案,则将此标志设置为1
,因此所有未来的线程都知道它们不必工作.但是,当然,如果在每次迭代时都没有检查它,那么已经运行的线程就不会注意到这个标志.
那么,是否有可能停止所有剩余的CUDA线程?
我认为如果它是全局内存中的内存位置,那么拥有专用标志的方法可以工作.这样你可以在每次内核调用开始时检查这一点.
内核调用通常应该相对较短,因此即使其中一个线程找到最佳解决方案也不会影响您的性能,因此让批量中的其他线程完成.
也就是说,我很确定没有可以杀死其他正在执行的线程的CUDA调用.