pymc3:njobs> 1与GPU的并行计算

vol*_*myr 5 theano pymc pymc3

我试图用并行化加速pymc3采样,我看到只有适度的好处.

在i7 MacBook Pro上,我能够将总运行时间从25分钟(njobs = 1)减少到13分钟(njobs = 6).由于在pymc实际开始采样之前需要大约4分钟,因此增加相对较小.

问题是 - 是否有人成功地使用带有pymc3的GPU以及需要6-8分钟采样的模型可以获得多少好处?(我的MacBook有nvidia GT 750M 2Gb)

inv*_*ion 6

我在Intel i7-4930上运行Linux.

我运行了一个PyMC3模型,在CPU上花了90分钟(利用所有核心),但我的GeForce GTX 970只用了18分钟.

所以速度提高了近5倍.

  • 你能发布一个显示这种加速度的示例代码吗?我一直在玩分布中的例子,无论是使用CPU还是GPU,我都会得到相同的时间...... (2认同)