Haskell:并发数据结构指南

Question

Haskell:并发数据结构指南

Cli*_*ton 7 concurrency performance haskell ioref

我一直试图了解并发性,并且我一直在努力找出更好的,一个大IORef锁或许多TVar.我已经达到了以下指导原则,评论将会受到赞赏,关于这些是否大致正确或是否我错过了这一点.

让我们假设我们的并发数据结构是一个地图m,访问类似m[i].让我们说我们有两个功能,f_easy和f_hard.该f_easy快,f_hard需要很长的时间.我们假设参数f_easy/f_hard是元素m.

(1)如果您的交易看起来大致如此m[f_easy(...)] = f_hard(...),请使用IORefwith atomicModifyIORef.懒惰将确保m仅在短时间内锁定,因为它更新了thunk.计算索引有效地锁定了结构(因为某些内容会更新,但我们还不知道是什么),但是一旦知道该元素是什么,整个结构上的thunk就会移动到thunk上,而不是特定元素,然后只有那个特定元素被"锁定".

(2)如果您的交易看起来大致如此m[f_hard(...)] = f_easy(...),并且不要过多冲突,请使用大量的TVars.IORef在这种情况下使用an 将有效地使应用程序成为单线程,因为您无法同时计算两个索引(因为在整个结构中将存在未解决的thunk).TVars允许你同时计算两个索引,但是,否定的是,如果两个并发事务都访问同一个元素,其中一个是写入,则必须废弃一个事务,这会浪费时间(这可能是用于别处).如果这种情况发生了很多,你可能会更好地使用来自(通过黑洞)的锁定IORef,但如果它不会发生很多,你将获得更好的与TVars的并行性.

基本上在情况(2)中,IORef你可以获得100%的效率(没有浪费的工作),但只使用1.1个线程,但TVar如果你的冲突数量很少,你可能会获得80%的效率,但使用10个线程,所以你仍然结束即使浪费了工作,也要快7倍.

Answer 1

Pet*_*ter 5

您的指南有点类似于[1](第6节)的结果,其中分析了Haskell STM的性能:

"特别是,对于在事务中没有执行太多工作的程序,提交开销似乎非常高.为了进一步观察这种开销,需要对提交时间过程的性能进行分析 - 细粒度和细粒度STM锁定机制."

我使用atomicModifyIORef或者MVar当我需要的所有同步是简单锁定将确保的东西.在查看对数据结构的并发访问时,还取决于如何实现此数据结构.例如,如果您将数据存储在一个IORef Data.Map并经常执行读/写访问,那么我认为atmoicModifyIORef会降低到单个线程性能,正如您所猜测的那样,但对于a来说也是如此TVar Data.Map.我的观点是,使用适合并发编程的数据结构很重要(平衡树不是).

也就是说,在我看来,使用STM的获胜论点是可组合性:您可以将多个操作组合成单个事务而不会头疼.通常,使用IORef或MVar不使用新锁是不可能的.

[1]软件事务内存(STM)的限制:在多核环境中剖析Haskell STM应用程序. http://dx.doi.org/10.1145/1366230.1366241

回答@克林顿的评论:

如果单个数据IORef包含您的所有数据,您只需使用atomicModifyIORef合成.但是,如果您需要处理大量对该数据的并行读/写请求,则性能损失可能会变得很严重,因为对该数据的每对并行读/写请求都可能导致冲突.

我尝试的方法是使用一个数据结构,其中条目本身存储在一个内容中TVar(vs将整个数据结构放入一个数据结构中TVar).这应该减少活锁的可能性,因为交易不会经常发生冲突.

当然,您仍然希望尽可能减少事务处理,并且只有在绝对必要时才使用可组合性来保证一致性.到目前为止,我还没有遇到过将多个插入/查找操作组合到单个事务中的情况.

归档时间：	14 年，1 月前
查看次数：	842 次
最近记录：	8 年前