Haskell中的快速数据结构

Question

Haskell中的快速数据结构

我发现在containers包中的关键数据结构中,Data.Map或者Data.IntMap是在纯Haskell中实现的.问题:我想知道,实施它们会不会更有效率C？我知道ghc非常好,但绝对不能与优化的C代码竞争.

Answer 1

这是一个有趣的问题,但我不确定任何人都能够以某种方式提供任何结论性答案(除了设计和构建一个广泛的测试套件并生成大量数字).

这个问题背后的假设似乎是"C总是很快,Haskell总是很慢,所以用C而不是Haskell编写代码不是更好吗？" 我不确定这个假设是否真实准确.(在我有限的经验中,并不是说Haskell 很慢,而是Haskell 可能很慢 - 或者非常快 - 而且预测你将获得什么样的速度是很尴尬的.)

通过FFI调用C会产生开销.Haskell数据结构由垃圾收集器处理; 通过C使用的内存必须手动管理.你在这里看到了相当多的努力,可能没有你想象的那么多.

由于可变性,C数据结构往往更有效.大多数人不想在Haskell中使用可变数据结构.(在某种意义上,它首先否定了使用Haskell的所有好处,所以为什么要麻烦？)如果你在C中使用不可变数据结构,你甚至可能会发现它比Haskell慢.(例如,我被告知C在动态内存分配方面相当慢,这对于持久数据结构来说是一个问题.另一种方法是复制整个地方的东西,这也不会很快.)

最重要的是,GHC会进行巧妙的优化,例如砍伐森林,这有时会导致容器在运行时完全消失.C编译器永远不会做这样的事情.而哈斯克尔,作为一种懒惰的语言,有时可以完全跳过你要求它做的工作; 如果容器是用C实现的,这将无效.

总而言之,它"看起来"在C中实现这些东西应该"显然"要快得多.实际上,我怀疑答案并不是那么明确.

Answer 2

Don*_*art 5

GHC的运行时优化用于有效分配不可变结构.它通常会在此任务中击败C运行时(malloc).因此,C主要用于优化算法,而不是数据结构.一个例外是非常低级别的数据结构或高度可调的可变结构.

归档时间：	13 年，4 月前
查看次数：	862 次
最近记录：	13 年，4 月前