当(取消)分配在 C 中管理时,Haskell 运行时中的垃圾收集器问题

acl*_*low 11 garbage-collection haskell ffi

我想使用 Haskell 的 FFI 功能在 C 和 Haskell 之间共享数据(在最简单的情况下是整数数组)。C 端创建数据(相应地分配内存),但在它被释放之前永远不会修改它,所以我认为以下方法是“安全的”:

  • 创建数据后,C 函数传递数组的长度和指向其开头的指针。
  • 在 Haskell 方面,我们创建了一个ForeignPtr,设置了一个调用释放指针的 C 函数的终结器。
  • 我们Vector使用可以(不可变地)在 Haskell 代码中使用的外部指针构建一个。

但是,使用这种方法会导致相当不确定的崩溃。小例子倾向于工作,但“一旦在GC踢”,我开始得到分段错误的各种错误,以“BARF” S在行GHC的GC的“疏散”的一部分。

我在这里做错了什么?做这样的事情的“正确方法”是什么?

一个例子

我有一个带有以下声明的 C 头文件:

typedef struct CVector {
    const int32_t *pointer;
    size_t length;
} Vector;

void create_c_vector(struct CVector *vector);
void free_buffer(void *buff);
Run Code Online (Sandbox Code Playgroud)

Haskell 代码是.chs使用c2hs从以下文件生成的:

import Foreign.C.Types
import Foreign.Concurrent
import Foreign.Marshal.Alloc
import Foreign.Ptr
import Foreign.Storable

import qualified Data.Vector.Storable as V

#include <cvector.h>


data ForeignVector = ForeignVector
  { pointerFV  :: Ptr CInt
  , lengthFV   :: CULong
  }

instance Storable ForeignVector where
  sizeOf _ = {#sizeof CVector #}
  alignment _ = {#alignof CVector #}
  peek p =
    ForeignVector
      <$> {#get CVector->pointer #} p
      <*> {#get CVector->length #} p
  poke p (ForeignVector vecP l) =
    do {#set CVector.pointer #} p (castPtr vecP)
       {#set CVector.length #} p l

peekUnit :: Storable a => Ptr () -> IO a
peekUnit = peek . castPtr

{#fun create_c_vector as ^ { alloca- `ForeignVector' peekUnit*} -> `()' #}
{#fun free_buffer as ^ { `Ptr ()' } -> `()' #}

fromForeign :: ForeignVector -> IO (V.Vector CInt)
fromForeign (ForeignVector p l) =
  V.unsafeFromForeignPtr0
    <$> newForeignPtr p (freeBuffer . castPtr $ p)
    <*> pure (fromIntegral l)

createVector :: IO (V.Vector CInt)
createVector = fromForeign =<< createCVector
Run Code Online (Sandbox Code Playgroud)

一个特殊的测试我没有产生internal error: evacuate: strange closure type 177后几千调用createVector

PS:这就是为什么我想使用Foreign.Concurrent.newForeignPtr 而不是更“标准”的原因 Foreign.ForeignPtr.newForeignPtr:在我预期的一些更复杂的情况下,在释放指针的同时还应该清理其他可能依赖于从 Haskell 传递的参数的东西。因此,我想要一个“具有多个参数的终结器”,并将部分应用程序作为实际终结器传递。这意味着我不能使用指向 C 函数的指针作为终结器。虽然我读过可以FinalizerPtr使用“包装”机制从 Haskell 函数中编写终结器所需的内容,但根据文档,以这种方式获得的函数指针需要显式释放,freeHaskellFunPtr我不想做簿记为了那个原因。

PPS:这是一个 base64 编码的 tarball,其中包含上述示例的完整源代码(包括重现上述错误的可执行文件的代码):

H4sIAAAAAAAAA+1Ze1PbOhbv3/oUZ0JnSQAb50VmeM1QKNvMwIUpLZ2dbjdRbDnx4liuZAO5vXz3
PUd+hAS4LC2XbmejYYitc3Se0u9Isu8HVqB1KqzxlbAcu27X13kcr796xuZg67Tb5hfb/K95rrec
dqPptFtO85VTb9abzVfQfk4jHmqpTrhCU35Uzrxzv0jz78m/GwaD55wAT8j/xkazTflvdFqL/L9E
uy//Wrk/Z/03Njr4Y9Z/e7H+X6Q9lP/jT2+fbQ781/lvNTbwj/K/4Szy/yLtz/J/KJUIhtG5cBOp
bHekv1MHxWOj1Xoo/41mcz7/HdwIvIIXCeL/ef7H0ktDAZhueybdcDUSSjAWjGOpEshp9r79YRIL
fadbRm6qlIgSZlkwR8x/TxM1P+yYKz3iob0XhtKdJ97Df4aG8UE4NetrysPAD4QHBzzhdj5TCzbg
Gs4ZWwoiN0w9AdvuZcYw2mWMeTgCZn3emX1nAN8glkGUCHV4DrC5CWgU7HfRTYA1CEU0TEZEIdL+
xyMZDZFwg+ZFOKsiV0Bpyn3BBdDB7+LEhx5q/rZEL9KH/Zxn6QYZ0L1hNMa45jzmfZ4pFuICYtjB
R7jjAbXt17s4diiSYpy1m7uFAiAuuFbucGUeFkyxvBCopzrrC8b0FMJart6T5MlUhn1bEVRdrhOK
IQ2q5XrnBtzSCSFj5NzHKEgoxNPEws6uyUW1BtYudE+ATxl3soDYkCtj7NuSn0bgKsET0XN72Syg
2fEvTDCnycct6M+4tQyFvJUbUtGv1pYp2pkoXwnRG6S+L0ox/cycZZhhZ34mtFgTrovqoKITD/fY
9gj+RpIqGAj3EB/Ix8M0MpLoH8+dq9ZqKEnJcW6i4ZtJQs53ni8BM0drM0PmshYXKTu300hzXxxO
eVG1w4p5E4mraTelkCx+k7lehhheQ4yZsECqzbkRmWPZHKMZFqdKkBA5RhPFUPEQLWEsS05uHLp3
jzczLDtw27md7e08vfksYj8bV3+Vdl/9p/P/MQ8i+7sr/mx7pP7X662N4vxXbzjIV281286i/r9E
K+o/pnuu5N/ZEpQUrPaJkqF9IER8Jr7Odx/LiHtFp6nLR4FOHtlJnE10IsZ29+RptZ3pIAwnZ+nY
YAaWyQwITYkuSZEBOl+GXrgM1X/CNUyIr3oNqzCpQR9j0Idmu1OvgUOYZ7BKiTgMXESUYxyPUFQM
X82Z4DYcIYCNKYI5cNWyN9KK9fAStq0Z7qzujU7T5CxRRxFgNRCKMLSyb7g8yCrUJlRgdRX0SF7B
5QODKr8h0QgPoiFg9ZOXVJMiL38Y0jq27Uo2XIuvqcB9Sa8ovZ/JQE0GTqNV0LIR0PcwzTiwj8oV
1vJCc8n3BwYIBXyuO84aNBwHbBvw2flSMHxZoPH/bLsP/2f6bJcPePhDOh7D/412vTz/tZuE/3j8
by7w/yWaya6FUKEDGW0Cpr/B6Az3YRRo8AME2hEi7UCICIYiEsrAE229IObuBR8Ke8LHIQwmMKIO
yCWBYzdbdstGUSRNC7EJoySJ9eb6+jBIRunAduV4Xctw3YxjLOJj5Jm2mUnISgPzZiYq05NIxjrQ
RfcejIMoGOOW8kqqCwJEcc3HMTrh034/gsPDLhihDLFdRHqq8TQdYNeBJOBmgzQIPSvB+pTRzwIS
wsR1orilZapcYVFs9KaBuPdv9w6O39pjz7yZ2/PypHm3y2WofKC4miBNXMdSC8/KynAuD+6pvQAy
wfI8z3jKk5HuYax6xq0exQqrhC6s9AJV8mrl4tNw5FoyTjCYGDbrpAHWJzqSWMOGMYc8zMwLplpy
0/Etj4yU4ZTYGOmS4olYRF5JG3AtzOMalCI84fM0TKyQR8MUJ9AmvOP6QoRhw6k7DIMs3DQxJX4W
mwYBVRzKj0UZv7VJfVpwHg4AWCrRSNJ34vL9bufFM3+bndRPCsxftP7vw/9yPj+Tjkf3/5329PtP
q2Puf7EkLPD/BdqSwcQuzQA4zsHzUw6ebzPwZMwUg1jJf+NUxWk6xqWTUCXQwHHvyfUIcLf793f7
yxqGXA1w7oIrwzA7qSMJuYRKaEuMyphG5EV4kTbrJtPqgtKotFxhcYCzJKstcPThDOodrEk2Y0tL
8IYWG1rG2EkkIBLC05DIbA0CIgDsQw6tKJNuXjIS+ULUfDlh5VLJGp52AncELke4F7gLjsSaqRJ5
xVijkqbSKCJ1/X6fDV0XLD3iCo20JOkpAF1LsPzT7j5MEZ4GoLektE/g3wcEYkOc2GS8K+bMxfji
Ht6brM0amoccjUSHjDMJpJr8qdAFo8eVxwwqVVDShcgCB3RjQmU9C9r73AnWjZCCW3cTMjxAEcTi
IzpplCK+kiX9O6jbXwN5O9xxmtAANu8ZFB6/PjroHXXfvN97/4/e6d6Hd30Q0WWg8HhobjIvMfmk
3F4cC35+e/D7f7mD+XEdj+C/06yX3/+x1NUR/9vIv8D/l2jTjyN4rMfTPX0bmekz99S7jNFuGHco
ePpXqVve1sO3bINLFQHXf9Js9BJYye/8twyNPmtgZ3atv8VuIBu5xdilDLz5W/nqnPyVrLu2lXHf
univmo4VekHqz47jr9oeXf/uj+t4bP1v4Jm/uP/tdOj83647ncX6f4lWrvVKCfiVp61MAwEzixx2
oNWgxV8CAi1S7K2WHTU8yNF3t2qrASuQffksqLWaGetD1aztHGJyDQGKcTJgod1adQt7tgtwgWB1
teCno5nvfw6+4IAgG3Bj/l/OfQHdMYxbM7TSjwK1cDCIUItc+F0Zv308OnpAhjH3ht2wP4UwI5lo
1RzRbhaYtmiLtmh/afsPAHfp2gAuAAA=
Run Code Online (Sandbox Code Playgroud)

Jon*_*rdy 3

复制并扩展了我之前的评论

\n

您可能有错误的演员表或poke。我强调做的一件事,无论是作为防御指南还是在调试时,都是这样的:

\n

显式注释所有可能破坏类型的事物的类型。这样,您始终知道您\xe2\x80\x99 得到了什么。即使pokecastPtr、 或现在unsafeCoerce具有我想要的类型,在代码移动下也可能不稳定。即使这不能识别问题,它至少可以帮助思考问题。

\n

例如,我曾经将一个空终止符写入字节缓冲区\xe2\x80\xa6,这通过写入超出末尾而损坏了相邻内存,因为我使用的是 ,它不是\'\\NUL\'char而是Char\xe2\x80\x9432 位!原因是它pokeByteOff是多态的:它具有类型(Storable a) => Ptr b -> Int -> a -> IO ()而不是\xe2\x80\xa6 => Ptr a -> \xe2\x80\xa6

\n

事实证明,您的代码就是这种情况!引用@aclow

\n
\n

c2hs生成createVector的 相当于alloca $ \\ ptr -> createCVector\'_ ptr >> peek ptr, where createCVector\'_ :: Ptr () -> IO (),这意味着alloca仅分配足够的空间来容纳一个单元。将 in-marshaller 更改为alloca\' f = alloca $ f . (castPtr :: Ptr ForeignVector -> Ptr ())似乎可以解决该问题。

\n
\n

事实证明并非如此,但可能\xe2\x80\x99 是:

\n

当某人(读:我)在数组之外写入内容而损坏闭包时,我\xe2\x80\x99遇到了类似的崩溃。如果您\xe2\x80\x99 在没有进行边界检查的情况下进行任何写入,则将它们替换为经过检查的版本可能会有所帮助,以查看是否可以获得异常而不是堆损坏。在某种程度上,这就是这里发生的情况,只不过写入的是alloca分配的区域,而不是数组。

\n

或者,考虑生命周期问题:是否可能ForeignPtr会比您预期更早地删除并释放缓冲区,从而为您提供释放后使用。在一个特别令人沮丧的情况下,我\xe2\x80\x99ve不得不使用这个原因来touchForeignPtr保持活力。ForeignPtr

\n