堆栈空间溢出ST monad

use*_*968 3 monads haskell lazy-evaluation fold

以下简短的Haskell程序用于计算文件中的项目列表.使用的版本foldl'工作正常,但使用的版本ST Monad给出了堆栈空间溢出消息.显然这里有一些空间泄漏,但我无法解决它.真正有趣的部分是ST monad应该进行就地更新,不应该让资源像这样增长,尽管这可能只涉及主内存而不是堆栈空间.有人能解释一下这里发生了什么吗?

import Control.Monad
import Data.List
import Control.Monad.ST
import Data.STRef

--count items using foldl' 
countFold :: Num a => [b] -> a
countFold = foldl' (\a _ -> a+1) 0

-- count items using the ST monad
-- derived fromt the sumST example on http://www.haskell.org/haskellwiki/Monad/ST
-- only using +1 instead of adding the values
countST :: Num a => [b] -> a
countST xs = runST $ do

    n <- newSTRef 0

    forM_ xs ( \_ -> modifySTRef n (+1) )

    readSTRef n



main = do

    mydata <- readFile "data_files/values_1000000.num"
    let trainingdata = lines mydata

    -- this works just fine
    --(putStrLn (show (countFold trainingdata)))

    -- This fails with the message:
    --   Stack space overflow: current size 8388608 bytes.
    --   Use `+RTS -Ksize -RTS' to increase it.
    (putStrLn (show (countST trainingdata)))  
Run Code Online (Sandbox Code Playgroud)

更新:感谢您的回答和评论.我想我看到这里发生了什么.modifySTRef'是版本4.6中的新功能,可以很好地解决问题并包含有人提到的解释.我正在使用Data.STRef的4.5版,它似乎是Ubuntu的标准版,既不包含解释,也不包含modifySTRef'.

查看4.6软件包版本和函数,不同之处在于它使用seq来确保函数f严格应用(并存储在x'中):

modifySTRef :: STRef s a -> (a -> a) -> ST s ()
modifySTRef ref f = writeSTRef ref . f =<< readSTRef ref

modifySTRef' :: STRef s a -> (a -> a) -> ST s ()
modifySTRef' ref f = do
    x <- readSTRef ref
    let x' = f x
    x' `seq` writeSTRef ref x'
Run Code Online (Sandbox Code Playgroud)

所以解决它的另一种方法是将函数的代码复制到我自己程序空间中的新名称,并将seq应用于泄漏区域,这是我将来可能会使用的一个很好的通用技巧.感谢大家帮助我解决这个问题.

Don*_*art 8

这是一个经典的空间泄漏.

modifySTRef不会强制将其函数参数的应用结果强制为状态.事实上,你无法编写其参数函数来确保严格.

请使用modifySTRef'.