显示Haskell程序的进度

pfe*_*sky 18 haskell functional-programming

我在Haskell中列出了一些对象.我需要找出这些物体中的某个人是否满足某些条件.所以,我写了以下内容:

any (\x -> check x) xs
Run Code Online (Sandbox Code Playgroud)

但问题是检查操作非常昂贵,而且列表非常大.我想在运行时看到当前的进展,例如50% (1000/2000 checked).
我如何做到这一点?

Aad*_*hah 17

由于您希望查看函数的进度(这是函数的副作用),因此最明显的解决方案是使用monad.所以要做的第一件事就是制作一个monadic版本的any函数:

anyM :: (Monad m) => (a -> m Bool) -> [a] -> m Bool
anyM _ []        = return False
anyM pred (x:xs) = reduce (pred x) xs
    where reduce acc []     = acc
          reduce acc (x:xs) = do
              condition <- acc
              if condition
                  then return condition
                  else reduce (pred x) xs
Run Code Online (Sandbox Code Playgroud)

上面的函数anyM是函数的monadic版本any.除了检查给定列表中的任何项是否满足给定谓词之外,它还允许我们产生副作用.

anyM除了执行any如下函数之外,我们还可以使用该函数创建另一个显示进度条作为副作用的函数:

anyVar :: (a -> Bool) -> [a] -> IO Bool
anyVar pred xs = anyM check $ zip [1..] xs
    where check (n,x) = do
            putStrLn $ show n ++ " checked. "
            return $ pred x
Run Code Online (Sandbox Code Playgroud)

请注意,由于我们事先不知道列表的长度,因此我们只显示选中列表中的项目数.如果我们事先知道列表中的项目数,那么我们可以显示更具信息性的进度条:

anyFix :: (a -> Bool) -> Int -> [a] -> IO Bool
anyFix pred length xs = anyM check $ zip [1..] xs
    where check (n,x) = do
            putStrLn $ show (100 * n `div` length) ++ "% (" ++
                show n ++ "/" ++ show length ++ " checked). "
            return $ pred x
Run Code Online (Sandbox Code Playgroud)

将此anyVar函数用于无限列表以及事先不知道其长度的列表.将此anyFix函数用于您事先知道其长度的有限列表.

如果列表很大并且您事先不知道列表的长度,则该length函数将需要遍历整个列表以确定其长度.因此,最好使用它anyVar.

最后要将它包装起来,这就是你将如何使用上述功能:

main = anyFix (==2000) 2000 [1..2000]
Run Code Online (Sandbox Code Playgroud)

在您的情况下,您可以执行以下操作:

main = anyVar check xs
Run Code Online (Sandbox Code Playgroud)

希望这个答案对你有帮助.


dan*_*iaz 12

另一种方法是使用像conduit或的流媒体库pipes.下面是一些使用管道的示例代码,每次列表元素到达时都会打印一个点来检查:

import Pipes
import qualified Pipes.Prelude as P 

bigList :: [Int]
bigList = [1,2,3,4]

check :: Int -> Bool
check = (>3)

main :: IO ()
main = do
    result <- P.any check $ each bigList >-> P.chain (\_ -> putStrLn ".")
    putStrLn . show $ result
Run Code Online (Sandbox Code Playgroud)

(每个都是管道模块的功能.)

现在,如果你想显示百分比,P.chain (\_ -> putStrLn ".")管道的一部分必须更聪明一些.它必须将当前百分比作为状态,并知道列表的长度.(如果你的列表很大并且懒得生成,计算它的长度会强制进行评估并可能导致问题.如果你已经将它放在内存中,那就不会有什么问题了.)

编辑:这是以前代码的可能扩展,实际显示百分比:

{-# LANGUAGE FlexibleContexts #-}

import Pipes
import qualified Pipes.Prelude as P
import Data.Function
import Control.Monad.RWS

bigList :: [Int]
bigList = [1,2,3,4]

check :: Int -> Bool
check = (>3)

-- List length is the environment, number of received tasks is the state. 
tracker :: (MonadReader Int m, MonadState Int m, MonadIO m) => Pipe a a m r
tracker = P.chain $ \_ -> do
    progress <- on (/) fromIntegral `liftM` (modify succ >> get) `ap` ask
    liftIO . putStrLn . show $ progress

main :: IO ()
main = do
    (result,()) <- evalRWST (P.any check $ each bigList >-> tracker)
                            (length bigList) -- list length as unchanging environment
                            0 -- initial number of received tasks (the mutable state)
    putStrLn . show $ result
Run Code Online (Sandbox Code Playgroud)

可以进一步细化以显示仅显着的百分比增加.


Joa*_*ner 7

最天真直接的方法是实现自己的

anyM :: (a -> Bool) -> [a] -> IO Bool
Run Code Online (Sandbox Code Playgroud)

打印进度条(例如,使用terminal-progress-bar).

但请注意,为了计算百分比,您必须评估完整列表.这会破坏懒惰,并且可能对程序的空间行为产生不良和不良影响.

还有一些方法可以使用unsafePerformIOunsafeInterleaveIO允许您监视纯计算(例如any),请参阅bytestring-progress示例.但这是一个可疑的设计,只有当你知道自己了解后果时才应该使用.