将导管与多个输入融合

Ben*_*son 9 haskell conduit

我正在尝试创建一个可以使用多个输入流的管道.我需要能够在没有特定顺序(例如,不交替)的情况下等待输入流中的一个或另一个,使得zip无用.这里没有任何平行或不确定的东西:我等待一个流或另一个流.我希望能够编写类似于以下的代码(分别在第一个或第二个输入流上的where awaitAawaitBawait):

do
  _ <- awaitA
  x <- awaitA
  y <- awaitB
  yield (x,y)
  _ <- awaitB
  _ <- awaitB
  y' <- awaitB
  yield (x,y')
Run Code Online (Sandbox Code Playgroud)

我所拥有的最好的解决方案是使内部monad成为另一个导管,例如

foo :: Sink i1 (ConduitM i2 o m) ()
Run Code Online (Sandbox Code Playgroud)

然后允许

awaitA = await
awaitB = lift await
Run Code Online (Sandbox Code Playgroud)

这主要是有效的.不幸的是,这似乎使得在外导管完全连接之前很难熔化到内导管.我尝试的第一件事是:

fuseInner :: Monad m =>
                Conduit i2' m i2 -> 
                Sink i1 (ConduitM i2 o m) () -> 
                Sink i1 (ConduitM i2' o m) ()
fuseInner x = transPipe (x =$=)
Run Code Online (Sandbox Code Playgroud)

但这不起作用,至少在x有状态因为(x =$=)多次运行,x每次都有效地重启.

是否有任何方法可以编写fuseInner,而不是闯入导管的内部(看起来它会非常混乱)?有没有更好的方法来处理多个输入流?我是否只是远远超出了导管设计的范围?

谢谢!

Pet*_*lák 3

如果您想合并两个IO生成的流,那么 Gabriel 的评论就是解决方案。

否则,您将无法等待两个流,哪个流先产生一个值。管道是单线程且确定性的 - 它一次仅处理一个管道。但是您可以创建一个交错两个流的函数,让它们决定何时切换:

{-# OPTIONS_GHC -fwarn-incomplete-patterns #-}
import Control.Monad (liftM)
import Data.Conduit.Internal (
    Pipe (..), Source, Sink,
    injectLeftovers, ConduitM (..),
    mapOutput, mapOutputMaybe
  )

-- | Alternate two given sources, running one until it yields `Nothing`,
-- then switching to the other one.
merge :: Monad m
      => Source m (Maybe a)
      -> Source m (Maybe b)
      -> Source m (Either a b)
merge (ConduitM l) (ConduitM r) = ConduitM $ goL l r
  where
    goL :: Monad m => Pipe () () (Maybe a) () m () 
                   -> Pipe () () (Maybe b) () m ()
                   -> Pipe () () (Either a b) () m ()
    goL (Leftover l ()) r           = goL l r
    goL (NeedInput _ c) r           = goL (c ()) r
    goL (PipeM mx) r                = PipeM $ liftM (`goL` r) mx
    goL (Done _) r                  = mapOutputMaybe (liftM Right) r
    goL (HaveOutput c f (Just o)) r = HaveOutput (goL c r) f (Left o)
    goL (HaveOutput c f Nothing) r  = goR c r
    -- This is just a mirror copy of goL. We should combine them together to
    -- avoid code repetition.
    goR :: Monad m => Pipe () () (Maybe a) () m ()
                   -> Pipe () () (Maybe b) () m ()
                   -> Pipe () () (Either a b) () m ()
    goR l (Leftover r ())           = goR l r
    goR l (NeedInput _ c)           = goR l (c ())
    goR l (PipeM mx)                = PipeM $ liftM (goR l) mx
    goR l (Done _)                  = mapOutputMaybe (liftM Left) l
    goR l (HaveOutput c f (Just o)) = HaveOutput (goR l c) f (Right o)
    goR l (HaveOutput c f Nothing)  = goL l c
Run Code Online (Sandbox Code Playgroud)

它处理一个源,直到返回Nothing,然后切换到另一个源,依此类推。如果一个源完成,则另一个源将被处理到底。

例如,我们可以组合和交错两个列表:

import Control.Monad.Trans
import Data.Conduit (($$), awaitForever)
import Data.Conduit.List (sourceList)

main =  (merge (sourceList $ concatMap (\x -> [Just x, Just x, Nothing]) [  1..10])
               (sourceList $ concatMap (\x -> [Just x, Nothing]) [101..110]) )
         $$ awaitForever (\x -> lift $ print x)
Run Code Online (Sandbox Code Playgroud)

如果您需要多个来源,merge可以调整为类似的内容

mergeList :: Monad m => [Source m (Maybe a)] -> Source m a
Run Code Online (Sandbox Code Playgroud)

这将循环遍历给定的源列表,直到所有源都完成。