Akka流通过流量限制并行性/处理流的吞吐量

Question

Akka流通过流量限制并行性/处理流的吞吐量

我有一个用例，我想向外部系统发送消息，但是发送此消息的流程需要并返回我不能在下游使用的类型。这是传递流程的绝佳用例。我在这里使用实现。最初，我担心如果processingFlow使用mapAsyncUnordered，那么此流程将无法正常工作。由于处理流程可能会重新排序消息，并且zip可能会推出带有不正确对的元组。例如，在以下示例中。

  val testSource = Source(1 until 50)
  val processingFlow: Flow[Int, Int, NotUsed] = Flow[Int].mapAsyncUnordered(10)(x => Future {
    Thread.sleep(Random.nextInt(50))
    x * 10
  })
  val passThroughFlow = PassThroughFlow(processingFlow, Keep.both)

  val future = testSource.via(passThroughFlow).runWith(Sink.seq)

Run Code Online (Sandbox Code Playgroud)

我希望处理流程可以相对于其输入重新排序其输出，并且我将得到如下结果：

[(30,1), (40,2),(10,3),(10,4), ...]

Run Code Online (Sandbox Code Playgroud)

与右边（通过始终总是按顺序通过），但通过我的mapAsyncUnordered的左边可能与不正确的元素连接在一起，从而形成错误的元组。

相反，我实际上得到：

[(10,1), (20,2),(30,3),(40,4), ...]

Run Code Online (Sandbox Code Playgroud)

每次。经过进一步调查，我发现代码运行缓慢，尽管我的地图异步无序，但实际上根本没有并行运行。我尝试在异步边界前后引入一个缓冲区，但是它似乎总是按顺序运行。这解释了为什么总是订购但我希望我的处理流程具有更高的吞吐量。

我想出了以下解决方法：

object PassThroughFlow {

  def keepRight[A, A1](processingFlow: Flow[A, A1, NotUsed]): Flow[A, A, NotUsed] =
    keepBoth[A, A1](processingFlow).map(_._2)

  def keepBoth[A, A1](processingFlow: Flow[A, A1, NotUsed]): Flow[A, (A1, A), NotUsed] =
    Flow.fromGraph(GraphDSL.create() { implicit builder => {
      import GraphDSL.Implicits._

      val broadcast = builder.add(Broadcast[A](2))
      val zip = builder.add(ZipWith[A1, A, (A1, A)]((left, right) => (left, right)))

      broadcast.out(0) ~> processingFlow ~> zip.in0
      broadcast.out(1) ~> zip.in1

      FlowShape(broadcast.in, zip.out)
    }
    })
}

object ParallelPassThroughFlow {


  def keepRight[A, A1](parallelism: Int, processingFlow: Flow[A, A1, NotUsed]): Flow[A, A, NotUsed] =
    keepBoth(parallelism, processingFlow).map(_._2)

  def keepBoth[A, A1](parallelism: Int, processingFlow: Flow[A, A1, NotUsed]): Flow[A, (A1, A), NotUsed] = {
    Flow.fromGraph(GraphDSL.create() { implicit builder =>
      import GraphDSL.Implicits._

      val fanOut = builder.add(Balance[A](outputPorts = parallelism))
      val merger = builder.add(Merge[(A1, A)](inputPorts = parallelism, eagerComplete = false))

      Range(0, parallelism).foreach { n =>
        val passThrough = PassThroughFlow.keepBoth(processingFlow)
        fanOut.out(n) ~> passThrough ~> merger.in(n)
      }

      FlowShape(fanOut.in, merger.out)
    })
  }

}

Run Code Online (Sandbox Code Playgroud)

两个问题：

在原始实现中，为什么流中的zip会限制无序映射异步的并行度？
我的工作围绕声音还是可以改善？我基本上将输入的内容散布到传递流程的多个堆栈中，然后将它们全部合并回去。它似乎有我想要的属性（平行但即使处理流程重新排序维持秩序），但事情并不感到右

Answer 1

Jef*_*ung 4

broadcast您所目睹的行为是工作方式和工作方式的结果zip：broadcast当其所有输出信号需求时向下游发出；zip在发出需求信号（并向下游发出）之前等待所有输入。

broadcast.out(0) ~> processingFlow ~> zip.in0
broadcast.out(1) ~> zip.in1

Run Code Online (Sandbox Code Playgroud)

1考虑上图中第一个元素 ( ) 的移动。1被广播到processingFlow和zip。zip立即接收其输入之一 ( 1) 并等待其另一个输入 ( 10)，这将需要更长的时间才能到达。仅当同时zip获取两者时，它才会从上游拉取更多元素，从而触发第二个元素 ( ) 在流中的移动。等等。1102

至于你的ParallelPassThroughFlow，我不知道为什么你“感觉有些不对劲”。

归档时间：	6 年，9 月前
查看次数：	262 次
最近记录：	6 年，9 月前