99% 延迟和吞吐量的含义是什么

Soh*_*ani 6 streaming spark-streaming apache-storm apache-flink

我读过一些文章,对 Spark Streaming、Storm 和 Flink 等流处理引擎的性能进行基准测试。在评估部分,标准是99%和吞吐量。例如,Apache Kafka 以每秒大约 100.000 个事件的速度发送数据,这三个引擎充当流处理器,它们的性能是使用 99% 的延迟和吞吐量来描述的。

谁能为我澄清这两个标准?

Fel*_*ipe 5

流作业中第 99% 的 X 毫秒延迟意味着 99% 的项目在不到 X 毫秒的时间内到达管道末端。请阅读此参考资料以了解更多详细信息。

当应用程序开发人员期望一定的延迟时,他们通常需要一个延迟限制。我们测量了通过网络重新整理数据的流记录分组作业的几个延迟范围。下图显示了观察到的延迟中值,以及第 90、95 和 99 个百分位数(例如,第 99 个百分位数的延迟为 50 毫秒,意味着 99% 的元素到达管道结束时间不到 50 毫秒)。