spa*_*rkr 3 reactive-programming apache-kafka apache-spark spark-streaming spark-streaming-kafka
我正在阅读这篇博客文章:
它讨论了有关使用Spark Streaming和Apache Kafka进行一些近实时处理的问题。我完全理解这篇文章。它确实显示了如何使用Spark Streaming从主题读取消息。我想知道是否有一个Spark Streaming API,可用于将消息写入Kakfa主题?
我的用例非常简单。我有一组数据,可以以固定的时间间隔(例如每秒)从给定的源读取数据。我使用反应式流进行此操作。我想使用Spark对这些数据进行一些分析。我想要容错,所以卡夫卡开始发挥作用。因此,我基本上要做的是以下操作(如果我输入错了,请纠正我):
但是,另一个问题是,Spark中的Streaming API是否是反应式流规范的实现?是否具有反压处理功能(Spark Streaming v1.5)?