小编Ben*_*zzo的帖子

我想知道foreachPartitions,与foreach考虑我RDD为了对累加器变量执行一些求和的情况下的方法相比,由于更高的并行度,意志是否会产生更好的性能.

35
推荐指数

3
解决办法

4万
查看次数

我正在尝试使用Spark Direct Stream获取并存储Kafka中特定消息的偏移量.查看Spark文档很容易获得每个分区的范围偏移量,但我需要的是在完全扫描队列后存储主题的每条消息的起始偏移量.

6
推荐指数

1
解决办法

878
查看次数

我想清楚地指出一个Mirror Maker的Kafka Parallelism模型.

对于我在消费者方面的理解:

我的疑问是:我们是否将多个线程的消费者与单线程或一个消费者挂钩？消费者群体是指一组消费者还是一个多线程消费者？

我发现很难从文档中指出这些问题,我想知道我是不是错了.

即使在生产者方面,这些考虑因素也是双向的吗？

1
推荐指数

1
解决办法

827
查看次数

小编Ben_zzo的帖子