我正在与Kafka一起创建一个主管和事件管理系统.问题是我们得到了很多假的线索(广告).我们的系统中也有许多消费者.无论如何在去消费者之前过滤广告?我的解决方案是将所有内容写入第一个主题,然后由过滤器使用者读取,然后将其写回第二个主题或过滤它.但我不确定它是否有效.任何的想法?
是的 - 实际上我确信这是你应该在你的环境中处理问题的方式.因为Kafka仅对高效传输数据有用,所以在清理数据方面本身无法做到.消耗中间消费者获得的所有信息,这些消息可以运行自己的测试来确定通过其过滤器的内容并推送到不同的主题/分区(根据您的需要)以获得最佳数据.
小智 5
您可以使用Kafka Streams(http://kafka.apache.org/documentation.html#streamsapi)和0.10.+版本的Kafka.我认为这完全符合您的用例.
| 归档时间: |
|
| 查看次数: |
17457 次 |
| 最近记录: |