您使用Apache Kafka的目的是什么？

Question

我想问一下我对卡夫卡的理解是否正确.

对于真正非常大的数据流,传统数据库是不够的,所以人们使用Hadoop或Storm之类的东西.Kafka位于所述数据库之上并提供实时数据的指示方向？

Answer 1

我不这么认为.

Kafka是消息传递系统,它不会位于数据库之上.

您可以将Kafka与ActiveMQ,RabbitMQ等消息系统进行比较.

来自Apache文档页面

Kafka是一种分布式,分区,复制的提交日志服务.它提供了消息传递系统的功能,但具有独特的设计.

关键要点:

客户端和服务器之间的通信使用简单,高性能,语言无关的TCP协议完成.

用例:

Answer 2

要完全理解Apache Kafka的角色，您应该有更广泛的了解并了解 Kafka 的用例。现代数据处理系统试图打破经典的应用程序架构。可以从 kappa 架构概览开始：

在此架构中，您不会将世界的当前状态存储在任何 SQL 或键值数据库中。所有数据都被处理并作为一个或多个事件系列存储在一个仅附加的不可变日志中。不可变事件更容易在分布式环境中复制和存储。Apache Kafka 是一个系统，用于存储这些事件并在其他系统组件之间进行中介。