可以说我有多个设备.每个设备都有不同类型的传感器.现在我想将每个传感器的每个设备的数据发送到kafka.但我对卡夫卡主题感到困惑.用于处理此实时数据
每个设备都有kafka主题并且该设备的所有传感器都会将数据发送到特定的kafka主题,或者我应该创建一个主题并让所有设备将数据发送到该主题.
如果我选择第一个案例,我们将在每个设备上创建主题,
Device1(传感器A,B,C) - > topic1
Device2(传感器A,B,C) - > topic2
案例2:在哪里,将数据发送到一个主题
Device1(传感器A,B,C),Device2(传感器A,B,C)...... DeviceN .... - >主题
这不会成为数据的瓶颈.因为它将表现为来自某个传感器的队列数据将在队列中落后并且不会被实时处理.
这个模型会扩展吗?
编辑
让我们说每个设备都与用户(多对一)相关联.所以我想根据设备处理数据.因此,我想处理数据的方式是,每个设备及其传感器数据将在经过一些处理后发送给用户.
说我做了以下
DEVICE1
- >传感器A - 主题1分区1
- >传感器B - 主题1分区2
设备2
- >传感器A - 主题2分区1
- >传感器B - 主题2分区2
我想要一些pub/sub类型的行为.由于可以添加或移除设备,因此也可以添加或移除传感器.有没有办法创建这些主题和动态分区.
如果不是kafka,那么pub/sub将适合这种行为.
scalability real-time publish-subscribe bigdata apache-kafka