MySQL Cluster可以处理TB级数据库

Question

我必须研究提供MySQL数据库的解决方案,该数据库可以处理TB级数据量并且具有高可用性(五个九).每个数据库行可能都有一个时间戳和最多30个浮点值.预期的工作量高达2500次插入/秒.查询可能不那么频繁,但可能很大(可能涉及100Gb的数据),但可能只涉及单个表.

鉴于这是他们的HA产品,我一直在关注MySQL Cluster.由于我需要使用基于磁盘的存储的数据量.实际上我认为只有时间戳可以保存在内存中,所有其他数据都需要存储在磁盘上.

有没有人有在这种规模的数据库上使用MySQL Cluster的经验？它甚至可行吗？基于磁盘的存储如何影响性能？

我也对如何实现此数据量的所需可用性的其他建议持开放态度.例如,使用像Sequoia这样的第三方库来处理标准MySQL实例的集群会更好吗？还是基于MySQL复制的更直接的解决方案？

唯一的条件是它必须是基于MySQL的解决方案.我不认为MySQL是我们正在处理的数据的最佳方式,但这是一个很难的要求.

Answer 1

速度方面，它可以处理。在大小方面，问题不在于数据的大小，而在于索引的大小，因为索引必须完全适合内存。

我很乐意提供更好的答案，但高端数据库工作非常依赖于任务。我需要更多地了解数据的情况才能提供进一步的帮助。