Mar*_*ark 6 mysql cluster-computing
我必须研究提供MySQL数据库的解决方案,该数据库可以处理TB级数据量并且具有高可用性(五个九).每个数据库行可能都有一个时间戳和最多30个浮点值.预期的工作量高达2500次插入/秒.查询可能不那么频繁,但可能很大(可能涉及100Gb的数据),但可能只涉及单个表.
鉴于这是他们的HA产品,我一直在关注MySQL Cluster.由于我需要使用基于磁盘的存储的数据量.实际上我认为只有时间戳可以保存在内存中,所有其他数据都需要存储在磁盘上.
有没有人有在这种规模的数据库上使用MySQL Cluster的经验?它甚至可行吗?基于磁盘的存储如何影响性能?
我也对如何实现此数据量的所需可用性的其他建议持开放态度.例如,使用像Sequoia这样的第三方库来处理标准MySQL实例的集群会更好吗?还是基于MySQL复制的更直接的解决方案?
唯一的条件是它必须是基于MySQL的解决方案.我不认为MySQL是我们正在处理的数据的最佳方式,但这是一个很难的要求.
速度方面,它可以处理。在大小方面,问题不在于数据的大小,而在于索引的大小,因为索引必须完全适合内存。
我很乐意提供更好的答案,但高端数据库工作非常依赖于任务。我需要更多地了解数据的情况才能提供进一步的帮助。