我正在考虑处理大量数据的概念证明,例如> 10 G,这需要每秒至少200次写入和每秒大约50次以上的空间相关数据读取.这也是一个不断发展的系统.目前我正在考虑出于性能原因将这个大容量数据转移到NoSql大表类数据库中.
我已经考虑并仔细研究了MongoDB和cassandra.就我的阅读而言,
Mongodb: - 似乎有一个编写器锁定问题 - 如果不需要多个服务器,stackoverflow中的一个帖子建议使用此数据库 - 索引保留在内存中.因此,指数增长越大,性能就越差 - Mongodb直接支持空间数据和索引,以及查找附近位置等功能,我看到了这个帖子 - 我看到这篇文章Cassandra或MongoDB对于我们基于位置的应用建议mongodb作为最佳选择
Cassandra:
- 似乎是相关dbs中最好的 - 似乎有很好的写入和读取性能 - 本身不支持空间索引,但这可以通过geohashing扩展
我的心实际上是因为其良好的文档和对空间数据的直接支持而为mongodb服务.是否有任何机构在使用mongodb进行大型系统方面有不良经验?我实际上在mongodb iostat上看到很多关于性能的帖子.
如果mongodb不适合,有人可以使用cassandra给出一些关于geohashing的指示吗?我在http://code.google.com/p/geospatialweb/上看到了用于创建哈希的链接.但是如何查询等问题呢?