我测试NoSQL数据库等的CouchDB,MongoDB的和卡桑德拉和观察到前瞻态势非常大量相对驱动空间吸收到插入键 - 值对.在比较CouchDB和MySQL无模式数据库时,CouchDB比MySQL消耗更多的驱动器空间.我知道在默认情况下该键值的DB版本,并有很长的UUID,需要重点optimalisation - 比较是在MySQL大约15万行和列的NoSQL数据库的1-5万的文档之间.
我的问题是:是否有任何NoSQL具有良好的压缩/压缩数据?这样我可以拥有NoSQL数据库,其大小接近5GB而不是50GB?
MongoDB 有一个“数据库修复”功能,也可以执行压缩。然而,当数据库运行时,这样的压缩不会发生。
但如果数据库空间是一个严重的问题,那么请尝试设置 MongoDB 主/从对。由于数据需要压缩,请在从属设备上运行修复,让它“赶上”,然后切换它们。您现在可以安全地压缩母版。
但我必须回应jbellis的评论:您可能需要更多空间,并且大多数这些产品都假设磁盘空间(相对)便宜。如果磁盘空间非常紧张,那么您会发现 MongoDB 的大小相当合理,但它将很难与表格 CSV 数据竞争。
这样想,还有什么更节省空间呢?
显然,由于您每次都重复字段名称,JSON 会更长。这里唯一的例外是 CSV 文件,它有大约 100 列,其中每行只填充了几列。(但这可能不是你的数据)