mik*_*eal 17 database scalability nosql riak
在Riak中存储二进制数据有什么问题?
它是否会影响群集的可维护性和性能?
使用Riak而不是分布式文件系统之间的性能差异是什么?
Ela*_*lad 12
除了@ Oscar-Godson的优秀答案之外,您可能会遇到价值远大于50MB的问题.Bitcask最适合高达几KB的值.如果要存储大值,则可能需要考虑备用存储后端,例如innostore.
我没有存储二进制值的经验,但我们在生产中有一个中型集群(5个节点,大约100M值,10个TB),我们看到与插入和检索值有关的频繁错误这是100英尺的KB.在这种情况下的性能是不一致的 - 有时它可以工作,有些则不然 - 所以如果你要测试,那么大规模测试.
运行map-reduce查询时,我们也看到了大值的问题 - 它们只是超时.然而,这可能与二进制值不太相关......(正如@ Matt-Ranney所提到的).
另请参阅@斯蒂芬-C的答案在这里
我能想到的唯一问题是存储大于50MB的二进制数据,他们建议不要这样做.Riak的重点就是:
人们可能选择Riak的另一个原因是为数据建模提供了灵活性.Riak将以与内容无关的方式存储您告诉它的任何数据 - 它不会强制执行表,列或参照完整性.这意味着您可以将二进制文件与更多程序员透明的格式(如JSON或XML)一起存储.
资料来源:Riak的图式设计 - 简介