我想知道Google Analytics数据库设计,它们如何以小时为单位处理巨大的价值,即使在几分钟内也是如此.
比方说,他们拥有1亿用户,几乎每个用户每分钟都有300个计数器.对于一个用户,300个计数器在一小时内有18000行.有一天它是432K行和近300万行.
我以为他们没有使用关系数据库,但不确定它...
有什么建议吗?
问候,
我正在寻找Cassandra,HBase,Mongodb和Elastic Search的写作性能的真实测试结果.我想从我们的服务器收集日志数据,这些数据非常庞大.超过10gb一小时.
我知道每个人都在谈论cassandra的写性能,这些产品有不同的使用领域.K/V,面向文档或搜索.但是我现在对他们的存储类型不感兴趣,只有写性能.例如每秒50K事务.
另外,我想在这些数据之上进行搜索.
您对每秒超过50K trans的处理建议是什么?