Ido*_*lon 8 analytics mongodb cassandra
我今天正在使用mongodb,我真的很开心.我需要找到一个事件记录解决方案的解决方案.该日志包括内容侮辱和点击的记录(如广告系统).它有很多写入和少量读取(主要用于日常报告).似乎像Casandra这样的东西是比Mongodb更好的解决方案,它似乎更适合面向文档的数据结构.有什么想法吗 ?
Cassandra的一个好处是它支持Hadoop map/reduce,这使它可以访问一个非常强大的生态系统(例如Pig)工具,示例等等.
根据数据量和用例,您可能还希望利用其到期列功能(http://www.datastax.com/dev/blog/whats-new-cassandra-07-expiring-columns).
Gemini最近也开放了其Cassandra实时日志处理工具,可能与您想要的类似(http://www.thestreet.com/story/11030367/1/gemini-releases-real-time-log-基于处理的flume-and-cassandra.html,https://github.com/geminitech/logprocessing).
我们在其中一个项目中使用 mongodb 来捕获分布式应用程序的事件日志记录。它运行得非常好,并且预先对存储量、分片和其他因素进行一些计算是有意义的。
建议使用上限收集,并每 24 小时左右运行一次 MapReduce 操作,以将日志减少到所需值的聚合表。我注意到,由于 mongodb 中的文档“无架构”,可能会导致数据库文件大小增长得非常快。
归档时间: |
|
查看次数: |
4305 次 |
最近记录: |