小编Ism*_*ail的帖子

使用NoSQL数据库为JSON数据提供高效且可扩展的存储

我们正在开发一个项目,该项目应收集日志和审计数据并将其存储在数据存储区中以进行存档和一些视图.我们不太确定哪个数据存储区对我们有用.

  • 我们需要存储小的JSON文档,大约150个字节,例如"audit:{timestamp: '86346512',host':'foo',username:'bar',task:'foo',result:0}""journal:{timestamp:'86346512',host':'foo',terminalid:1,type='bar',rc=0}"
  • 我们预计每天大约有一百万个条目,大约150 MB的数据
  • 数据将被存储和读取,但从未被修改过
  • 数据应以有效的方式存储,例如Apache Avro使用的二进制格式
  • 保留时间后数据可能会被删除
  • 自定义查询,例如'get audit for user and time period''get journal for terminalid and time period'
  • 复制数据库以进行故障保护
  • 可扩展性

目前我们正在评估NoSQL数据库,如Hadoop/Hbase,CouchDB,MongoDB和Cassandra.这些数据库对我们来说是正确的数据库吗?哪个最适合?有更好的选择吗?

json hadoop couchdb mongodb cassandra

7
推荐指数
1
解决办法
6070
查看次数

标签 统计

cassandra ×1

couchdb ×1

hadoop ×1

json ×1

mongodb ×1