我目前在使用MongoDB的单个服务器上运行我的网站.在我的服务器上,我有两个组件(1)一个每小时运行一次的爬虫,并将数据附加到我的MongoDB实例(2)一个从爬虫索引中读取并写入用户个性化数据库的网站.我正在转向Amazon EC2进行自动扩展,因此Web服务器可以自动扩展,因此随着Web流量的增加,我可以增加服务器数量.我不需要为我的抓取工具自动缩放.这对我如何使用MongoDB提出了挑战.我想知道我最好的选择是优化
在短期内,DB肯定能够适应所有机器的内存,因为它将低于2 GB.用户个性化DB无法重建,因此更重要的是,可以轻松地重建索引.当前的MongoDB爬网索引有大约10万个条目,这些条目在~15个不同的列上键入.这是为了速度而建立的,因为我正在开发一个在线约会网站(可以通过多种方式进行搜索).
我可以想到几个选择
我不太了解SimpleDB和/或DynamoDB.根据文章看起来DynamoDB似乎是一个自然的选择,但我不确定perl的良好支持,我是否可以拥有所有列,索引等.任何人都有经验或有任何建议吗?
我想知道DynamoDB或SimpleDB是否可以取代我的MongoDB用例?以下是我使用MongoDB的方法