使用S3作为数据库还是数据库（例如MongoDB）

Question

由于设置简单且成本低廉，我正在考虑使用AWS S3存储桶而非NoSQL数据库将简单的用户设置保存为JSON（约30个文档）。

我研究了以下不使用数据库的缺点，这些缺点与我的用例无关：

使用S3存储桶而不使用数据库是否还有其他缺点？

Answer 1

背景：我们使用S3一些“数据库”（亮键/值结构化存储）。

应该注意的是，S3 实际上确实具有搜索功能，并且根据您的数据结构，以S3 Select的形式进行查询（如果您有时间：Athena）。

然而，最大的缺点/架构挑战是 S3 最终是一致的（这实际上是您无法“更新”文件的原因）。这体现在您的架构需要容忍的一些行为中：

* AWS 故意未定义时间段，但是，从观察来看，它很少超过一分钟。

此问题已得到解决 https://aws.amazon.com/blogs/aws/amazon-s3-update-strong-read-after-write-consistency/ (6认同)
“没有全局缓存，因此在被覆盖后，您可以在一段时间内*获得同一对象的两个不同版本。”是什么意思？如果它最终一致，这不应该是可能的吗？ (2认同)

Answer 2

您正在“考虑使用AWS S3存储桶而不是NoSQL数据库”，但事实是Amazon S3实际上是 NoSQL数据库。

这是一个非常大的键值存储。键是文件名，值是文件的内容。

如果您的需求只是“使用此键存储值”和“使用此键检索值”，那么它将很好用！

实际上，由于Amazon.com上的旧订单（已有一年以上）是只读的（无退货，无更改），因此显然已存档到Amazon S3。

尽管比DynamoDB慢，但Amazon S3的存储成本肯定要低得多！

对于像我这样的后期读者，我只想指出成本优势很大程度上取决于有效负载的大小。这是因为 S3 的成本随请求而变化，而 Dynamo 的成本随吞吐量变化。在我自己的场景中（包括点播），对于 4kb 或更少的小有效负载，Dynamo 实际上可以更便宜。您可以使用 https://calculator.aws/#/ 轻松检查这一点 (10认同)