DynamoDB 是否适合时间序列数据？（市场股价示例）

Question

DynamoDB 是否适合时间序列数据？（市场股价示例）

DynamoDB 是保存股票价格数据等时间序列的好选择（或者它比普通 SQL 有一些优势）吗？
起初我认为可能会很好，因为数据量很大，而且因为我们不需要更新或处理它。

问题通常是时间戳将是主键，但是如果我这样做了，那么我就无法使用 DynamoDB 按范围进行搜索，对吗？
他们从官方文档中推荐了这个奇怪的东西：
https : //docs.aws.amazon.com/amazondynamodb/latest/developerguide/bp-time-series.html
基本上使用“日期”（Ymd）作为 PK 和小时作为排序键。
然后还在不同的表中拆分不同的日子，并调整读/写的东西。
所以我认为现在在 DynamoDB 中保存时间序列是一个坏主意。

Answer 1

Ita*_*man 5

大约一年前，我实现了一个相当复杂的系统，用于使用 DDB 作为其底层存储来存储/访问时间序列。为了使事情具体化，假设您要存储与天气相关的数据。有几个您感兴趣的指标（“温度”、“湿度”等），并且您可以从多个物理位置收集数据（假设它是城市：“纽约”、“旧金山”、“伦敦”等）

我用作<location>-<metric>分区键（例如，"nyc.temprature", "london.humidity"）和时间戳（自纪元以来的秒数）作为排序键。这导致了以下项目：

{name: 'nyc.temperature', timestamp: 1564617785, value: 35.1}
{name: 'nyc.temperature', timestamp: 1564617786, value: 35.2}
{name: 'nyc.temperature', timestamp: 1564617788, value: 35.1}
{name: 'nyc.humidity', timestamp: 1564617786, value: 0.61}
{name: 'nyc.humidity', timestamp: 1564617788, value: 0.61}
{name: 'nyc.humidity', timestamp: 1564617791, value: 0.62}
{name: 'london.temperature', timestamp: 1564617785, value: 33.8}
{name: 'london.temperature', timestamp: 1564617786, value: 33.8}
{name: 'london.temperature', timestamp: 1564617788, value: 33.9}
{name: 'london.humidity', timestamp: 1564617786, value: 0.11}
{name: 'london.humidity', timestamp: 1564617788, value: 0.12}
{name: 'london.humidity', timestamp: 1564617791, value: 0.12}

Run Code Online (Sandbox Code Playgroud)

这使我能够有效地获取任何给定时间段内任何给定位置的所有温度值（这是读取时间序列数据的典型用例）：这是一个简单的 DDB 查询，KeyConditionExpression设置为"#name = :v1 AND #timestamp BETWEEN :v2 and :v3"

归档时间：	6 年，2 月前
查看次数：	3026 次
最近记录：	4 年，10 月前

DynamoDB 是否适合时间序列数据？（市场股价示例）

更多细节