使用分区查询 Amazon Athena

5 partitioning amazon-web-services amazon-athena

假设我想按某些属性进行分区,并且在每个分区中我有几个包含 JSON 记录的文件(每个文件有更多记录)。

我想通过某个属性来查询它们,该属性指定何时为特定属性创建记录(给我在某个日期之前创建的所有记录)。

我是否需要按日期对文件中的记录进行排序以获得更好的性能?

Athena 会从第一条记录扫描到最后一条记录然后给我结果吗?

jen*_*ter 3

Athena 分区纯粹基于 S3 文件夹结构。除此之外,所有查询都从第一个元素运行到最后一个元素。

如果您需要某种分区,您只能通过 S3 目录定义它们,然后管理它们(手动或自动,具体取决于文件夹格式)

这里有一些有关分区的更多信息:

数据分区