Rya*_*ert 4 amazon-s3 amazon-web-services
Amazon Redshift Spectrum 允许您直接针对存储在 Amazon S3 中的数据运行查询。这似乎也是新的 Amazon S3 Select 服务的目的。这两种服务之间的主要区别是什么?为什么我应该选择一个而不是另一个?
小智 8
S3 Select 专注于使用 SQL 从 S3 检索数据:
S3 Select 使应用程序能够使用简单的 SQL 表达式仅从对象中检索数据的子集。通过使用 S3 Select 仅检索应用程序所需的数据,您可以获得显着的性能提升 - 在许多情况下,与经典 S3 检索相比,您可以获得多达 400% 的改进。
Redshift Spectrum 支持直接从您的 AWS Redshift 集群查询 S3 数据:
Amazon Redshift Spectrum 使您能够针对 Amazon S3 中的 EB 数据运行 Amazon Redshift SQL 查询。借助 Redshift Spectrum,您可以将 Amazon Redshift 的分析能力扩展到存储在数据仓库本地磁盘上的数据之外,以查询 Amazon S3“数据湖”中的大量非结构化数据
Athena 专注于从 S3 中提取、转换和加载 (ETL) 数据,并且与 AWS Glue 有很好的集成:
雅典娜很容易使用。只需指向 Amazon S3 中的数据,定义架构,然后开始使用标准 SQL 进行查询。大多数结果会在几秒钟内交付。使用 Athena,无需复杂的 ETL 作业来准备数据以进行分析。这使得任何具有 SQL 技能的人都可以轻松快速地分析大规模数据集。
参考资料:Athena、Spectrum和S3 Select
归档时间: |
|
查看次数: |
3651 次 |
最近记录: |