Presto 与 Impala:架构、性能、功能

VB_*_*VB_ 3 olap database-design distributed-database presto impala

您能否在 2019 年强调两者在架构和功能方面的主要差异?以及这些差异如何影响性能?

出于某种原因,这个很好的问题被标记为基于意见。

额外问题:为什么亚马逊决定使用 Presto 作为 Athena 的引擎?无论如何它比Impala更好吗?

UPD

f PrestoDB 和 Impala 相同,为什么它们在硬件要求上如此不同?Presto 要求 16 GB+ 的 RAM,Impala 要求 128 GB+ 的 RAM

小智 10

虽然技术架构、性能和功能可能是一个非常详细的主题,但我能想到的一些关键亮点(基于这两个引擎在过去这么多年的历程):

  1. Presto 总是在 Facebook、Netflix、Airbnb、Pinterest 和 Lyft 等类型的数据驱动公司的规模(PB 规模)上进行测试,但 Impala 可能没有那种大规模部署(当然他们会有一些,但那些故事在公众中不是很出名)。
  2. 由于上述因素,Presto 始终拥有一个非常多样化和快速发展的社区,帮助构建了这个强大的引擎。
  3. Presto 非常接近 ANSI SQL 合规性,这有助于传统数据社区采用它。

- Ashish Dubey ( Qubole )