小编use*_*211的帖子

Trino 和 Presto 的区别

我知道 Presto 以前是 PrestoDB,而 Trino 以前是 PrestoSQL。我知道 PrestoDB 于 2012 年在 Facebook 创建,直到 2019 年 1 月它们都是同一个项目。据我所知,该项目最初是为了解决 300 PB Hive 数据仓库上的缓慢查询而创建的。我知道还有来自 Teradata 的 Presto 发行版等等。

我从互联网上收集了一些信息,当我在寻找基于事实的差异时,这些信息非常有见地

在比较两者并更喜欢 Trino博客中,我看到他们说:

  • 虽然 Trino 是针对多个数据源运行 ETL 查询的公司的出色解决方案,但它还提供了节省资源和收集更多输出的选项。
  • Trino 还擅长允许用户使用 SQL 运行即席查询,而不管数据位于何处。它消除了将数据 ETL 到另一个系统的需要。
  • Trino 允许用户创建个性化的报告和统一的仪表板,以更好地查询多个数据源。

以及 Trino 中不存在的 Presto 功能,例如 Presto-on-Spark 看起来一直是开发重点:

这些功能包括:

  • Project Aria – 非常适合处理 ORC 等文件格式。
  • Project Presto Unlimited – 一种用于创建临时内存存储桶的内存节省功能。
  • 其他用户定义的函数,例如动态 SQL 函数支持。
  • Presto-on-Spark – Spark 执行器中的库。

在Trino的公告中,他们展示了两个项目之间提交数量的差异。

另一个帖子,是喜欢普雷斯托 …

hive presto trino

0
推荐指数
1
解决办法
228
查看次数

标签 统计

hive ×1

presto ×1

trino ×1