Teradata 中顶部与样本的效率

Question

在Teradata，哪个更有效 - Sample 或 Top？

由于样本是随机的，这是否会导致Teradata做更少的工作并导致更快的回报？

通常，我只想看到几行。

Answer 1

我刚刚在大型 Teradata 数据集上运行了三个查询：

DBQL 指标显示，到目前为止，没有订单的前 10 名资源占用最少。我的 I/O 和 CPU 下降了大约 99%，只是从 SAMPLE 更改为 TOP。

因此，如果您的目标纯粹是效率，那么根据 TD 的 DBQL 指标，没有 Order by 的 TOP 显然是赢家。