Teradata 中顶部与样本的效率

Nea*_*ker 0 sql teradata

Teradata,哪个更有效 - Sample 或 Top

由于样本是随机的,这是否会导致Teradata做更少的工作并导致更快的回报?

通常,我只想看到几行。

线程相关: teradata sql 中的 top 和 sample 之间的差异

Fil*_*icz 5

我刚刚在大型 Teradata 数据集上运行了三个查询:

  1. SELECT * FROM table Sample 10;
  2. SELECT * Top 10 FROM table; (没有订单)
  3. SELECT * Top 10 FROM table ORDER BY column;

DBQL 指标显示,到目前为止,没有订单的前 10 名资源占用最少。我的 I/O 和 CPU 下降了大约 99%,只是从 SAMPLE 更改为 TOP。

因此,如果您的目标纯粹是效率,那么根据 TD 的 DBQL 指标,没有 Order by 的 TOP 显然是赢家。

DBQL 指标