mlh*_*351 1 sql sql-order-by limit netezza amazon-redshift
我有一个Redshift和Netezza查询,COUNT(*)每当我运行它时会增长,因为大多数表附加了更多销售等的行.无论如何,我正在寻找价格最高的20%,所以我正在使用ORDER BY price,然后更改限制通过做心理数学得到前20%,即如果COUNT(*)=10,000,那么我将添加一个静态LIMIT 2000.明天,也许它会是12,000行,然后我需要运行COUNT(*)并LIMIT 2400再次更改.这显然是不可扩展的.
我正在尝试编辑查询以包含动态限制,查找前20%并在百分比之间轻松更改:5%,10%等等.因此无论行数如何,我都会获得一致的结果.
以下示例查询:
SELECT
*
FROM orders
WHERE
sale_date >= '2018-01-01'
ORDER BY
price DESC
LIMIT 2000
Run Code Online (Sandbox Code Playgroud)
我想要有更像的东西:
SELECT
*
FROM orders
WHERE
sale_date >= '2018-01-01'
ORDER BY
price DESC
LIMIT (SELECT COUNT(*) * 0.2 FROM orders)
Run Code Online (Sandbox Code Playgroud)
不确定Redshift/Netezza是否支持此功能.我已经看到了一个StackOverflow问题,它可以在MySQL中使用变量函数,但我在Redshift和Netezza工作.任何人对如何创建这个有什么想法?谢谢!
一种方法是row_number()和count(*):
SELECT o.*
FROM (SELECT o.*,
ROW_NUMBER() OVER (ORDER BY price DESC) as seqnum,
COUNT(*) OVER () as cnt
FROM orders o
WHERE sale_date >= '2018-01-01'
) o
WHERE seqnum <= cnt * 0.2
ORDER BY price DESC;
Run Code Online (Sandbox Code Playgroud)
您不必使用两个功能.一个人会这样做.例如:
SELECT o.*
FROM (SELECT o.*,
PERCENT_RANK() OVER (ORDER BY price DESC) p
FROM orders o
WHERE sale_date >= '2018-01-01'
) o
WHERE p <= 0.2
ORDER BY price DESC;
Run Code Online (Sandbox Code Playgroud)