没有子查询的PostgreSQL中的总百分比

fan*_*abi 4 postgresql

我有一个用户表.每个用户都有一个国家.我想要的是获得具有用户数量和百分比/总数的所有国家/地区的列表.到目前为止我所拥有的是:

SELECT
country_id,
COUNT(*) AS total,
((COUNT(*) * 100) / (SELECT COUNT(*) FROM users WHERE cond1 = true AND cond2 = true AND cond3 = true)::decimal) AS percent
FROM users
WHERE cond1 = true AND cond2 = true AND cond3 = true
GROUP BY contry_id
Run Code Online (Sandbox Code Playgroud)

两个查询中的条件都相同.我尝试在没有子查询的情况下执行此操作但是我无法获得用户总数,但每个国家/地区的总数.有没有子查询可以做到这一点?我正在使用PostgreSQL.任何帮助都非常感谢.提前致谢

peu*_*feu 8

我想你想要消除子查询的原因是避免两次扫描users表.请记住,总数是每个国家/地区的总和.

WITH c AS (SELECT country_id, count(*) AS cnt FROM users WHERE cond1=... GROUP BY country_id) 
SELECT *, 100.0*cnt/(SELECT sum(cnt) FROM c) AS percent FROM c;
Run Code Online (Sandbox Code Playgroud)

此查询使用每个国家/地区的统计信息构建一个小CTE.它只会扫描一次用户表,并生成一个小的结果集(每个国家只有一行).

总计(SELECT sum(cnt)FROM c)仅在此小结果集上计算一次,因此使用的时间可忽略不计.

您还可以使用窗口功能:

SELECT country_id, cnt, 100.0*cnt/(sum(cnt) OVER ()) AS percent 
FROM (SELECT country_id, count(*) as cnt from users group by country_id) foo;
Run Code Online (Sandbox Code Playgroud)

(这与夜狼的查询相同,删除了错误lol)

两个查询大约需要同一时间.


Tre*_*ent 5

这确实很老,但是上面的两个选择示例都不起作用,或者过于复杂。

SELECT
    country_id,
    COUNT(*),
    (COUNT(*) / (SUM(COUNT(*)) OVER() )) * 100
FROM
    users
WHERE
    cond1 = true AND cond2 = true AND cond3 = true
GROUP BY 
    country_id
Run Code Online (Sandbox Code Playgroud)

第二个计数不是必需的,它仅用于调试以确保获得正确的结果。诀窍是记录集的COUNT之上的SUM。

希望这对某人有帮助。

另外,如果有人想在Django中执行此操作,则只需汇总以下内容即可:

class PercentageOverRecordCount(Aggregate):
    function = 'OVER'
    template = '(COUNT(*) / (SUM(COUNT(*)) OVER() )) * 100'

    def __init__(self, expression, **extra):
        super().__init__(
            expression,
            output_field=DecimalField(),
            **extra
        )
Run Code Online (Sandbox Code Playgroud)

现在可以在注释中使用它。


Nig*_*olf 4

我不是 PostgreSQL 用户,但是一般的解决方案是使用窗口函数。

了解如何使用它,请访问http://developer.postgresql.org/pgdocs/postgres/tutorial-window.html

我可以用来描述它的最佳解释是:基本上它允许您在一个字段上进行分组,而无需使用分组依据子句。

我相信这可能会成功:

SELECT 
    country_id, 
    COUNT(*) OVER (country_id) 
    ((((COUNT(*) OVER (country_id)) * 100) / COUNT(*) OVER () )::decimal) as percent
FROM 
    users
WHERE
    cond1 = true AND cond2 = true AND cond3 = true
Run Code Online (Sandbox Code Playgroud)