从表中选择一组动态列并获取每个列的总和

Ayd*_*san 3 sql postgresql dynamic-sql plpgsql aggregate-functions

是否可以在 Postgres 中执行以下操作:

SELECT column_name FROM information_schema WHERE table_name = 'somereport' AND data_type = 'integer';

SELECT SUM(coulmn_name[0]),SUM(coulmn_name[1]) ,SUM(coulmn_name[3]) FROM somereport;
Run Code Online (Sandbox Code Playgroud)

换句话说,我需要根据特定条件从表中选择一组列,然后对表中的每一列求和。

我知道我可以在循环中执行此操作,因此我可以独立计算每个列,但显然这需要对从信息模式查询返回的每个列进行查询。例如:

FOR r IN select column_name from information_schema where report_view_name = 'somereport' and data_type = 'integer';
LOOP
    SELECT SUM(r.column_name) FROM somereport;
END
Run Code Online (Sandbox Code Playgroud)

Erw*_*ter 5

此查询创建您想要的完整 DML 语句:

WITH x AS (
   SELECT 'public'::text     AS _schema  -- provide schema name ..
         ,'somereport'::text AS _tbl     -- .. and table name once
   )
SELECT 'SELECT ' || string_agg('sum(' || quote_ident(column_name)
                 || ') AS sum_' || quote_ident(column_name), ', ')
       || E'\nFROM   ' || quote_ident(x._schema) || '.' || quote_ident(x._tbl)
FROM   x, information_schema.columns
WHERE  table_schema = _schema
AND    table_name = _tbl
AND    data_type = 'integer'
GROUP  BY x._schema, x._tbl;
Run Code Online (Sandbox Code Playgroud)

您可以单独执行它或将此查询包装在 plpgsql 函数中并使用以下命令自动运行查询EXECUTE

全自动化

使用 PostgreSQL 9.1.4 进行测试

CREATE OR REPLACE FUNCTION f_get_sums(_schema text, _tbl text)
  RETURNS TABLE(names text[], sums bigint[]) AS
$BODY$
BEGIN

RETURN QUERY EXECUTE (
    SELECT 'SELECT ''{'
           || string_agg(quote_ident(c.column_name), ', ' ORDER BY c.column_name)
           || '}''::text[],
           ARRAY['
           || string_agg('sum(' || quote_ident(c.column_name) || ')'
                                                   , ', ' ORDER BY c.column_name)
           || ']
    FROM   '
           || quote_ident(_schema) || '.' || quote_ident(_tbl)
    FROM   information_schema.columns c
    WHERE  table_schema = _schema
    AND    table_name = _tbl
    AND    data_type = 'integer'
    );

END;
$BODY$
  LANGUAGE plpgsql;
Run Code Online (Sandbox Code Playgroud)

称呼:

SELECT unnest(names) AS name, unnest (sums) AS col_sum
FROM   f_get_sums('public', 'somereport');
Run Code Online (Sandbox Code Playgroud)

返回:

   name        | col_sum
---------------+---------
 int_col1      |    6614
 other_int_col |    8364
 third_int_col | 2720642
Run Code Online (Sandbox Code Playgroud)

解释

困难在于定义RETURN函数的类型,而返回的列的数量和名称会有所不同。一个有点帮助的细节:你只需要integer列。

bigint我通过形成一个(sum(int_col)返回)数组解决了这个问题bigint。此外,我还返回一个列名称数组。两者均按列名称的字母顺序排序。

在函数调用中,我将这些数组拆分为unnest()显示的漂亮格式。

动态创建和执行的查询是高级的东西。不要被多层引号所迷惑。基本上,您需要EXECUTE一个包含要执行的 SQL 查询的文本参数。该文本又由构建主查询的查询字符串的辅助 SQL 查询提供。

如果这一次太多或者plpgsql对您来说相当新,请从这个相关答案开始,我在其中解释了处理更简单功能的基础知识,并提供了主要功能手册的链接。

如果性能很重要,请直接查询 Postgres 目录 ( pg_catalog.pg_attributes),而不是使用标准化的(但速度较慢)information_schema.columns。这是一个简单的例子pg_attributes