MySQL数据透视表

pek*_*eku 299 mysql pivot

如果我有一个MySQL表看起来像这样:

company_name    action  pagecount
-------------------------------
Company A       PRINT   3
Company A       PRINT   2
Company A       PRINT   3
Company B       EMAIL   
Company B       PRINT   2
Company B       PRINT   2
Company B       PRINT   1
Company A       PRINT   3

是否可以运行MySQL查询以获得如下输出:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

这个想法pagecount可能会有所不同,因此输出列数量应反映出每个action/ pagecount对的一列,然后是每个点击次数company_name.我不确定这是否被称为数据透视表,但有人建议?

Bjo*_*ern 230

这基本上一个数据透视表.

有关如何实现这一目标的精彩教程可以在这里找到:http://www.artfulsoftware.com/infotree/qrytip.php?id = 78

我建议阅读这篇文章,并根据您的需求调整此解决方案.

更新

在上面的链接目前不再可用之后,我觉得有必要为所有在这里搜索mysql pivot答案的人提供一些额外的信息.它真的有大量的信息,我不会把这里的所有东西都放在这里(更多因为我不想复制他们丰富的知识),但我会就如何处理枢轴给出一些建议以sql的方式表示一般来自peku的例子,他们首先提出问题.

也许链接很快就会回来,我会留意它.

电子表格方式......

许多人只是为此目的使用MSExcel,OpenOffice或其他电子表格工具等工具.这是一个有效的解决方案,只需复制那里的数据并使用GUI提供的工具来解决这个问题.

但是......这不是问题,它甚至可能导致一些缺点,例如如何将数据导入电子表格,有问题的缩放等等.

SQL方式......

鉴于他的表看起来像这样:

CREATE TABLE `test_pivot` (
  `pid` bigint(20) NOT NULL AUTO_INCREMENT,
  `company_name` varchar(32) DEFAULT NULL,
  `action` varchar(16) DEFAULT NULL,
  `pagecount` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
Run Code Online (Sandbox Code Playgroud)

现在看看他/她想要的表格:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0
Run Code Online (Sandbox Code Playgroud)

行(EMAIL,PRINT x pages)类似于条件.主要分组是company_name.

为了设置条件,这相当大声地使用CASE-statement.为了GROUP BY的东西,好,使用... GROUP BY.

提供此pivot的基本SQL可能如下所示:

SELECT  P.`company_name`,
    COUNT(
        CASE 
            WHEN P.`action`='EMAIL' 
            THEN 1 
            ELSE NULL 
        END
    ) AS 'EMAIL',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '1' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 1 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '2' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 2 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '3' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 3 pages'
FROM    test_pivot P
GROUP BY P.`company_name`;
Run Code Online (Sandbox Code Playgroud)

这应该非常快速地提供期望的结果.这种方法的主要缺点是,您在数据透视表中需要的行越多,您需要在SQL语句中定义的条件就越多.

这也可以处理,因此人们倾向于使用准备好的语句,例程,计数器等.

关于此主题的一些其他链接:

  • 该链接似乎现在有效...如果它再次下降,请尝试以下方法:Google的缓存http://webcache.googleusercontent.com/search?q=cache:Lj4F4ezFYuUJ:www.artfulsoftware.com/infotree/queries. php +&cd = 1&hl = en&ct = clnk&gl = ca或Internet Wayback Machine(http://web.archive.org/web/20070303120558*/http://www.artfulsoftware.com/infotree/queries.php) (4认同)

RRM*_*RRM 85

My solution is in T-SQL without any pivots:

SELECT
    CompanyName,  
    SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
    SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM 
    Company
GROUP BY 
    CompanyName
Run Code Online (Sandbox Code Playgroud)

  • 这在MySql中同样适用!......甚至押韵;-) (15认同)
  • 我认为 *CASE* 在 `SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END)` 中是不必要的,你可以只做 `SUM(action='PRINT' AND pagecount=1) ` 因为当 true 时条件将转换为 `1`,当 false 时条件将转换为 `0` (4认同)
  • 即使在PostgreSQL上,这对我也有效。我更喜欢这种方法,而不是在Postgres上使用交叉表扩展名,因为这是* cleaner * (2认同)
  • *“我的解决方案在T-SQL中没有任何枢纽:” **不仅是SQL Server,它还应在遵循ANSI SQL标准的大多数数据库供应商上运行。注意,`SUM()`仅适用于数字数据,如果您需要旋转字符串,则必须使用`MAX()`。 (2认同)
  • @kajacx 是的,尽管在没有这种布尔操作的数据库上需要它。如果要在“适用于所有 dB 的较长语法”和“仅适用于...的较短语法”之间进行选择,我会选择前者 (2认同)

M K*_*aid 63

对于MySQL可以直接放在条件下SUM()的功能,它会被计算为布尔01,因此你可以根据你的标准,你的计数,而使用IF/CASE语句

SELECT
    company_name,  
    SUM(action = 'EMAIL')AS Email,
    SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
    SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
    SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name
Run Code Online (Sandbox Code Playgroud)

DEMO

  • @itsols没有它仅适用于Mysql (3认同)
  • 也适用于SQLite (2认同)

Abh*_*pta 35

对于动态支点,使用GROUP_CONCATCONCAT.该GROUP_CONCAT函数连接从一组字符串合并为一个字符串的各种选项.

SET @sql = NULL;
SELECT
    GROUP_CONCAT(DISTINCT
    CONCAT(
      'SUM(CASE WHEN action = "',
      action,'"  AND ', 
           (CASE WHEN pagecount IS NOT NULL 
           THEN CONCAT("pagecount = ",pagecount) 
           ELSE pagecount IS NULL END),
      ' THEN 1 ELSE 0 end) AS ',
      action, IFNULL(pagecount,'')

    )
  )
INTO @sql
FROM
  t;

SET @sql = CONCAT('SELECT company_name, ', @sql, ' 
                  FROM t 
                   GROUP BY company_name');

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
Run Code Online (Sandbox Code Playgroud)

在这里演示

  • Pacerier,真正的男人,但动态旋转其最好的方法之一 (2认同)
  • 如果您在“操作”列中有很多值,或者希望该列表随着时间的推移而增长,那么这样做会很好用,因为为每个值编写一个case语句可能很耗时并且很难保持最新。 (2认同)

Erw*_*ter 23

一个参考标准-SQL使用的版本布尔逻辑:

SELECT company_name
     , COUNT(action = 'EMAIL' OR NULL) AS "Email"
     , COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
     , COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
     , COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
FROM   tbl
GROUP  BY company_name;
Run Code Online (Sandbox Code Playgroud)

SQL小提琴.

怎么样?

TRUE OR NULL 收益率TRUE.
FALSE OR NULL收益率NULL.
NULL OR NULL收益率NULL.
并且COUNT只计算非空值.瞧.

  • @Pacerier:问题中的例子似乎表明了这一点。无论哪种方式,SQL *要求*知道返回类型。*完全*动态查询是不可能的。如果输出列的数量可以变化,您需要两个步骤:1st 构建查询,2nd:执行它。 (2认同)

Pet*_*een 10

有一个名为MySQL Pivot表生成器的工具,它可以帮助您创建基于Web的数据透视表,以后可以导出到excel(如果您愿意).如果您的数据位于单个表或多个表中,它可以工作.

您需要做的就是指定列的数据源(它支持动态列),行,表的主体中的值和表关系(如果有的话) MySQL数据透视表

该工具的主页是http://mysqlpivottable.net


小智 10

正确的答案是:

select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id
Run Code Online (Sandbox Code Playgroud)

  • *“正确答案是:”* 很可能不是,因为它缺少 `SET` 查询来增加默认值,默认值限制为 1024 GROUP_CONCAT 在 1024 之后 GROUP_CONCAT 只是截断字符串而不会出现错误,这意味着可能会发生意外结果。 (2认同)