使用MySQL进行分组时返回哪一行的字段?

T. *_*nes 7 mysql group-by sql-order-by

我有一个领域的MySQL表idstring. ids是独一无二的. strings是varchars并且是非唯一的.

我执行以下查询:

SELECT id, string, COUNT( * ) AS frequency
FROM table
GROUP BY string
ORDER BY frequency DESC, id ASC
Run Code Online (Sandbox Code Playgroud)

问题

假设该表包含三个具有相同string值的行,以及ids 1,2和3.

  1. 哪个id会被退回(1,2或3)?
  2. id这个查询是哪个ORDER BY(与返回的相同?...请参阅问题1)?
  3. 你能控制哪些id退货/用于订购?例如.返回GROUP中的最大值id或第id一个.

我最终要做的是获得相同字符串的频率出现,按该频率排序,从最高到最低,以及频率绑定,按照返回/排序的组中id的最小值id排序.我使情况更通用,以弄清楚MySQL如何处理这种情况.

Mos*_*cho 6

将返回哪个ID(1,2或3)?

答:服务器将为所有具有相同名称的记录选择所需的ID(最有可能获取最快,这是不可预测的).引用官方文档:

服务器可以自由选择每个组中的任何值,因此除非它们相同,否则所选的值是不确定的.

链接中有更多信息.

此查询将转到ORDER BY的哪个ID(与返回的相同?...请参阅问题1)?

由于无法预测您将获得的结果,因此找出将以何种顺序检索所检索的数据是没有意义的.但是,您很可能会得到按不可预测的ID列排序的结果.

你能控制返回/用于订购的ID吗?例如.返回最大的id或GROUP中的第一个id.

你应该假设你不能这样做.再次阅读文档.

使事情更加清晰:您无法预测未正确使用的GROUP BY子句的结果.MySQL的主要问题是它允许您以非标准方式使用它,但您需要知道如何使用该功能.它背后的要点是按字段分组,你知道它们将始终是相同的.例如:

SELECT id, name, COUNT( * ) AS frequency
FROM table
GROUP BY id
Run Code Online (Sandbox Code Playgroud)

在这里,您知道nameid功能上确定将是独特的name.所以你知道的结果是有效的.如果您按名称分组,则此查询将更加标准,但在MySQL中执行稍差.

作为最后一点,请考虑到,根据我的经验,选定和非分组字段的非标准查询结果通常是您应用a GROUP BY然后ORDER BY在该字段上的结果.这就是为什么这么多次似乎有效.但是,如果你继续测试,你最终会发现95%的时间都会发生这种情况.你不能依赖这个数字.