如何在mysql查询中从每个组中选择多个项目?

saf*_*fsd 3 mysql group-by greatest-n-per-group

我有一些表格的论坛数据

帖子(作者,thread_id,文本)

对于每个作者,我想选择与该作者相关联的10个不同的thread_id(可能超过10个,并且该数字将因作者而异).

我正在考虑使用GROUP BY对'author'进行分组,但我无法理解如何在每个组中表达LIMIT,以及如何将每个组扩展回10行.

Bil*_*win 6

这是"每组前N个"类型查询的解决方案.

请注意,您必须选择其中 10个线程你想要一个给定的作者.对于这个例子,我假设你想要最新的线程(而thread_id是一个自动增量值),对于tie的情况,你有一个主键posts.post_id.

SELECT p1.*
FROM post p1 LEFT OUTER JOIN post p2
 ON (p1.author = p2.author AND (p1.thread_id < p2.thread_id 
   OR p1.thread_id = p2.thread_id AND p1.post_id < p2.post_id))
GROUP BY p1.author
HAVING COUNT(*) < 10;
Run Code Online (Sandbox Code Playgroud)

在评论中重新提出你的后续问题,这是解释:

在每个作者的前10个主题中,我们可以说,对于每个主题,该作者属于结果集的其他主题有9个或更少.因此,对于每个作者的帖子(p1),我们计算同一作者有多少帖子(p2)有更多的帖子.如果该计数小于10,则该作者的帖子(p1)属于结果.

我添加了一个术语来解决与post_id的关系.