如何使用 join 和 order-by 优化此选择?

Put*_*nik 2 mysql optimization order-by select aurora

我们有两个表:

 CREATE TABLE `messages` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `created` int(10) unsigned DEFAULT '0',
  `user_id` int(11) DEFAULT '0',
....
  `subject_id` int(11) unsigned DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `id` (`id`),
  KEY `user_id` (`user_id`),
  KEY `created` (`created`),
  KEY `text_id` (`text_id`) USING BTREE,
  KEY `subject_id` (`subject_id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=237542180 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT
Run Code Online (Sandbox Code Playgroud)

第二个:

CREATE TABLE `users` (
  `id` int(12) NOT NULL AUTO_INCREMENT,
  `email` char(150) DEFAULT NULL,
  `reg_time` int(10) unsigned DEFAULT '0',
  `password` char(255) DEFAULT NULL,
...................
  `moderation` int(1) unsigned NOT NULL DEFAULT '0',
  `tag` varchar(255) DEFAULT '',
  PRIMARY KEY (`id`),
  UNIQUE KEY `id` (`id`),
  UNIQUE KEY `email` (`email`),
  KEY `created` (`reg_time`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=123585 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT
Run Code Online (Sandbox Code Playgroud)

消息有 ~49M 记录,用户有 13k。数据库引擎:Aurora(MySQL-Compatible) 5.6.10a

非常长的请求是

SELECT messages.*, users.administrator_group_id FROM messages 
    LEFT JOIN users ON messages.user_id = users.id 
    ORDER BY messages.id desc LIMIT 0,20
Run Code Online (Sandbox Code Playgroud)

如果我不运行此请求,order by则需要 14-16 秒。随着order它的时间超过5分钟长。

我正在考虑更改业务逻辑以避免此请求并限制记录集,messages例如按消息日期,但想知道是否有任何方法可以在相同的硬件上加快速度。

ype*_*eᵀᴹ 5

我从未使用过 Aurora 并且可能与 MySQL 存在差异,但有一种方法在 MySQL 中在类似问题中经常有效,当执行计划不是最佳时,即当它首先执行连接然后必须执行ORDER BY大的连接时中间结果集。

我们尝试先将LIMIT结果放入派生表中,然后再JOIN返回,而不是连接 2 个表。这样索引将用于ORDER BY - LIMIT,然后它只需要在第二个表中进行 N 次查找(在这种情况下为 20):

SELECT 
    m.*, 
    u.administrator_group_id 
FROM 
    ( SELECT id 
      FROM messages 
      ORDER BY id DESC 
      LIMIT 20
    ) AS mi
  JOIN 
    messages AS m ON m.id = mi.id
  LEFT JOIN 
    users AS u ON m.user_id = u.id 
ORDER BY 
    mi.id DESC ;
Run Code Online (Sandbox Code Playgroud)

还有一个变种:

SELECT 
    m.*, 
    u.administrator_group_id 
FROM 
    ( SELECT mi.* 
      FROM messages AS mi 
      ORDER BY mi.id DESC 
      LIMIT 20
    ) AS m
  LEFT JOIN 
    users AS u ON m.user_id = u.id 
ORDER BY 
    m.id DESC ;
Run Code Online (Sandbox Code Playgroud)

尝试两者并检查执行计划和性能。在任何合理的硬件中,仅从一两个表中获取 20 行并使用索引的查询应该非常有效。以毫秒为单位,而不是秒或分钟。