使用覆盖索引选择某一天的记录

Question

使用覆盖索引选择某一天的记录

我想运行这些查询:

select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

和

select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

...使用此表定义:

CREATE TABLE `weixin_kol_status` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `url` varchar(512) NOT NULL,
  `created_at` datetime NOT NULL,
  `title` varchar(512) NOT NULL DEFAULT '',
  `text` text,
  `attitudes_count` int(11) NOT NULL DEFAULT '0',
  `readcount` int(11) NOT NULL DEFAULT '0',
  `reposts_count` int(11) NOT NULL DEFAULT '0',
  `comments_count` int(11) NOT NULL DEFAULT '0',
  `userid` varchar(32) NOT NULL,
  `screen_name` varchar(32) NOT NULL,
  `type` tinyint(4) NOT NULL DEFAULT '0',
  `ext_data` text,
  `is_topline` tinyint(4) NOT NULL DEFAULT '0',
  `is_business` tinyint(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_url` (`url`(255)),
  KEY `idx_userid` (`userid`),
  KEY `idx_name` (`screen_name`),
  KEY `idx_created_at` (`created_at`)
) ENGINE=InnoDB AUTO_INCREMENT=328727437 DEFAULT CHARSET=utf8 |


rows = 328727437;

Run Code Online (Sandbox Code Playgroud)

查询需要几分钟.如何优化查询？我怎样才能使用覆盖指数？

执行计划是:

explain select id from weixin_kol_status where created_at>='2015-12-11 00:00:00' and created_at<='2015-12-11 23:59:59'\G;
    *************************** 1. row ***************************
               id: 1
      select_type: SIMPLE
            table: weixin_kol_status
             type: range
    possible_keys: idx_created_at
              key: idx_created_at
          key_len: 5
              ref: NULL
             rows: 1433704
            Extra: Using where; Using index
    1 row in set (0.00 sec)

Run Code Online (Sandbox Code Playgroud)

和

explain select id from weixin_kol_status where created_at='2015-12-11 00:00:00'\G; 
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: weixin_kol_status
         type: ref
possible_keys: idx_created_at
          key: idx_created_at
      key_len: 5
          ref: const
         rows: 1
        Extra: Using index
1 row in set (0.00 sec)

Run Code Online (Sandbox Code Playgroud)

但为什么第一个查询Extra: Using where; Using index,第二个查询Extra: Using index.第一个查询没有使用覆盖索引吗？

Answer 1

mdf*_*t13 2

如何使用覆盖索引？

你知道什么是覆盖索引吗？它是一个包含查询所需的所有列的索引。因此对于

select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

Run Code Online (Sandbox Code Playgroud)

最小覆盖指数会是这样的

      KEY `idx_created_url` (`created_at`, `url`)

Run Code Online (Sandbox Code Playgroud)

而对于

select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

Run Code Online (Sandbox Code Playgroud)

最小覆盖指数可能是

      KEY `idx_created_user_url` (`created_at`, `userid`, `url`)

Run Code Online (Sandbox Code Playgroud)

这也将涵盖第一个查询或

      KEY `idx_user_created_url` (`userid`, `created_at`, `url`)

Run Code Online (Sandbox Code Playgroud)

这不适用于第一个查询，但可以更好地优化第二个查询。

您可能必须写出url(512)而不只是url. VARCHAR列索引不好。如果您收到有关索引值太宽的错误，则可能无法在此查询中使用覆盖索引。

覆盖索引很有用，因为它可以回答内存中索引中的所有内容，而无需访问磁盘上的表。由于内存比磁盘快，因此具有加速查询的效果。当然，如果您的索引已调出，您仍然需要从磁盘加载它。因此，如果您的记忆力有限，这可能没有帮助。

请注意，查询将仅对每个表使用一个索引，因此每列上的单独索引不会覆盖任一查询。您需要一个复合索引来一次覆盖所有需要的列。

作为旁注，我认为你的>和<应该分别是>=和<=。可能不会有太大区别，但你似乎每天跳过两秒钟。

归档时间：	10 年，2 月前
查看次数：	77 次
最近记录：	10 年，2 月前