使用覆盖索引选择某一天的记录

6 mysql indexing performance datetime

我想运行这些查询:

select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';

...使用此表定义:

CREATE TABLE `weixin_kol_status` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `url` varchar(512) NOT NULL,
  `created_at` datetime NOT NULL,
  `title` varchar(512) NOT NULL DEFAULT '',
  `text` text,
  `attitudes_count` int(11) NOT NULL DEFAULT '0',
  `readcount` int(11) NOT NULL DEFAULT '0',
  `reposts_count` int(11) NOT NULL DEFAULT '0',
  `comments_count` int(11) NOT NULL DEFAULT '0',
  `userid` varchar(32) NOT NULL,
  `screen_name` varchar(32) NOT NULL,
  `type` tinyint(4) NOT NULL DEFAULT '0',
  `ext_data` text,
  `is_topline` tinyint(4) NOT NULL DEFAULT '0',
  `is_business` tinyint(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_url` (`url`(255)),
  KEY `idx_userid` (`userid`),
  KEY `idx_name` (`screen_name`),
  KEY `idx_created_at` (`created_at`)
) ENGINE=InnoDB AUTO_INCREMENT=328727437 DEFAULT CHARSET=utf8 |


rows = 328727437;
Run Code Online (Sandbox Code Playgroud)

查询需要几分钟.如何优化查询?我怎样才能使用覆盖指数?

执行计划是:

explain select id from weixin_kol_status where created_at>='2015-12-11 00:00:00' and created_at<='2015-12-11 23:59:59'\G;
    *************************** 1. row ***************************
               id: 1
      select_type: SIMPLE
            table: weixin_kol_status
             type: range
    possible_keys: idx_created_at
              key: idx_created_at
          key_len: 5
              ref: NULL
             rows: 1433704
            Extra: Using where; Using index
    1 row in set (0.00 sec)
Run Code Online (Sandbox Code Playgroud)

explain select id from weixin_kol_status where created_at='2015-12-11 00:00:00'\G; 
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: weixin_kol_status
         type: ref
possible_keys: idx_created_at
          key: idx_created_at
      key_len: 5
          ref: const
         rows: 1
        Extra: Using index
1 row in set (0.00 sec)
Run Code Online (Sandbox Code Playgroud)

但为什么第一个查询Extra: Using where; Using index,第二个查询Extra: Using index.第一个查询没有使用覆盖索引吗?

mdf*_*t13 2

如何使用覆盖索引?

你知道什么是覆盖索引吗?它是一个包含查询所需的所有列的索引。因此对于

select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
Run Code Online (Sandbox Code Playgroud)

最小覆盖指数会是这样的

      KEY `idx_created_url` (`created_at`, `url`)
Run Code Online (Sandbox Code Playgroud)

而对于

select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
Run Code Online (Sandbox Code Playgroud)

最小覆盖指数可能是

      KEY `idx_created_user_url` (`created_at`, `userid`, `url`)
Run Code Online (Sandbox Code Playgroud)

这也将涵盖第一个查询或

      KEY `idx_user_created_url` (`userid`, `created_at`, `url`)
Run Code Online (Sandbox Code Playgroud)

这不适用于第一个查询,但可以更好地优化第二个查询。

您可能必须写出url(512)而不只是url. VARCHAR列索引不好。如果您收到有关索引值太宽的错误,则可能无法在此查询中使用覆盖索引。

覆盖索引很有用,因为它可以回答内存中索引中的所有内容,而无需访问磁盘上的表。由于内存比磁盘快,因此具有加速查询的效果。当然,如果您的索引已调出,您仍然需要从磁盘加载它。因此,如果您的记忆力有限,这可能没有帮助。

请注意,查询将仅对每个表使用一个索引,因此每列上的单独索引不会覆盖任一查询。您需要一个复合索引来一次覆盖所有需要的列。

作为旁注,我认为你的><应该分别是>=<=。可能不会有太大区别,但你似乎每天跳过两秒钟。