6 mysql indexing performance datetime
我想运行这些查询:
select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
和
select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
...使用此表定义:
CREATE TABLE `weixin_kol_status` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`url` varchar(512) NOT NULL,
`created_at` datetime NOT NULL,
`title` varchar(512) NOT NULL DEFAULT '',
`text` text,
`attitudes_count` int(11) NOT NULL DEFAULT '0',
`readcount` int(11) NOT NULL DEFAULT '0',
`reposts_count` int(11) NOT NULL DEFAULT '0',
`comments_count` int(11) NOT NULL DEFAULT '0',
`userid` varchar(32) NOT NULL,
`screen_name` varchar(32) NOT NULL,
`type` tinyint(4) NOT NULL DEFAULT '0',
`ext_data` text,
`is_topline` tinyint(4) NOT NULL DEFAULT '0',
`is_business` tinyint(4) NOT NULL DEFAULT '0',
PRIMARY KEY (`id`),
UNIQUE KEY `idx_url` (`url`(255)),
KEY `idx_userid` (`userid`),
KEY `idx_name` (`screen_name`),
KEY `idx_created_at` (`created_at`)
) ENGINE=InnoDB AUTO_INCREMENT=328727437 DEFAULT CHARSET=utf8 |
rows = 328727437;
Run Code Online (Sandbox Code Playgroud)
查询需要几分钟.如何优化查询?我怎样才能使用覆盖指数?
执行计划是:
explain select id from weixin_kol_status where created_at>='2015-12-11 00:00:00' and created_at<='2015-12-11 23:59:59'\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: weixin_kol_status
type: range
possible_keys: idx_created_at
key: idx_created_at
key_len: 5
ref: NULL
rows: 1433704
Extra: Using where; Using index
1 row in set (0.00 sec)
Run Code Online (Sandbox Code Playgroud)
和
explain select id from weixin_kol_status where created_at='2015-12-11 00:00:00'\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: weixin_kol_status
type: ref
possible_keys: idx_created_at
key: idx_created_at
key_len: 5
ref: const
rows: 1
Extra: Using index
1 row in set (0.00 sec)
Run Code Online (Sandbox Code Playgroud)
但为什么第一个查询Extra: Using where; Using index,第二个查询Extra: Using index.第一个查询没有使用覆盖索引吗?
如何使用覆盖索引?
你知道什么是覆盖索引吗?它是一个包含查询所需的所有列的索引。因此对于
Run Code Online (Sandbox Code Playgroud)select url from weixin_kol_status where created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
最小覆盖指数会是这样的
KEY `idx_created_url` (`created_at`, `url`)
Run Code Online (Sandbox Code Playgroud)
而对于
Run Code Online (Sandbox Code Playgroud)select url from weixin_kol_status where userid in ('...') and created_at>'2015-12-11 00:00:00' and created_at<'2015-12-11 23:59:59';
最小覆盖指数可能是
KEY `idx_created_user_url` (`created_at`, `userid`, `url`)
Run Code Online (Sandbox Code Playgroud)
这也将涵盖第一个查询或
KEY `idx_user_created_url` (`userid`, `created_at`, `url`)
Run Code Online (Sandbox Code Playgroud)
这不适用于第一个查询,但可以更好地优化第二个查询。
您可能必须写出url(512)而不只是url. VARCHAR列索引不好。如果您收到有关索引值太宽的错误,则可能无法在此查询中使用覆盖索引。
覆盖索引很有用,因为它可以回答内存中索引中的所有内容,而无需访问磁盘上的表。由于内存比磁盘快,因此具有加速查询的效果。当然,如果您的索引已调出,您仍然需要从磁盘加载它。因此,如果您的记忆力有限,这可能没有帮助。
请注意,查询将仅对每个表使用一个索引,因此每列上的单独索引不会覆盖任一查询。您需要一个复合索引来一次覆盖所有需要的列。
作为旁注,我认为你的>和<应该分别是>=和<=。可能不会有太大区别,但你似乎每天跳过两秒钟。
| 归档时间: |
|
| 查看次数: |
77 次 |
| 最近记录: |