小编sen*_*bot的帖子

创建索引需要很长时间

大约2个月前,我将EnWikipedia数据(http://dumps.wikimedia.org/enwiki/20120211/)导入mysql.

完成导入EnWikipedia数据后,我一直在mysql的EnWikipedia数据库表中创建索引大约2个月.

现在,我已经达到了在"pagelinks"中创建索引的程度.

但是,通过这一点似乎需要无限的时间.

因此,我检查了剩余的时间,以确保我的直觉是正确的.

因此,预计剩余时间为60天(假设我从头开始再次在"pagelinks"中创建索引.)

My EnWikipedia database has 7 tables: 
"categorylinks"(records: 60 mil, size: 23.5 GiB), 
"langlinks"(records: 15 mil, size: 1.5 GiB), 
"page"(records: 26 mil, size 4.9 GiB), 
"pagelinks"(records: 630 mil, size: 56.4 GiB), 
"redirect"(records: 6 mil, size: 327.8 MiB), 
"revision"(records: 26 mil, size: 4.6 GiB) and "text"(records: 26 mil, size: 60.8 GiB).
Run Code Online (Sandbox Code Playgroud)

我的服务器是...... Linux版本2.6.32-5-amd64(Debian 2.6.32-39),内存16GB,2.39Ghz Intel 4核心

创造指数需要这么长时间的常见现象吗?有没有人有更好的解决方案来更快地创建索引?

提前致谢 !


PS:我做了以下操作来检查剩余时间.

参考文献(对不起,以下页面用日文写成):http://d.hatena.ne.jp/sh2/20110615

1.我在"pagelink"中有记录.

 mysql> select count(*) from pagelinks;
 +-----------+ 
 | count(*)  |
 +-----------+ 
 | …
Run Code Online (Sandbox Code Playgroud)

mysql innodb

12
推荐指数
1
解决办法
1万
查看次数

标签 统计

innodb ×1

mysql ×1