小编Ras*_*sha的帖子

为提供大量数据的查询提供最佳MySQL设置？

我是一名科学家,我使用MySQL作为数值模拟结果的存储空间.通常我有一组通过我的实验和控制集获得的数据.这两个数据集存储在一个表中.一个指示器字段告诉我记录是来自实验还是来自控制集.该表通常有大约1亿条记录.5000万次实验和5000万次对照.

当我对数据进行后期处理时,我的典型任务包括首先发出以下两个查询:

select b0,t0 from results_1mregr_c_ew_f where RC='E' and df>60  /// getting experiments data

Run Code Online (Sandbox Code Playgroud)

和

select b0,t0 from results_1mregr_c_ew_f where RC='C' and df>60 /// getting controls data

Run Code Online (Sandbox Code Playgroud)

我在RC上有一个多列索引,df.这些查询需要花费大量时间,查询大部分时间都会花费"发送数据"

我在8核MacPro上使用12GB RAM运行它.我是这台机器的单个用户,这个任务是主要任务,因此我可以将所有RAM专用于MySQL.所有表都是MyISAM(我可以转换它们,如果这会增加我的查询速度).

我很感激有关如何加快这些查询的任何建议.我应该更改一些设置,索引,查询....

在每个查询中,我希望能够获得大约5000万条记录. 请注意,由于管理原因,将表拆分为两个表,其中一个包含实验,另一个包含控制观察.

这是输出:

explain select b0, t0 from results_1mregr_c_ew_f  where RC="C" and df>60
+----+-----------+---------------------+-----+-------------+---+-------+----+-------+-----------+
| id |select_type|table                |type |possible_keys|key|key_len|ref |rows   |Extra      |
+----+-----------+---------------------+-----+-------------+---+-------+----+-------+-----------+
|  1 |SIMPLE     |results_1mregr_c_ew_f|range|ff           |ff |11     |NULL|6251121|Using where|
+----+-----------+---------------------+-----+-------------+---+-------+----+-------+-----------+

Run Code Online (Sandbox Code Playgroud)

以下是来自的输出:

show indexes from results_1mregr_c_ew_f;
+-----------------------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| Table                 | Non_unique | Key_name | Seq_in_index | Column_name | …

Run Code Online (Sandbox Code Playgroud)

mysql performance

Ras*_*sha

2010 11-09

7
推荐指数

1
解决办法

7341
查看次数

标签统计

mysql ×1

performance ×1

为提供大量数据的查询提供最佳MySQL设置？

标签 统计

小编Ras_sha的帖子

标签统计