好的,这是一个简单的问题抽象:
2个变量(male_users和female_users)用于存储2组用户,即男性和女性
select * from users where gender = 'male' 然后将结果存储在male_users中
select * from users where gender = 'female'然后将结果存储在female_users中
' select * from users'然后循环结果集来过滤程序中的男性用户php代码片段将是这样的:
$result = mysql_query('select * from users');
while (($row=mysql_fetch_assoc(result)) != null) {
if ($row['gender'] == 'male'){// add to male_users}
else if ($row['gender'] == 'female'){// add to female_users}
}
Run Code Online (Sandbox Code Playgroud)
哪一个更有效,被认为是更好的方法?
这只是问题的简单说明.真实的项目可能有更大的表来查询和更多的过滤选项.
提前致谢!
任何应用程序的经验法则都是让DB完成它做得很好的事情:过滤,排序和连接.
将查询分成它们自己的函数或类方法:
$men = $foo->fetchMaleUsers();
$women = $foo->fetchFemaleUsers();
Run Code Online (Sandbox Code Playgroud)
我使用Steven的PostgreSQL演示了一个完整的表扫描查询,其性能是两个单独的索引查询的两倍,并使用MySQL模拟它(在实际问题中使用):
CREATE TABLE `gender_test` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`gender` enum('male','female') NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=26017396 DEFAULT CHARSET=utf8
Run Code Online (Sandbox Code Playgroud)
我将性别类型更改为不是VARCHAR(20),因为它更符合本列的目的,我还提供了一个主键,就像您期望在表上而不是任意的DOUBLE值.
mysql> select sql_no_cache * from gender_test WHERE gender = 'male';
12995993 rows in set (31.72 sec)
mysql> select sql_no_cache * from gender_test WHERE gender = 'female';
13004007 rows in set (31.52 sec)
mysql> select sql_no_cache * from gender_test;
26000000 rows in set (32.95 sec)
Run Code Online (Sandbox Code Playgroud)
我相信这不需要解释.
ALTER TABLE gender_test ADD INDEX (gender);
Run Code Online (Sandbox Code Playgroud)
...
mysql> select sql_no_cache * from gender_test WHERE gender = 'male';
12995993 rows in set (15.97 sec)
mysql> select sql_no_cache * from gender_test WHERE gender = 'female';
13004007 rows in set (15.65 sec)
mysql> select sql_no_cache * from gender_test;
26000000 rows in set (27.80 sec)
Run Code Online (Sandbox Code Playgroud)
这里显示的结果与史蒂文的数据截然不同.索引查询的执行速度几乎是全表扫描的两倍.这是使用常识列定义的正确索引表.我根本不了解PostgreSQL,但是在Steven的例子中必须有一些重要的错误配置才能显示类似的结果.
鉴于PostgreSQL的声誉比MySQL更好,或者至少和MySQL一样好,我敢说如果使用得当,PostgreSql会表现出类似的性能.
另请注意,在同一台机器上,过度简化的for循环执行5200万次比较需要额外的7.3秒才能执行.
<?php
$N = 52000000;
for($i = 0; $i < $N; $i++) {
if (true == true) {
}
}
Run Code Online (Sandbox Code Playgroud)
我认为给出这些数据更好的方法是显而易见的.
| 归档时间: |
|
| 查看次数: |
1579 次 |
| 最近记录: |