lin*_*erg 3 mysql int varchar count type-conversion
我正在使用 MySQL 在我的大学的数据库课程中做作业。我们已经建立了一个高尔夫球俱乐部的数据库,我们(除其他外)可以在其中存储玩家从不同游戏中获得的结果。
现在我正在为作业编写报告,我试图证明最好使用 int 而不是 varchar 来存储结果。如果使用 int,被取消资格的玩家将因此获得 NULL 值。如果使用 varchar,它们将得到一个字符串:“不合格”。
我想知道的事情是:
varchar为intif avg()is used(例如)?varchar包含“52”、“68”、“72”的,可以计算平均值吗?您的问题可以通过运行简单的测试来回答:
drop table if exists golf;
create table golf(id int, int_col int, char_col varchar(50));
insert into golf(id, int_col, char_col) values
(1, 10, '10'),
(2, 20, '20');
select avg(int_col), avg(char_col) from golf;
Run Code Online (Sandbox Code Playgroud)
结果:
avg(int_col) | avg(char_col)
15,0000 | 15
Run Code Online (Sandbox Code Playgroud)
如您所见,VARCHAR 列上的 AVG 返回预期结果。
现在添加一行NULL和'disqualified'
drop table if exists golf;
create table golf(id int, int_col int, char_col varchar(50));
insert into golf(id, int_col, char_col)values
(1, 10, '10'),
(2, 20, '20'),
(2, NULL, 'disqualified');
select avg(int_col), avg(char_col) from golf;
Run Code Online (Sandbox Code Playgroud)
现在结果不同了:
avg(int_col) | avg(char_col)
15,0000 | 10
Run Code Online (Sandbox Code Playgroud)
http://rextester.com/RXOQAZ69820
原因是:WhileNULL被 AVG 忽略,'disqualified'转换为0,结果为(10 + 20 + 0) / 3 = 10。
要测试性能,您可以创建一个包含虚拟数据的大表。在带有序列插件的 MariaDB 中,这可以轻松完成:
drop table if exists golf;
create table golf(id mediumint primary key, int_col smallint, char_col varchar(50));
insert into golf(id, int_col, char_col)
select seq id
, floor(rand(1)*1000) int_col
, floor(rand(1)*1000) char_col
from seq_1_to_1000000;
Run Code Online (Sandbox Code Playgroud)
平均超过 INT:
select avg(int_col) from golf;
-- query time: 187 msec
Run Code Online (Sandbox Code Playgroud)
VARCHAR 上的平均值:
select avg(char_col) from golf;
-- query time: 203 msec
Run Code Online (Sandbox Code Playgroud)
最后但并非最不重要的一点:您不应将字符串类型用于数值。另一个原因是排序。如果您尝试对存储为字符串的数字进行排序,您将得到类似[10, 2, 22, 3] 的结果。
您也不应该为不同的信息类型使用一列。在您的情况下,您可以再定义一列,例如status值为“完成”或“取消资格”。另一种可能的方法是disqualified使用带有值0或的标志列1。
| 归档时间: |
|
| 查看次数: |
2970 次 |
| 最近记录: |