MySQL AVG() 的 varchar 可能吗?

lin*_*erg 3 mysql int varchar count type-conversion

我正在使用 MySQL 在我的大学的数据库课程中做作业。我们已经建立了一个高尔夫球俱乐部的数据库,我们(除其他外)可以在其中存储玩家从不同游戏中获得的结果。

现在我正在为作业编写报告,我试图证明最好使用 int 而不是 varchar 来存储结果。如果使用 int,被取消资格的玩家将因此获得 NULL 值。如果使用 varchar,它们将得到一个字符串:“不合格”。

我想知道的事情是:

  1. 当计算即将发生时,MySQL 是否会自动转换varcharintif avg()is used(例如)?
  2. 如果是这样,这是否会大大降低数据库的速度(与使用 int 相比)?
  3. 是否可以对字符串值进行计算?例如,如果结果属性是varchar包含“52”、“68”、“72”的,可以计算平均值吗?
  4. 如果我得到了上面列出的字符串加上“不合格”的结果,会发生什么?它会像忽略 int 的 NULL 一样忽略该字符串吗?

Pau*_*gel 5

您的问题可以通过运行简单的测试来回答:

drop table if exists golf;
create table golf(id int, int_col int, char_col varchar(50));
insert into golf(id, int_col, char_col) values
    (1, 10, '10'),
    (2, 20, '20');

select avg(int_col), avg(char_col) from golf;
Run Code Online (Sandbox Code Playgroud)

结果:

avg(int_col) | avg(char_col)
     15,0000 |            15
Run Code Online (Sandbox Code Playgroud)

http://rextester.com/NNAZ9432

如您所见,VARCHAR 列上的 AVG 返回预期结果。

现在添加一行NULL'disqualified'

drop table if exists golf;
create table golf(id int, int_col int, char_col varchar(50));
insert into golf(id, int_col, char_col)values
    (1, 10, '10'),
    (2, 20, '20'),
    (2, NULL, 'disqualified');

select avg(int_col), avg(char_col) from golf;
Run Code Online (Sandbox Code Playgroud)

现在结果不同了:

avg(int_col) | avg(char_col)
     15,0000 |            10
Run Code Online (Sandbox Code Playgroud)

http://rextester.com/RXOQAZ69820

原因是:WhileNULL被 AVG 忽略,'disqualified'转换为0,结果为(10 + 20 + 0) / 3 = 10

要测试性能,您可以创建一个包含虚拟数据的大表。在带有序列插件的 MariaDB 中,这可以轻松完成:

drop table if exists golf;
create table golf(id mediumint primary key, int_col smallint, char_col varchar(50));
insert into golf(id, int_col, char_col)
    select seq id
         , floor(rand(1)*1000) int_col
         , floor(rand(1)*1000) char_col
    from seq_1_to_1000000;
Run Code Online (Sandbox Code Playgroud)

平均超过 INT:

select avg(int_col) from golf;
-- query time: 187 msec
Run Code Online (Sandbox Code Playgroud)

VARCHAR 上的平均值:

select avg(char_col) from golf;
-- query time: 203 msec
Run Code Online (Sandbox Code Playgroud)

最后但并非最不重要的一点:您不应将字符串类型用于数值。另一个原因是排序。如果您尝试对存储为字符串的数字进行排序,您将得到类似[10, 2, 22, 3] 的结果

您也不应该为不同的信息类型使用一列。在您的情况下,您可以再定义一列,例如status值为“完成”或“取消资格”。另一种可能的方法是disqualified使用带有值0或的标志列1