数字VS Varchar(2)主键

11 performance varchar numbers primary-key

我现在对项目的这一点,我需要设计我的数据库(Oracle).通常,对于status和countries表,我不使用数字主键

STATUS (max 6)
AC --> Active
DE --> Deleted

COUNTRIES (total 30)
UK --> United Kingdom
IT --> Italy
GR --> Greece
Run Code Online (Sandbox Code Playgroud)

这些表是静态的,不是通过应用程序更新的,并且预计将来不会进行更改,因此在使用这些值作为外键的表中不会出现更新问题.

该应用程序的主表将使用状态和国家(不止一次,例如来源国,目的地国家),预计每年将增加600000行

所以我的问题是,当查询3个表的连接时,这些VARCHAR(2)键是否会对性能产生影响.第一个会明显慢于第二个吗?

SELECT m.*,
       s.status_name,
       c.country_name
  FROM main m, status s, countries c
 WHERE m.status_cd = s.status_cd
   AND m.country_cd = c.country_cd
   AND m.status_cd = 'AC'
   AND m.country_cd = 'UK'

SELECT m.*,
       s.status_name,
       c.country_name
  FROM main m, status s, countries c
 WHERE m.status_cd = s.status_cd
   AND m.country_cd = c.country_cd
   AND m.status_cd = 1
   AND m.country_cd = 2
Run Code Online (Sandbox Code Playgroud)

澄清:

状态不是二进制(表名旁边的"最大6").值可能是:

* active
* deleted
* draft
* send
* replaced
Run Code Online (Sandbox Code Playgroud)

我们需要向用户显示解码值,因此我们需要名称.

Jon*_*ler 5

状态和国家/地区表都非常小,无论是否正式声明,它们都将成为实际存储器.实际上,除了外键通常需要在引用的主键字段上使用索引之外,您可能不想打扰表上的任何索引.

不同类型的连接之间的性能差异可以忽略不计,如果有的话,数字代码会更慢,因为要存储的"更多"数据(但它们都很小,可以忽略不计).

所以,请使用自然代码.除此之外,第一个例子中的SQL更清晰; '英国'和'AC'比1和2更有意义.

在非Oracle DBMS中,您可能会对状态和国家/地区代码值使用CHAR(2).Oracle用户倾向于将VARCHAR2用于所有内容; 我不确定使用CHAR(2)列是否会受到惩罚,特别是因为列值是固定长度.(例如,在Informix下,VARCHAR(2)字段 - 最多两个字符的字段 - 将存储为3个字节,长度(在您的情况下总是2)和2个数据字节.相比之下,CHAR(2) )字段只占用2个字节.)

  • 在Oracle中,CHAR和VARCHAR字段完全相同地存储在磁盘上 - 除了强制将CHAR字段空间填充到指定长度. (2认同)

phi*_*yne 0

如果“状态”是(并且永远是?)二进制活动/已删除字段,为什么还要为表烦恼呢?正常化似乎走向了不切实际的极端。

简单地使用tinyint(1)字段并将活动/删除状态记录为1或0肯定会更快,更不用说更容易

这完全消除了您的一个连接,这一定是一件好事。