Mic*_*han 22 database database-design
我目前正计划开发音乐流媒体应用程序.我想知道作为服务器上的表中的主键会更好.ID int或唯一字符串.
方法1:
歌曲表: SongID(int),Title(字符串),*Artist**(字符串),Length(int),*Album**(string)
流派表格 类型(字符串),名称(字符串)
SongGenre:***SongID****(int),***类型****(字符串)
方法2
歌曲表: SongID(int),Title(字符串),*ArtistID**(int),Length(int),*AlbumID**(int)
流派表 GenreID(int),名称(字符串)
SongGenre:***SongID****(int),***GenreID****(int)
键:粗体 =主键,*字段**=外键
我目前正在使用方法2进行设计,因为我相信它会加快查找性能并减少使用空间,因为int占用的空间比字符串少得多.
有什么理由这不是个好主意吗?有什么我应该知道的吗?
Ode*_*ded 20
你正在做正确的事情 - 身份字段应该是数字而不是基于字符串,既节省空间又出于性能原因(字符串上的匹配键比整数上的匹配慢).
Dav*_*ave 14
有什么理由这不是个好主意吗?有什么我应该知道的吗?
是.如果需要在单个数据库之外唯一标识相同的数据,则整数ID非常糟糕.例如,如果必须将相同的数据复制到具有可能预先存在的数据的另一个数据库系统中,或者您具有分布式数据库.要注意的最重要的事情是,类似的整数7481
在该数据库之外没有任何意义.如果以后需要增长该数据库,则可能无法通过手术删除您的数据.
另外要记住的是整数ID不够灵活,因此不能轻易用于特殊情况.互联网协议的设计者理解这一点并采取预防措施,将某些数字块以某种方式分配为"特殊"(广播IP,私有IP,网络IP).但这只是可能的,因为有一个围绕这些数字使用的协议.许多数据库不能在如此明确定义的协议中运行.
FWIW,有点像试图决定"强类型"编程范式是否优于"弱/动态类型"编程范例.这取决于你需要做什么.
从软件的角度来看,GUID在全球范围内更为独特.
引用自:主键:ID与GUID
使用GUID作为行标识值比32位整数感觉更自然 - 当然更真实唯一.数据库大师Joe Celko 似乎同意.GUID主键很适合许多开发方案,例如复制,或者需要在数据库外部生成主键时.但它仍然是在平衡传统的4字节整数ID和16字节GUID之间的权衡的问题:
GUID优点
- 每个表,每个数据库,每个服务器都是唯一的
- 允许轻松合并来自不同数据库的记录
- 允许跨多个服务器轻松分发数据库
- 您可以在任何地方生成ID,而不必往返数据库
- 大多数复制方案无论如何都需要GUID列
GUID缺点
- 它比传统的4字节索引值大4倍; 如果你不小心,这可能会产生严重的性能和存储影响
- 在userid ='{BAE7DF4-DDF-3RG-5TY3E3RF456AS10}'的地方调试很麻烦
- 生成的GUID应该是部分顺序的以获得最佳性能(例如,SQL 2005上的newsequentialid())并允许使用聚簇索引