选择主键:物种的科学名称或系统分配的数字标识符?

Abe*_*ejo 7 database-design primary-key unique-constraint

科学名称是公认的物种唯一标识符。但是,科学名称具有特殊字符,例如空格和点。它可以是一个很好的数据库唯一标识符还是应该分配/实现唯一的数字标识符?

如果是后者,是否有全球已知的数字标识符?或者应该为行分配自己的标识符?

gbn*_*gbn 12

我会使用我自己的标识符。

物种名称可能是唯一的,但是 - 它太长了 - 它是一个字符串

例如,在 SQL Server 中,如果用作聚簇主键,它将在非聚簇索引中使用,从而重复长字符串。并且通常外键omn子表将转到主键,从而再次重复

作为字符串,您有排序和比较(大小写、重音等)的开销。

使用代理数字键可以避免这些问题:但您必须在物种名称上创建唯一的非聚集索引。

物种名称也是一个很好的长期标识符吗?不是我的专业领域,但不是很多物种有替代名称、争议、重新分类或“也许是这个物种”?

示例:有多少种长颈鹿?9?2?6?8?4?


Zer*_*odf 10

作为一名前环境科学家,具有一些“虫子和兔子”背景(特别是鱼和反转),我建议使用您自己的标识符。

作为数据库管理员,您偶然发现了所谓的“物种问题”。其中有人认为物种的概念更像是一种哲学而非经验主义(Pigliucci 2003)。还要考虑到分类学家不会因为摆脱物种而出版(Jones 2017)。因此,动机总是从现有物种中创造新物种。数据库基础设施需要考虑到这一点。

以@gbn 为基础,有些生物体并不完全符合物种概念,这些物种的数据建模可能会变得复杂。考虑 Ambystomid 蝾螈的所有雌性杂交种群的情况(维基百科 2018)。爬虫学家使用动物 DNA 的染色体成分来称呼这些动物。因此,林奈物种方法行不通,因为这些动物的情况远比简单的孤雌生殖(雌性克隆)复杂得多。

在长颈鹿和蝾螈示例的基础上,与您的最终用户就其领域的约定进行协商是必要的。例如,真菌学家可能有独特的惯例。上面介绍的蝾螈问题的爬虫学家有自己的识别惯例(维基百科 2018)。

资料来源:

Pigliucci, M. (2003)。作为家庭相似性概念的物种:物种问题的(dis?)解决方案?。生物论文,25(6),596-602。

鼹鼠 - Hybrid_all-female_populations。在维基百科中。2018 年 2 月 10 日检索

琼斯,B.(2017 年)。少数坏科学家威胁要推翻分类法 命名物种构成了生物学的基础——但这些流氓研究人员正在揭露系统中的缺陷。史密森尼杂志。