jl6*_*jl6 6 sql database-design data-modeling
假设我有一个持有时间戳的数据库.对于每个时间戳属性,我可以添加一个准确度属性,说明置信区间,因此存储的信息可能是,例如,"2012年7月1日12:13,+/ - 3个月".
但总的来说,录制准确性/置信度并非如此简单.家谱数据库可能需要记录一个人可能是另一个人的父亲的事实.
那么存储具有不同准确度/置信度的信息的一般原则或最佳实践是什么?
以你父亲为例,这很容易;不可能超过 100% 地确信某个人是另一个人的父亲;一般来说,不可能对任何事情有超过 100% 的信心!这反过来意味着,对于所有内容,您都可以简单地存储任何数据属性的百分比置信水平。
但是,您可能不想将置信水平存储为百分比;它取决于数据属性本身以及数据的含义。
例如,如果您想存储特定字符串与另一个字符串相比的“准确度”,您可能需要存储编辑距离。在您的时间戳示例中,我个人会存储最小值和最大值,尽管您也可以存储要添加或减去的月数;两者都可以快速计算数据库中的选择。
我可能不清楚地试图写的是,你的问题的答案并不取决于数据库,而是取决于其中的数据以及用户、业务等的需求。因为它取决于每个单独属性或的数据色谱柱需要单独的解决方案;不可能有一个“通用”解决方案。