关于连接性能与系统非规范化的任何好的文献?

New*_*ian 7 sql legacy-code denormalization premature-optimization

作为这个问题的必然结果,我想知道是否有好的比较研究我可以参考并传递使用RDMBS的优点做连接优化与系统非规范化,以便始终一次访问一个表.

具体来说,我想要的信息:

  • 性能或标准化与非规范化.
  • 规范化与非规范化系统的可扩展性.
  • 非规范化的可维护性问题.
  • 模型一致性问题与非规范化.

有一段历史可以看到我要去的地方:我们的系统使用内部数据库抽象层,但它很老,无法处理多个表.因此,必须在每个相关表上使用多个查询来实例化所有复杂对象.现在为了确保系统始终使用单个表格,在整个表格中使用重度系统非规范化,有时会将两个或三个层次压平.至于nn关系,他们似乎已经通过精心设计他们的数据模型来解决这个问题,以避免这种关系,并始终回到1-n或n-1.

最终结果是一个复杂的过于复杂的系统,客户经常抱怨性能.在分析这样的瓶颈时,他们永远不会质疑系统所基于的这些基本前提,并且总是寻找其他解决方案.

我错过了什么 ?我认为整个想法是错误的,但不知何故缺乏无可辩驳的证据来证明(或反驳)它,这就是我转向你的集体智慧,指向我的良好,被广泛接受的文学,可以说服我团队中的其他人方法是错误的(说服我,我对于一致的数据模型我太偏执和教条).

我的下一步是建立自己的测试平台并收集结果,因为我讨厌重新发明轮子我想知道这个主题已经有了什么.

----编辑注意:系统最初是使用没有数据库系统的平面文件构建的...后来才将其移植到数据库,因为客户端坚持使用Oracle进行系统管理.他们没有重构,只是简单地添加了对现有系统的关系数据库的支持.平面文件支持后来被删除,但我们仍在等待重构利用数据库.

djn*_*jna 2

一个想法:您有明显的阻抗不匹配,数据访问层只允许访问一个表?就此打住,这根本不符合关系数据库的最佳使用。关系数据库旨在很好地执行复杂查询。除了返回单个表之外别无选择,并且可能在业务层中进行任何连接,这是没有意义的。

对于标准化的合理性以及潜在的一致性成本,您可以参考 Codd 以后的所有材料,请参阅维基百科文章

我预测对这类东西进行基准测试将是一项永无止境的活动,特殊情况将会比比皆是。我声称规范化是“正常的”,人们从干净的数据库设计中获得了足够好的性能。也许一种方法可以是一项调查:“您的数据标准化程度如何?从 0 到 4 进行评分。”