数据库设计问题

Question

数据库设计问题

cha*_*ert 8 mysql database database-design

我有一个表单,用户提交不同的字段来创建事件.请求的字段数量和类型在每个表单上都有所不同,具体取决于事件的类别.设计此数据库的最佳方法是什么 - 如果事件包含所有可能的字段并且只是将未使用的字段置空？谢谢!

Answer 1

Ste*_*age 5

如果你开始考虑乔尔的建议,请到这里.

或者在这里

如果你不相信任何一个,建立他提到的4个表.只有4,不需要很长时间.然后将一些数据加载到它们中...然后尝试编写您要编写的查询...

更改列含义:

这实际上可以用基数估算.您的餐盘可能在4 - 20范围内,音乐会席位在1000 - 2000之间.一些基数计算从最小值到最大值并假设和平均分配(当缺少其他统计数据时)...

从4到2000意味着在GENERIC_COLUMN = n的任何地方,你要击中的行的百分比是总数的1/199.但实际上,如果你说EVNT_TYPE = Dinner和GENERIC_COLUMN = n,那么它真的会介于4和20,或总行数的1/16 ...所以卡估计的巨大摆动.(这可以用直方图来解决,但是显示自动化问题的关键只是强调如果它对机器来说是一个问题,它可能不是那么干净.)

所以,如果你这样做(比EAV更好,但......)

我建议为每个对象创建一个视图.

表EVENT(常用字段,Generic_Count)查看DINNER(公共字段,Generic_Count作为板)WHERE type = Dinner View CONCERT(公共字段,Generic_Count作为席位)WHERE type = Concert

然后根据EVENT选择NO ONE

但是,这是你不首先从概念数据模型开始遇到麻烦的地方.

你有EVENT的ENTITY和DINNER的另一个,完全从EVENT继承,另一个继承完全从EVENT继承的CONCERT.然后你可以在继承对象中设置一个差异化列,让你设置"TYPE"列,然后你甚至可以通过轻击一个开关来决定要构建多少个表.1张桌子,2张桌子或3张桌子..

至少你可以在powerDesigner中做到这一点.

为什么DDL被认为是如此糟糕？

EAV模型的创建和这样的问题围绕着要避免使用DDL的想法进行组织.为什么ALTER TABLE何时可以插入新的属性行？人们根据错误的效用函数做出糟糕的数据模型设计决策.这些函数类似于"无可空列","表越少越好","没有ddl只是添加新属性".插入属性表而不是'.

想象一下这样的数据建模:雕刻家会说木头或石头已经有了块内的图形,它们只是去掉它的碎片来展示它.

您的问题空间已经有了数据模型,发现它只是您的工作......它将拥有所需数量的表和列.试图强制它符合上述实用功能之一是事情发生了可怕的错误.

在您的情况下,您是否想知道您在过去两周内添加的所有活动？现在想想可能的模型.每个事件类型一个表意味着在n个表上求和以找到答案,并且每个新事件类型添加一个新表,并且每个"所有事件"查询都将改变.您可以构建这些表的UNION ALL视图,但您必须记住将每个新表添加到视图中.通过这样的视图进行调试是一件痛苦的事.

假设您可能需要大量关于所有事件的指标,一个表更有意义(至少对于您的事件数据的一些常见部分 - 如事件名称,赞助商ID,场地ID,事件开始时间,活动结束时间,可用场地对于设置时间等.)这些字段(让我们规定)对每个事件都是通用的.

那么现在如何处理其他列呢？两个选项,可空字段或垂直分区表.后者是前者的优化.如果您阅读任何数据库优化书籍或博客,我从中获取的主要内容是过早优化会导致死亡.我看到人们在问题出现问题之前就已经实施了许多问题策略.一位同事对他希望我提供帮助的问题很慢.它加载了优化器提示.我删除了它们并且SQL尖叫了......我不知道为什么他暗示它但他没有有效地做到这一点我很确定他从未见过这个问题因此这只是过早的优化.

当您拥有大量数据并且有一些经常访问的数据和其他不太有用的数据时,您可以执行垂直分区.如果只包装一些公共区域,您可以打包一个包含更多块的表.每个块更多的行=更快的表格扫描...并不会真正影响通过索引查找单个行的速度.正如你所看到的,垂直分区有一个特定的问题,它可以解决(其他人也像行链接),所以如果你确定要成为一个问题,那么一定要以这种方式开始.

这种方法存在根本问题.我用了一个如何出错的例子,但它绝不是唯一的例子.解决这个问题不会改变这样一个事实:RDBMS不能像这样工作,也不会改变应用程序或其他任何你想做的事情.我在上面添加了更多评论. (2认同)

归档时间：	15 年，5 月前
查看次数：	591 次
最近记录：	15 年，5 月前