设计此里程表的最佳方法是什么?

Gab*_*abe 4 schema sql-server-2008 database-design

我将填充每加仑英里数 (MPG) 表。它来自里程表源。

目前设置如下:

  id               (primary_key)
, truck_num
, start_date
, end_date
, start_miles
, end_miles
, start_fuel
, end_fuel
, miles
, gals
, mpg
Run Code Online (Sandbox Code Playgroud)

似乎有一些冗余。的miles(end_miles - start_miles),对于同上gals

我们应该预先计算这些milesgals列并存储在数据库中吗?它肯定会使查询更容易,但会牺牲空间。mpg计算相同的问题。计算列会减慢速度,不是吗?

什么索引最有效?每周大约有 3,000 辆卡车(记录)成批插入。

我正在使用 SQL Server 2008 R2。

编辑:我将使用的示例查询

-- find average mpg for since ytd
select m.truck_num, avg(mpg)
from mpg m
join truck t on t.truck_num = m.truck_num
where start_date >= @begin_of_year and end_date <= @today
group by truck_num
Run Code Online (Sandbox Code Playgroud)

Nic*_*mas 7

  • 计算列是你的朋友。 使用它们来捕获您无论如何都要进行的简单计算,并确保计算出的值是正确的。
  • 如果要索引或过滤结果,保留结果如果您只需要偶尔提取值,请不要坚持它们
  • 使用CHECK约束捕获所有数据约束。

这是一个伪模式定义:

  id               PRIMARY KEY
, truck_num

, start_date
, end_date         CHECK (end_date > start_date)

, start_miles      CHECK (start_miles >= 0)
, end_miles        CHECK (end_miles > start_miles)

                   -- what if they refill the tank?
, start_gals       CHECK (start_gals >= 0)
, end_gals         CHECK (end_gals < start_gals AND end_gals >= 0)

-- all these should be computed
, miles = end_miles - start_miles
, gals = start_gals - end_gals
, mpg = miles/gals
Run Code Online (Sandbox Code Playgroud)

至于索引表,这是我的想法:

  • 上的集群start_date ASC这将满足您的WHERE条款。您总是通过增加 插入数据start_date,这意味着在此集群方案下您的写入将始终是顺序的。您也总是通过查询来start_date满足您最大的查询模式。(每周 3,000 次插入不算什么。因为插入量如此之低,您甚至可以聚集在 上start_date ASC, end_date ASC。)
  • truck_num和上创建非聚集索引INCLUDE mpg这应该满足你SELECTJOINGROUP BY条款。如果你想ORDER BY mpg,那么在之后制作mpg索引键的一部分,truck_num而不是仅仅INCLUDE-ing 它。

完成后,按如下方式测试您的设置:

  1. 创建测试表
  2. 将它充满测试数据
  3. 创建索引
  4. 更新统计
  5. 运行最常见的查询
  6. 检查他们的计划和运行时间