设计此里程表的最佳方法是什么？

Question

设计此里程表的最佳方法是什么？

Gab*_*abe 4 schema sql-server-2008 database-design

我将填充每加仑英里数 (MPG) 表。它来自里程表源。

目前设置如下：

  id               (primary_key)
, truck_num
, start_date
, end_date
, start_miles
, end_miles
, start_fuel
, end_fuel
, miles
, gals
, mpg

Run Code Online (Sandbox Code Playgroud)

似乎有一些冗余。的miles是 (end_miles - start_miles)，对于同上gals。

我们应该预先计算这些miles和gals列并存储在数据库中吗？它肯定会使查询更容易，但会牺牲空间。mpg计算相同的问题。计算列会减慢速度，不是吗？

什么索引最有效？每周大约有 3,000 辆卡车（记录）成批插入。

我正在使用 SQL Server 2008 R2。

编辑：我将使用的示例查询

-- find average mpg for since ytd
select m.truck_num, avg(mpg)
from mpg m
join truck t on t.truck_num = m.truck_num
where start_date >= @begin_of_year and end_date <= @today
group by truck_num

Run Code Online (Sandbox Code Playgroud)

Answer 1

Nic*_*mas 7

计算列是你的朋友。 使用它们来捕获您无论如何都要进行的简单计算，并确保计算出的值是正确的。
如果要索引或过滤结果，请保留结果；如果您只需要偶尔提取值，请不要坚持它们。
使用CHECK约束捕获所有数据约束。

这是一个伪模式定义：

  id               PRIMARY KEY
, truck_num

, start_date
, end_date         CHECK (end_date > start_date)

, start_miles      CHECK (start_miles >= 0)
, end_miles        CHECK (end_miles > start_miles)

                   -- what if they refill the tank?
, start_gals       CHECK (start_gals >= 0)
, end_gals         CHECK (end_gals < start_gals AND end_gals >= 0)

-- all these should be computed
, miles = end_miles - start_miles
, gals = start_gals - end_gals
, mpg = miles/gals

Run Code Online (Sandbox Code Playgroud)

至于索引表，这是我的想法：

上的集群start_date ASC。这将满足您的WHERE条款。您总是通过增加插入数据start_date，这意味着在此集群方案下您的写入将始终是顺序的。您也总是通过查询来start_date满足您最大的查询模式。（每周 3,000 次插入不算什么。因为插入量如此之低，您甚至可以聚集在上start_date ASC, end_date ASC。）
在truck_num和上创建非聚集索引INCLUDE mpg。这应该满足你SELECT，JOIN和GROUP BY条款。如果你想ORDER BY mpg，那么在之后制作mpg索引键的一部分，truck_num而不是仅仅INCLUDE-ing 它。

完成后，按如下方式测试您的设置：

创建测试表
将它充满测试数据
创建索引
更新统计
运行最常见的查询
检查他们的计划和运行时间

归档时间：	14 年前
查看次数：	1353 次
最近记录：	14 年前