Gab*_*abe 4 schema sql-server-2008 database-design
我将填充每加仑英里数 (MPG) 表。它来自里程表源。
目前设置如下:
id (primary_key)
, truck_num
, start_date
, end_date
, start_miles
, end_miles
, start_fuel
, end_fuel
, miles
, gals
, mpg
Run Code Online (Sandbox Code Playgroud)
似乎有一些冗余。的miles
是 (end_miles - start_miles)
,对于同上gals
。
我们应该预先计算这些miles
和gals
列并存储在数据库中吗?它肯定会使查询更容易,但会牺牲空间。mpg
计算相同的问题。计算列会减慢速度,不是吗?
什么索引最有效?每周大约有 3,000 辆卡车(记录)成批插入。
我正在使用 SQL Server 2008 R2。
编辑:我将使用的示例查询
-- find average mpg for since ytd
select m.truck_num, avg(mpg)
from mpg m
join truck t on t.truck_num = m.truck_num
where start_date >= @begin_of_year and end_date <= @today
group by truck_num
Run Code Online (Sandbox Code Playgroud)
CHECK
约束捕获所有数据约束。这是一个伪模式定义:
id PRIMARY KEY
, truck_num
, start_date
, end_date CHECK (end_date > start_date)
, start_miles CHECK (start_miles >= 0)
, end_miles CHECK (end_miles > start_miles)
-- what if they refill the tank?
, start_gals CHECK (start_gals >= 0)
, end_gals CHECK (end_gals < start_gals AND end_gals >= 0)
-- all these should be computed
, miles = end_miles - start_miles
, gals = start_gals - end_gals
, mpg = miles/gals
Run Code Online (Sandbox Code Playgroud)
至于索引表,这是我的想法:
start_date ASC
。这将满足您的WHERE
条款。您总是通过增加 插入数据start_date
,这意味着在此集群方案下您的写入将始终是顺序的。您也总是通过查询来start_date
满足您最大的查询模式。(每周 3,000 次插入不算什么。因为插入量如此之低,您甚至可以聚集在 上start_date ASC, end_date ASC
。)truck_num
和上创建非聚集索引INCLUDE mpg
。这应该满足你SELECT
,JOIN
和GROUP BY
条款。如果你想ORDER BY mpg
,那么在之后制作mpg
索引键的一部分,truck_num
而不是仅仅INCLUDE
-ing 它。完成后,按如下方式测试您的设置:
归档时间: |
|
查看次数: |
1353 次 |
最近记录: |