分组,汇总和求和树数据的最佳方法是什么?

Bob*_*Bob 2 sql t-sql sql-server sql-server-2005 hierarchical

给出一个自引用表

Item 
-------------
Id (pk)
ParentId (fk)
Run Code Online (Sandbox Code Playgroud)

使用相关值的相关表

ItemValue
-------------
ItemId (fk)
Amount
Run Code Online (Sandbox Code Playgroud)

还有一些样本数据

Item                       ItemValues 
Id      ParentId           ItemId      Amount
--------------------       ----------------------
1       null               1           10
2       1                  3           40
3       1                  3           20
4       2                  4           10
5       2                  5           30
6       null
7       6
8       7
Run Code Online (Sandbox Code Playgroud)

我需要一个Item.Id直接的孩子,带着ItemValue.Amounts他们,他们的孩子和他们的孩子一直到树上的所有人的总和.

例如,如果1传入,则树将是输出2, 3, 4, 5的直接子节点2, 3

 ItemId    Amount
 ------------------
 2         40     (values from ItemIds 4 & 5)
 3         60     (values from ItemId 3)
Run Code Online (Sandbox Code Playgroud)

应该采用什么样的方法来实现这种行为?

我正在考虑使用CTE,但我想知道是否有更好/更快的方法.

Pet*_*hia 6

假设您的层次结构不太深,那么像这样的递归CTE会起作用:

declare @ParentId int;
set @ParentId = 1;

;with 
  Recurse as (
    select 
      a.Id as DirectChildId
    , a.Id
    from Item a 
    where ParentId = @ParentId
    union all
    select
      b.DirectChildId
    , a.Id
    from Item a 
    join Recurse b on b.Id = a.ParentId
    )
select
  a.DirectChildId, sum(b.Amount) as Amount
from Recurse a
left join ItemValues b on a.Id = b.ItemId
group by
  DirectChildId;
Run Code Online (Sandbox Code Playgroud)

非CTE方法需要某种形式的迭代,基于游标或其他方式.因为它是一个存储过程,它有可能,并且如果有很多数据可以通过递归,它可能会更好地扩展,只要你适当地切片数据.

如果聚簇索引位于Id上,则在ParentId上添加非聚集索引.作为覆盖索引,它将满足初始搜索和书签查找.然后,聚簇索引将帮助进行递归连接.

如果聚簇索引已经在ParentId上,则在Id上添加非聚集索引.它们在一起几乎与上述相同.对于ItemValues,如果实际表格宽于此值,您可能需要(ItemId)INCLUDE(Amount)上的索引.