EF Code First首先提高自引用的性能,一对多关系

zam*_*6ak 5 c# recursion entity-framework query-optimization

我有AccountGroup一个自引用实体.一片叶子AccountGroup可以包含1个或更多Accounts.两个实体都有Balance财产.每个AccountGroup具有Balance其是一的总和Balance在子组S或之和Balance的所有帐户的S(在叶组的情况下).

为了构建所有AccountGroups和Accounts 的树列表,我必须递归地遍历这个对象图,这导致了很多(我的意思是很多!!!)对DB的调用...

是否有任何方法可以通过减少数据库调用的方式来改进这一点?

谢谢

这是修剪过的代码

帐户(仅属于1个AccountGroup)

public class Account
{
    public int Id { get; set; }
    public int GroupId { get; set; }
    public string Name { get; set; }
    public decimal Balance { get; set; }
    public string AccountType { get; set; }

    public virtual AccountGroup Group { get; set; }
}
Run Code Online (Sandbox Code Playgroud)

AccountGroup(有0个或多个AccountGroup,如果是叶子,则有1个或多个Account)

public class AccountGroup
{
    public AccountGroup()
    {
        Accounts = new HashSet<Account>();
        Groups = new HashSet<AccountGroup>();
    }

    public int Id { get; set; }
    public bool IsRoot { get { return Parent == null; } }
    public bool IsLeaf { get { return !Groups.Any(); } }
    public decimal Balance { get { return IsLeaf ? Accounts.Sum(a => a.Balance) : Groups.Sum(g => g.Balance); } } // if leaf group, get sum of all account balances, otherwise get sum of all subgroups
    public int? ParentId { get; set; }
    public string Name { get; set; }
    public string Description { get; set; }
    public virtual ISet<Account> Accounts { get; private set; }
    public virtual ISet<AccountGroup> Groups { get; private set; }
    public virtual AccountGroup Parent { get; set; }
}
Run Code Online (Sandbox Code Playgroud)

致电代码

// start processing root groups (ones without parent)
foreach (var rootGroup in db.AccountGroups.Include(g=>g.Groups).Where(g => g.ParentId == null))
{
    TraverseAccountGroup(rootGroup, 0);
}

// recursive method
private static void TraverseAccountGroup(AccountGroup accountGroup, int level)
{
    //
    // process account group
    //
    Console.WriteLine("{0}{1} ({2})", String.Empty.PadRight(level * 2, '.'), accountGroup.Name, level);
    //
    // if subgroups exist, process recursivelly
    //
    if (accountGroup.Groups.Any())
    {
        foreach (var subGroup in accountGroup.Groups)
        {
            TraverseAccountGroup(subGroup, level + 1);
        }
    }
    //
    // otherwise, process accounts belonging to leaf subgroup
    //
    else
    {
        foreach (var account in accountGroup.Accounts)
        {
            Console.WriteLine("ACCOUNT [{0}]", account.Name);
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

Vul*_*ary 0

CTE 方法

有两种方法可以提高树数据类型的查询速度。第一个(也可能是最简单的)是使用存储过程和 EF 的执行 sql 功能来加载树。SPproc会缓存,结果集执行速度会提高。我对存储过程中查询的建议是递归 CTE。

http://msdn.microsoft.com/en-us/library/ms186243(v=sql.105).aspx

with <CTEName> as
(
     SELECT
         <Root Query>
     FROM <TABLE>

     UNION ALL

     SELECT
         <Child Query>
     FROM <TABLE>
     INNER JOIN <CTEName>
         ON <CTEJoinCondition>
     WHERE 
          <TERMINATION CONDITION>

)
Run Code Online (Sandbox Code Playgroud)

编辑

内联执行您的存储过程或 CTE:

DbContext ctx = new SampleContext();
ctx.Database.SqlQuery<YourEntityType>(@"SQL OR SPROC COMMAND HERE", new[] { "Param1", "Param2", "Etc" });
Run Code Online (Sandbox Code Playgroud)

展平你的树结构

第二种方法是构建树的平面表示。您可以将树展平为扁平结构以便快速查询,然后使用扁平结构和实际树节点之间的链接来剪切自引用实体。您可以使用上面的递归 CTE 查询构建平面结构。

这只是一种方法,但有很多关于该主题的论文:

http://www.governor.co.uk/news-plus-views/2010/5/17/depth-first-tree-flattening-with-the-yield-keyword-in-c-sharp/

编辑:添加额外的说明 请注意,递归 CTE 缓存是迭代结构之前查询的符号。这是编写查询来解决问题的最快、最简单的方法。然而,这必须是一个 SQL 查询。您可以直接使用执行sql,也可以执行SProc。存储过程在运行后缓存执行图,因此它们的性能比必须在运行之前构建执行计划的本机查询更好。这完全取决于你。

树的平面表示的问题是你必须定期重建或不断维护平面结构。根据您的查询路径将确定您应该使用哪种扁平化算法,但最终结果保持不变。扁平结构是在 EF 中“完成”您想要做的事情的唯一方法,而不必通过 DBConnection 欺骗和执行原始 SQL。