如何提高使用多个 Include 的 EF Core 查询的性能

AjL*_*ing 5 performance database-performance psql entity-framework-core

我有这个查询,为了简洁起见,我将简化它:

public IQueryable<User> GetByIdAsync(Guid userId)
{
    return MyContext
        .Users
        //Bunch of Includes
            //Most of which have a ThenInclude
                //Followed by another ThenInclude
        .FirstOrDefaultAsync(u => u.Id == userId)
}
Run Code Online (Sandbox Code Playgroud)

当为大约 100 个用户运行时,需要超过 15 秒(在我的计算机上本地运行)。不是很好。

我尝试过使用AsNoTracking(),以及将其更改为使用已编译的查询,如下所示:

private static Func<MyContext, Guid, Task<User>> _getByIdAsync =
            EF.CompileAsyncQuery((MyContext context, Guid userId) =>
                context
                .Users
                //Same Includes as above
                .Where(u => u.Id == userId)
                .FirstOrDefault());

public IQueryable<User> GetByIdAsync(Guid userId)
{
    return await _getByIdAsync(userId);
}
Run Code Online (Sandbox Code Playgroud)

还是没有区别。

我查看了相关线程的答案,它建议使用普通的旧 SQL:

/sf/answers/1188405291/

我查看了这个答案,其中提到了聚集索引:

/sf/answers/3889006621/

我当然不能排除其中任何一个,Includes因为客户依赖于所有这些信息。在这个阶段,重新设计也不是一个选择。

问题

  1. 还有其他可以提高性能的选项吗?
  2. 我在任何子表索引中都看不到任何CLUSTEREDNONCLUSTERED标记。这是否值得研究?如果是,是否可以向我指出任何解释如何使用 EF(或不使用 EF)进行更新的文档?

Vol*_*hat 8

你有很多方法,但这取决于情况。

  1. 这意味着 .FirstOrDefaultAsync(u => u.Id == userId)对于 100 个用户,您将访问数据库 100 次,因此总计 15 000 / 100 == 等于每个请求 150 毫秒。in为了改进它,尝试使用类似的子句一次获取所有 100 个用户.Where(u=> userIds.contains(u.Id))

例子。

private static Func<MyContext, Guid, Task<List<User>>> _getByIdAsync =
            EF.CompileAsyncQuery((MyContext context, List<Guid> userIds) =>
                context
                .Users
                //Same Includes as above
                .Where(u => userIds.Contains(u.Id))).ToListAsync();
Run Code Online (Sandbox Code Playgroud)
  1. 我对你的数据结构一无所知,但如果你可以使用联接编写 linq,它可能会更快,因为对于一个请求中的多对多,EF 可以每次依赖项都访问数据库。

如何使用联接进行查询的示例

var query = (from users in context.Users
join otherTable in context.OtherTable  on users.Id equals otherTable.UserId).ToList();
Run Code Online (Sandbox Code Playgroud)
  1. 如果尝试适应通用目的,但有时当你知道你的数据时,只有你才能做得更好,当我有存储库方法来一一获取数据时,我曾经遇到过与你类似的问题,但后来我编写了新的方法来使用array 和该方法负责连接数据,通过 EF 基本上不可能快速完成。因此,我在一个请求中所说的全部一对一加载,然后从数据库读取并使用另一个查询去获取您需要的多对多。
  2. 还可以得到sql查询

您可以使用此示例获取 sql

public IQueryable<User> GetByIdAsync(Guid userId)
{
    var = query = MyContext
        .Users
        //Bunch of Includes
            //Most of which have a ThenInclude
                //Followed by another ThenInclude
     var sql = query.ToSql(); // <--------------------------- sql query
     return query.FirstOrDefaultAsync(u => u.Id == userId)
}
Run Code Online (Sandbox Code Playgroud)

并使用 sql 查询来分析并查看其是否使用索引。

最后,我真的很讨厌这样的方法public IQueryable GetByIdAsync(Guid userId)问题是大多数时候你不需要所有包含的内容,但是你开始越来越多地使用它们并变得依赖它们......这就是为什么我会推荐使用不带存储库模式的 EF,EF 本身是存储库,仅从数据库获取您需要的数据。