joe*_*ish 7 c# sql-server entity-framework
我有一个Entity Framework 6.1项目,它正在查询SQL Server 2012数据库表并返回错误的结果.
为了说明发生了什么,我创建了两个应该具有完全相同结果的查询.该表ProjectTable有23列和20500行:
var test1 = db.ProjectTable
.GroupBy(t => t.ProjectOwner)
.Select(g => g.Key)
.ToArray();
var test2 = db.ProjectTable
.ToArray()
.GroupBy(t => t.ProjectOwner)
.Select(g => g.Key)
.ToArray();
Run Code Online (Sandbox Code Playgroud)
查询旨在获取表中所有不同项目所有者的列表.第一个查询在SQL Server上执行繁重的工作,第二个查询将整个表下载到内存中,然后在客户端处理它.
第一个变量test1的长度约为300项.第二个变量test2的长度为5.
以下是EF生成的原始SQL查询:
-- test1
SELECT [Distinct1].[ProjectOwner] AS [ProjectOwner]
FROM ( SELECT DISTINCT
[Extent1].[ProjectOwner] AS [ProjectOwner]
FROM [dbo].[ProjectTable] as [Extent1]
) AS [Distinct1]
-- test2
SELECT Col1, Col2 ... ProjectOwner, ... Col23
FROM [dbo].[ProjectTable]
Run Code Online (Sandbox Code Playgroud)
当我运行此查询并分析返回的实体时,我注意到返回了完整的20500行,但该ProjectOwner列被仅有5个不同用户中的一个覆盖!
var test = db.ProjectTable.ToArray();
Run Code Online (Sandbox Code Playgroud)
我想也许是SQL Server,所以我做了一个数据包跟踪并在TDS上过滤.随机查看原始流我看到很多名称不在5的列表中,所以我知道数据正在通过网络正确发送.
如何查看EF获取的原始数据?有什么东西可能会搞乱缓存并拉出不正确的结果吗?
如果我在SSMS或Visual Studio中运行查询,则返回的列表是正确的.只有EF才有这个问题.
好的,我添加了另一项测试,以确保我的理智得到控制.我接受了test2原始的sql查询并执行了以下操作:
var test3 = db.Database
.SqlQuery<ProjectTable>(@"SELECT Col1..Col23")
.ToArray()
.Select(t => t.ProjectOwner)
.Distict()
.ToArray();
Run Code Online (Sandbox Code Playgroud)
我得到了正确的300个名字!
在下载了Entity Framework源代码并逐步完成后Enumerator,我发现了这个问题.
在Shaper.HandleEntityAppendOnly方法(此处找到)中,在第187行Context.ObjectStateManager.FindEntityEntry调用该方法.令我惊讶的是,返回了一个非null值!等一下,不应该有任何缓存结果,因为我要返回所有行?!
那是我发现我的桌子没有主键的时候!
在我的辩护中,该表实际上是我正在使用的视图的缓存,我只是做了一个 SELECT * INTO CACHETABLE FROM USERVIEW
然后我查看实体框架认为哪个列是我的主键(他们称之为单键),恰好它们所选择的列只有...... 鼓请 ... 5个独特的值!
当我看到EF生成的模型时,果然!该列被指定为主键.我将密钥更改为相应的列,现在一切正常!