Tri*_*nko 7 sql-server duplication unique-constraint sql-server-2019
有人说最好制作您的查询以避免重复的键异常,但我不相信仅设置IGNORE_DUP_KEY = ON
索引的性能更高。
我的目标是在尝试更新这些行之前,确保为一个或多个用户存在一行或一组行。我这样做,所以当我尝试使用如下所示的更新语句更新行时,没有行受到影响,这是因为[Count]
谓词的部分不满足,而不是根本不存在的行(即[ID]
不满足谓词的部分):
UPDATE [Inventory]
SET [Count] = [Count] + 1
WHERE [ID] = 3
AND ([Count] + 1) <= @MaxInventory
Run Code Online (Sandbox Code Playgroud)
我可以运行EXISTS(SELECT 1 From [Inventory] WHERE [ID] = 3
检查该单行,如果该行不存在,则仅插入该行。这只是避免了不必要的插入。如有必要,插入仍需处理并发事务,因此仍可能发生重复键异常。
我很好奇IGNORE_DUP_KEY
在这种情况下是否只打开性能更好,而不是允许抛出和捕获错误。具体来说,我很好奇它是否与运行存在检查一样快或什至可能更快,只是尝试插入记录并让它忽略重复的键。
当我一次检查和初始化多个记录时,这变得更加重要。例如,如果我需要确保单个更新语句中存在数千个用户的记录,如果我只是预先运行该插入语句,让它忽略重复的键,那么逻辑会简单得多。避免重复会更复杂,因为我必须首先查询不存在记录的表,然后尝试仅添加这些记录(再次忽略重复键)。即使所有记录都存在,只是插入可能会更快。
我可以在中途遇到它并检查是否有任何记录丢失,例如使用左连接或COUNT
比较,但是如果忽略重复键的插入速度更快,为什么还要麻烦呢?
使用IGNORE_DUP_KEY
并尝试插入而不是提前检查行是否存在是个好主意吗?如果不是,为什么?
Eri*_*ing 10
这绝对是启用索引的非典型设置。我不认为你会发现很多人跳起来谈论使用它。
当然,Paul White 有几篇关于这个主题的有用帖子:
如果您担心的是 upsert 模式(或类似的东西),Michael Swart 的这篇文章非常有用:
每个功能都有一个用例,IGNORE_DUP_KEY
也不例外。
正如我在IGNORE_DUP_KEY 中对聚集索引的解释较慢,当重复键异常的数量足够小时,这个选项只有潜在地有益于性能(在聚集索引上)。
盈亏平衡点取决于系统,需要实际测试才能正确评估。尽量不要提前做出假设或判断。仔细测试每个强大的实现替代方案,并选择在您的场景中最有意义的方案。
作为性能意外原因的一个示例,考虑索引插入点必须位于某个阶段,因此重复该操作可能比预期的便宜。当 SQL Server 可以使用“行集共享”优化时,开销甚至更少。引擎在检查是否存在时定位插入点一次,并为插入操作保留该直接参考。
虽然与问题没有直接关系,但我应该提一下使用的一些注意事项IGNORE_DUP_KEY
:
MERGE
语句的插入活动不尊重它。与 相比,我通常更喜欢单独的语句MERGE
,但您应该针对您的预期用途对其进行测试。MERGE
可以将插入和更新合并到单个语句中,同时利用空洞填充优化和行集共享。