什么时候应该在索引上使用 IGNORE_DUP_KEY 选项？

Question

什么时候应该在索引上使用 IGNORE_DUP_KEY 选项？

Tri*_*nko 7 sql-server duplication unique-constraint sql-server-2019

有人说最好制作您的查询以避免重复的键异常，但我不相信仅设置IGNORE_DUP_KEY = ON索引的性能更高。

我的目标是在尝试更新这些行之前，确保为一个或多个用户存在一行或一组行。我这样做，所以当我尝试使用如下所示的更新语句更新行时，没有行受到影响，这是因为[Count]谓词的部分不满足，而不是根本不存在的行（即[ID]不满足谓词的部分）：

UPDATE [Inventory]
SET [Count] = [Count] + 1
WHERE [ID] = 3 
AND ([Count] + 1) <= @MaxInventory

Run Code Online (Sandbox Code Playgroud)

我可以运行EXISTS(SELECT 1 From [Inventory] WHERE [ID] = 3检查该单行，如果该行不存在，则仅插入该行。这只是避免了不必要的插入。如有必要，插入仍需处理并发事务，因此仍可能发生重复键异常。

我很好奇IGNORE_DUP_KEY在这种情况下是否只打开性能更好，而不是允许抛出和捕获错误。具体来说，我很好奇它是否与运行存在检查一样快或什至可能更快，只是尝试插入记录并让它忽略重复的键。

当我一次检查和初始化多个记录时，这变得更加重要。例如，如果我需要确保单个更新语句中存在数千个用户的记录，如果我只是预先运行该插入语句，让它忽略重复的键，那么逻辑会简单得多。避免重复会更复杂，因为我必须首先查询不存在记录的表，然后尝试仅添加这些记录（再次忽略重复键）。即使所有记录都存在，只是插入可能会更快。

我可以在中途遇到它并检查是否有任何记录丢失，例如使用左连接或COUNT比较，但是如果忽略重复键的插入速度更快，为什么还要麻烦呢？

使用IGNORE_DUP_KEY并尝试插入而不是提前检查行是否存在是个好主意吗？如果不是，为什么？

Answer 1

Eri*_*ing 10

这绝对是启用索引的非典型设置。我不认为你会发现很多人跳起来谈论使用它。

当然，Paul White 有几篇关于这个主题的有用帖子：

如果您担心的是 upsert 模式（或类似的东西），Michael Swart 的这篇文章非常有用：

SQL Server UPSERT 模式和反模式

Answer 2

Pau*_*ite 8

每个功能都有一个用例，IGNORE_DUP_KEY也不例外。

正如我在IGNORE_DUP_KEY 中对聚集索引的解释较慢，当重复键异常的数量足够小时，这个选项只有潜在地有益于性能（在聚集索引上）。

盈亏平衡点取决于系统，需要实际测试才能正确评估。尽量不要提前做出假设或判断。仔细测试每个强大的实现替代方案，并选择在您的场景中最有意义的方案。

作为性能意外原因的一个示例，考虑索引插入点必须位于某个阶段，因此重复该操作可能比预期的便宜。当 SQL Server 可以使用“行集共享”优化时，开销甚至更少。引擎在检查是否存在时定位插入点一次，并为插入操作保留该直接参考。

虽然与问题没有直接关系，但我应该提一下使用的一些注意事项IGNORE_DUP_KEY：

MERGE语句的插入活动不尊重它。
它不能添加到现有索引中。
它不像显式存在测试那样“可发现”。

与相比，我通常更喜欢单独的语句MERGE，但您应该针对您的预期用途对其进行测试。MERGE可以将插入和更新合并到单个语句中，同时利用空洞填充优化和行集共享。

归档时间：	6 年，2 月前
查看次数：	1308 次
最近记录：	4 年，3 月前