小编Bec*_*uzz的帖子

唯一标识符 (GUID) 的性能问题

我是我公司的软件开发人员/架构师，每当我们的主要 DBA 离职时，我偶尔会担任我们的 DBA，所以我想我有点知道我在做什么，但这让我很难找到最佳行动方案。

我们正在努力将单体系统迁移到微服务中。作为这项努力的一部分，我们决定通过 Kafka 使用事件流。我们面临的问题是，在向 Kafka 发送任何内容之前，我们需要能够为我们创建的任何实体提供标识符（Kafka 需要该标识符来保持该实体的任何事件的有序性）。这些标识符需要在托管我们面向客户端的应用程序（网站和 API）的多台机器上创建。所以在这里使用 uniqueidentifier / GUID 似乎是一个合乎逻辑的选择。

如果我们从头开始构建它，我还不会这么担心，因为我们可以将各种实体分离到它们自己的数据存储中（用户可以在一个存储/数据库中，团队可以在另一个中，等等）将保持给定表中的行数有很好的界限，并且查询负载可以分布在多个服务器上。然而，我们当前的系统设计很差，我们系统中的每个实体都位于一个非常非规范化的大表中（因此任何给定的行都可以代表用户、团队、服务等）。这个表有大约 800 万到 900 万行。我们还必须在重写期间使用任何新数据（包括新的 GUID）更新此表。而这正是我所担心的。

我们需要通过这些标识符查找这些实体并保持快速查询。而且我知道 GUID 会产生可怕的键（用于集群或索引），因为它们会导致巨大的碎片、页面拆分等。我们现有系统的一部分使用 GUID 作为实体的查找。有几十万行，索引碎片化到无用的程度，查询被降级为表扫描。我们最终能够更改代码以使用顺序唯一标识符，但这在这里不是一个选项。这让我担心使用随机 GUID 作为标识符将成为性能噩梦。

所以问题是，有没有一种方法可以使用随机 GUID 作为大型表上的非集群键，这样可以快速通过这些 GUID 进行查找？我可以做哪些事情来缓解这个问题？我也对这里的替代解决方案持开放态度，因为我们还没有达到无可挽回的地步。

database-design sql-server

Bec*_*uzz

lucky-day

6
推荐指数

1
解决办法

507
查看次数

标签统计

database-design ×1

sql-server ×1

唯一标识符 (GUID) 的性能问题

标签 统计

小编Bec_uzz的帖子

标签统计