包含列的索引,有什么区别？

Question

我从来没有真正理解这两个索引之间的区别,有人可以解释一下有什么不同(性能方面,如何在db中存储索引结构,存储方式等)？

我理解这个问题很广泛,请耐心等待.我真的不知道如何限制它.也许如果你们开始解释你的诀窍,我会得到正确方向的指示,使我能够使问题更加狭窄？

包含的索引

CREATE NONCLUSTERED INDEX IX_Address_PostalCode  
ON Person.Address (PostalCode) 
INCLUDE (AddressLine1, AddressLine2, City, StateProvinceID);

'正常'指数

CREATE NONCLUSTERED INDEX IX_Address_PostalCode  
ON Person.Address (PostalCode, AddressLine1, AddressLine2, City, StateProvinceID);

Answer 1

索引的内部存储使用B树结构,由"索引页"(根页和所有中间页)和"索引数据页"(仅限叶页)组成.

注意不要将"索引数据页"与存储大多数实际数据列的"数据页"(聚簇索引的叶页)混淆.

使用索引时,索引键用于将索引页面导航到正确的索引数据页面.

有些事情要注意,希望能解决你的一些困惑:

值得注意的是,在将INCLUDE列添加为功能之前:

注意事项非常重要.INCLUDE如果你总是把你的查询写成懒惰的习惯,你通常会从索引中的列中获得零利益SELECT * ....通过返回所有列,您基本上确保在任何情况下都需要书签查找.

Answer 2

在第一个索引中,Index page仅PostalCode是键列,并且AddressLine1, AddressLine2, City, StateProvinceID是叶节点的一部分以避免key/RID查找

当我的表总是被过滤时,我会更喜欢第一个索引,PostalCode并且这些列中的任何一个AddressLine1, AddressLine2, City, StateProvinceID都将是select过滤的一部分而不是过滤

select AddressLine1, AddressLine2, City, StateProvinceID
from Person.Address 
Where PostalCode=

在第二个索引中Index page,将有五个关键列PostalCode, AddressLine1, AddressLine2, City, StateProvinceID

当我有可能过滤数据时,我会更喜欢第二个索引

Where PostalCode = And AddressLine1 =

要么

Where PostalCode = And AddressLine2 =

要么

Where PostalCode = And AddressLine1  = and AddressLine2 =

等等..

在任何情况下,索引中的第一列应该是过滤的一部分以利用该指数