PostgreSQL 在同一列上存在两种不同类型的索引时的行为

pie*_*rop 4 postgresql index execution-plan operator

如果我在同一列上创建两个(或多个)不同类型的索引,PostgreSQL 的行为如何?

就我而言,我想将 B 树索引与tsvector列上的 GIN 进行比较。我知道 GIN 专门用于tsvector. 奇怪的是,如果我创建 B 树索引,PostgreSQL 不会抱怨,但我看到查询计划器不使用它。我还可以创建 GIN 索引(不删除 B 树索引),现在规划器使用新创建的索引。该列现在有两个索引,但只使用了其中一个。

即使存在两个以上的索引,用于选择索引类型的标准是什么?为什么 PostgreSQL 不告诉我 a 上的 B 树索引tsvector是无用的,并且不会永远不会被计划者使用?

更新
GIN 索引仅用于某些检查条件,例如my_tsvector IS NOT NULL但(显然)不适用于my_tsvector @@ '...'::tsquery.

Erw*_*ter 7

如果索引是查询计划器可以提出的最快计划的一部分,则将使用该索引。成本估算涉及许多因素。必要条件:索引必须适用。索引绑定到运算符,而不是数据类型或函数或其他任何东西。运算符由左右操作数的运算符数据类型定义。btree 索引手册:

B 树可以处理数据的相等和范围查询,这些数据可以按某种顺序排序。特别是,每当索引列涉及使用以下运算符之一的比较时,PostgreSQL 查询规划器将考虑使用 B 树索引:

<
<=
=
>=
>
Run Code Online (Sandbox Code Playgroud)

还有更多,请阅读手册。

相关案例有更多解释:

上的 btree 索引tsvector并非无用。它可用于对行进行排序(隐式使用>=<=运算符):

SELECT * FROM tbl ORDER BY my_tsvector;
Run Code Online (Sandbox Code Playgroud)

或者它可以用于相等谓词:

DELETE FROM tbl WHERE my_tsvector = 'foo bar'::tsvector;
Run Code Online (Sandbox Code Playgroud)

但它不能用于谓词my_tsvector @@ '...'::tsquery。为此,您需要一个 GIN 或 GiST 索引。两者都tsvector_ops默认使用运算符类(无需显式声明):

那么索引是适用的。但是 Postgres 可能仍然决定使用不同的查询计划,基于表统计和成本设置......

您可以拥有多个涉及相同索引列的索引。有各种各样的种类类型和各种操作符类,它们可以通过多种方式组合。查询规划器只会考虑适用的索引,并根据多种因素估算成本......

您甚至可以在不同的名称下多次创建相同的索引。然后 Postgres 将任意选择。您有责任不创建毫无意义的重复对象。