pie*_*rop 4 postgresql index execution-plan operator
如果我在同一列上创建两个(或多个)不同类型的索引,PostgreSQL 的行为如何?
就我而言,我想将 B 树索引与tsvector列上的 GIN 进行比较。我知道 GIN 专门用于tsvector. 奇怪的是,如果我创建 B 树索引,PostgreSQL 不会抱怨,但我看到查询计划器不使用它。我还可以创建 GIN 索引(不删除 B 树索引),现在规划器使用新创建的索引。该列现在有两个索引,但只使用了其中一个。
即使存在两个以上的索引,用于选择索引类型的标准是什么?为什么 PostgreSQL 不告诉我 a 上的 B 树索引tsvector是无用的,并且不会永远不会被计划者使用?
更新
GIN 索引仅用于某些检查条件,例如my_tsvector IS NOT NULL但(显然)不适用于my_tsvector @@ '...'::tsquery.
如果索引是查询计划器可以提出的最快计划的一部分,则将使用该索引。成本估算涉及许多因素。必要条件:索引必须适用。索引绑定到运算符,而不是数据类型或函数或其他任何东西。运算符由左右操作数的运算符和数据类型定义。btree 索引手册:
B 树可以处理数据的相等和范围查询,这些数据可以按某种顺序排序。特别是,每当索引列涉及使用以下运算符之一的比较时,PostgreSQL 查询规划器将考虑使用 B 树索引:
Run Code Online (Sandbox Code Playgroud)< <= = >= >
还有更多,请阅读手册。
相关案例有更多解释:
上的 btree 索引tsvector并非无用。它可用于对行进行排序(隐式使用>=或<=运算符):
SELECT * FROM tbl ORDER BY my_tsvector;
Run Code Online (Sandbox Code Playgroud)
或者它可以用于相等谓词:
DELETE FROM tbl WHERE my_tsvector = 'foo bar'::tsvector;
Run Code Online (Sandbox Code Playgroud)
但它不能用于谓词my_tsvector @@ '...'::tsquery。为此,您需要一个 GIN 或 GiST 索引。两者都tsvector_ops默认使用运算符类(无需显式声明):
那么索引是适用的。但是 Postgres 可能仍然决定使用不同的查询计划,基于表统计和成本设置......
您可以拥有多个涉及相同索引列的索引。有各种各样的种类、类型和各种操作符类,它们可以通过多种方式组合。查询规划器只会考虑适用的索引,并根据多种因素估算成本......
您甚至可以在不同的名称下多次创建相同的索引。然后 Postgres 将任意选择。您有责任不创建毫无意义的重复对象。
| 归档时间: |
|
| 查看次数: |
716 次 |
| 最近记录: |