多列上的 Firebird SQL 索引

Soy*_*cis 2 sql firebird firebird2.5

这是针对 Firebird 2.5 的。

我有一个表 T,其索引由 2 列组成,例如 ColA 和 ColB。如果我正在做 : SELECT * FROM T WHERE ColA=...,所以 WHERE 子句只在 A 列上,Firebird 会为列 ColB 设置默认值,以及索引的好处,还是根本不能使用这个索引?

一些上下文:我正在进行数据库升级。这是我所拥有的:

CREATE TABLE user(
     newid BIGINT NOT NULL,
     oldid BIGINT NOT NULL,
     anotherCol INT);

CREATE INDEX idx ON  user(oldid, anotherCol);
     
CREATE TABLE order(
     RefUser BIGINT);
  
Run Code Online (Sandbox Code Playgroud)

order.RefUser 是 oldid,我需要将它们更改为 newid。我使用这个查询来做到这一点:

UPDATE order o SET o.refuser = (SELECT u.newid FROM user u WHERE u.oldId = o.refuser);
Run Code Online (Sandbox Code Playgroud)

此时,oldid 仍然是唯一的,但稍后将仅保证 (oldid, anotherCol) 的唯一性,因此索引,以及 newid 的创建。

用户表是几百万条记录,订单表是几千万条:这个查询需要一个多小时。我想看看如何改进它(不热衷于在这段时间内关闭关键服务)。

Mar*_*eel 5

假设索引统计信息是最新的,或者至少对优化器来说足够好,那么当并非所有列都是 where 子句的一部分时,Firebird 可以(并且经常会)使用多列索引。唯一的限制是它只能用于第一列(或索引的“前缀”)。

所以与

CREATE INDEX idx ON  user(oldid, anotherCol);
Run Code Online (Sandbox Code Playgroud)

Firebird 可以idx很好地将索引用于where oldid = 'something',但不能用于where anotherCol = 'something'

不,Firebird 不会“为列 [anotherCol] 设置默认值”。它对索引进行范围扫描并返回具有匹配oldid前缀的所有行。

从技术上讲,Firebird 通过组合列来创建索引键,如Firebird for the Database Expert: Episode 1 - Indexes 中所述,这意味着索引中的值类似于:

0<oldid> 1<anotherCol> : row_id
Run Code Online (Sandbox Code Playgroud)

例如(简化,因为在现实生活中 Firebird 也做了前缀压缩)

0val1 1other1 : rowid1
0val1 1other2 : rowid4
0val1 1other3 : rowid6
0val2 1other1 : rowid2
...
Run Code Online (Sandbox Code Playgroud)

使用 时where oldid = 'val1',Firebird 将搜索所有以 开头的条目的索引0val1 1(就像它0val1 1%在单个列上进行字符串搜索一样)。在这种情况下,它将匹配 rowid1、rowid4 和 rowid6。

虽然这有效,但如果您在 only 上进行大量查询oldid,最好也oldid只在 on 上创建单列索引,因为该索引会更小,因此在搜索记录时可以更快地遍历。缺点当然是更多的索引会对插入、更新和删除的性能产生影响。

另请参见级联索引使用索引,卢克