两个索引上的MERGE JOIN仍导致SORT？

Question

两个索引上的MERGE JOIN仍导致SORT？

Dav*_*vic 13 oracle algorithm join query-performance

这是一个简化为连接两个索引的性能问题.采取以下设置:

CREATE TABLE ZZ_BASE AS SELECT dbms_random.random AS ID, DBMS_RANDOM.STRING('U',10) AS STR FROM DUAL CONNECT BY LEVEL <=1000000;
CREATE INDEX ZZ_B_I ON ZZ_BASE(ID ASC); 
CREATE TABLE ZZ_CHILD AS SELECT dbms_random.random AS ID, DBMS_RANDOM.STRING('U',10) AS STR FROM DUAL CONNECT BY LEVEL <=1000000;
CREATE INDEX ZZ_C_I ON ZZ_CHILD(ID ASC);

-- As @Flado pointed out, the following is required so index scanning can be done
ALTER TABLE ZZ_BASE MODIFY (ID CONSTRAINT NN_B NOT NULL); 
ALTER TABLE ZZ_CHILD MODIFY (ID CONSTRAINT NN_C NOT NULL); -- given the join below not mandatory.

Run Code Online (Sandbox Code Playgroud)

现在我想LEFT OUTER JOIN这两个表,只输出已经索引的ID字段.

SELECT  ZZ_BASE.ID 
FROM ZZ_BASE 
LEFT OUTER JOIN ZZ_CHILD ON (ZZ_BASE.ID = ZZ_CHILD.ID);
----------------------------------------------------------------------------------------
| Id  | Operation             | Name   | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
----------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT      |        |  1000K|  9765K|       |  4894   (2)| 00:00:30 |
|*  1 |  HASH JOIN OUTER      |        |  1000K|  9765K|    16M|  4894   (2)| 00:00:30 |
|   2 |   INDEX FAST FULL SCAN| ZZ_B_I |  1000K|  4882K|       |   948   (3)| 00:00:06 |
|   3 |   INDEX FAST FULL SCAN| ZZ_C_I |  1000K|  4882K|       |   948   (3)| 00:00:06 |
----------------------------------------------------------------------------------------

Run Code Online (Sandbox Code Playgroud)

如您所见,不需要表访问,只能访问索引.但根据常识,HASH加入并不是加入这两个索引的最佳方式.如果这两个表大得多,则必须制作一个非常大的哈希表.

一种更有效的方法是对两个索引进行SORT-MERGE.

SELECT /*+ USE_MERGE(ZZ_BASE ZZ_CHILD) */ ZZ_BASE.ID 
FROM ZZ_BASE 
LEFT OUTER JOIN ZZ_CHILD ON (ZZ_BASE.ID = ZZ_CHILD.ID);
-----------------------------------------------------------------------------------------
| Id  | Operation              | Name   | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT       |        |  1000K|  9765K|       |  6931   (3)| 00:00:42 |
|   1 |  MERGE JOIN OUTER      |        |  1000K|  9765K|       |  6931   (3)| 00:00:42 |
|   2 |   INDEX FULL SCAN      | ZZ_B_I |  1000K|  4882K|       |  2258   (2)| 00:00:14 |
|*  3 |   SORT JOIN            |        |  1000K|  4882K|    22M|  4673   (4)| 00:00:29 |
|   4 |    INDEX FAST FULL SCAN| ZZ_C_I |  1000K|  4882K|       |   948   (3)| 00:00:06 |
-----------------------------------------------------------------------------------------

Run Code Online (Sandbox Code Playgroud)

但似乎第二个索引被排序,即使它已经存在("如果索引存在,那么数据库可以避免对第一个数据集进行排序.但是,无论索引如何,数据库总是对第二个数据集进行排序" ¹)

基本上,我想要的是一个使用SORT-MERGE连接并立即开始输出记录的查询,即:

没有HASH连接,因为它首先必须创建一个哈希表(IO开销,如果存储在磁盘上),因此不会立即输出.
没有NESTED LOOP连接虽然它会立即输出,但在索引戳时具有log(N)复杂性,在索引很大的情况下在非顺序索引读取上具有大的IO开销.

Answer 1

小智 1

INDEX_ASC（或只是 INDEX）是您可能想要尝试的提示，以便将性能与实际数据进行比较。

我有点惊讶的是，您对外部行源进行了任何类型的索引扫描，因为 B*Tree 索引无法找到 NULL 键，并且 ZZ_BASE 没有约束NOT NULL。添加它并进一步提示将使您按照 ZZ_C_I 索引的索引顺序进行完整扫描。不幸的是，这并不能节省你的SORT JOIN步骤，但至少它应该更快 - O(n) - 因为数据已经排序。

alter table zz_base modify (id not null);
SELECT 
  /*+ leading(zz_base) USE_MERGE(ZZ_CHILD) 
      index_asc(zz_base (id)) index(zz_child (id)) */ ZZ_BASE.ID 
FROM ZZ_BASE left outer join ZZ_CHILD on zz_base.id=zz_child.id;

Run Code Online (Sandbox Code Playgroud)

该查询使用以下执行计划：

------------------------------------------------------------------------------------
| Id  | Operation         | Name   | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |        |  1000K|  9765K|       |  8241   (3)| 00:00:50 |
|   1 |  MERGE JOIN OUTER |        |  1000K|  9765K|       |  8241   (3)| 00:00:50 |
|   2 |   INDEX FULL SCAN | ZZ_B_I |  1000K|  4882K|       |  2258   (2)| 00:00:14 |
|*  3 |   SORT JOIN       |        |  1000K|  4882K|    22M|  5983   (3)| 00:00:36 |
|   4 |    INDEX FULL SCAN| ZZ_C_I |  1000K|  4882K|       |  2258   (2)| 00:00:14 |
------------------------------------------------------------------------------------

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，2 月前
查看次数：	743 次
最近记录：	9 年，7 月前