查询性能,多个“OR”与单独的语句

Mik*_*Lin 2 sql oracle performance scalability

假设我有一个 40MM 9 位邮政编码的 Oracle 数据库表,其中包括每个 4 位邮政编码。我有一个包含 800 个 5 位邮政编码的列表,我需要找到所有关联的 9 位邮政编码。总共有 40K 5 位邮政编码。假设我们已使用 B*Tree(常规)索引对 5 位邮政编码字段进行索引。考虑到数据库性能和可伸缩性,最好的方法是:

  1. 在单个语句中查询所有记录?像这样运行一次:

    SELECT * FROM ZIPCODE WHERE ZIP5 IN (:1, :2,... :800)

  2. 为每个 5 位邮政编码查询一次?像这样运行 800 次:

    SELECT * FROM ZIPCODE WHERE ZIP5 = :1

  3. 介于两者之间的一些批量大小?

你怎么看,为什么?如果您处于思考状态,一些 [可选] 后续想法:

  • 我们可以运行哪些测试来验证您的想法?
  • 最佳方法是否随着数量的变化而变化(例如,如果我们将 100 个 9 位邮政编码映射到 10 个 5 位邮政编码,则查找这 10 个中的 3 个)?
  • 数据库的最佳选择与吸收查询结果的应用服务器的最佳选择不同吗?

Sjo*_*erd 5

让数据库服务器决定如何处理它。即使它在内部进行 800 次查询,它仍然会更快。它只需要解析一次查询,并且只需要发送一次结果。

因此,使用 SELECT * FROM ZIPCODE WHERE ZIP5 IN (:1, :2,... :800)

  • +1 需要注意的是,IN 列表最多只能包含 1000 个项目。如果你已经是 800,那对我来说有点太接近了。将列表粘贴到另一个表中(全局临时表?)并执行 SELECT * FROM ZIPCODE WHERE ZIP5 IN (SELECT ZIP5 FROM ...) (4认同)