Mysql 查询在 SELECT IN (xx,xxx,xx) 中使用 33594 个参数在 200 毫秒内运行，但在使用 33595 个或更多参数时运行数小时，为什么？

Tux*_*xie 6 mysql select google-cloud-sql

我们遇到了一个小故障，导致设备产生了意外数量的数据。我们的代码最终沿着 SELEXT * from XXX WHERE yyy IN (xxx,xxx,xxx....,xxxx) 的行创建一个选择查询，这应该获取过去 5 天的数据，这通常根本不是问题，因为WHERE 字段已建立索引。

我们突然开始出现大量缓慢的查询并使服务器陷入困境。在我们中止查询之前，查询运行了大约 5000 秒。弄清楚发生了什么后发现，如果我们在 IN () 子句中有一个最多包含 33594 个参数的查询，则一切正常，查询会在 200 毫秒内完成。如果我们添加一个参数，选择似乎会永远运行。我们没有让一个无限期地运行直到它完成，所以我不确定它是否会完成，但它们似乎至少持续几个小时......

select 内的数据约为 361.04KB。我们在 Google Cloud SQL 上运行 MYSQL MYSQL_8_0_31

关于可能导致这种行为的任何想法？

我更好奇为什么会发生这种情况以了解限制是什么......

原因是因为它是一个过于复杂的谓词。该IN子句是一堆子句的语法糖OR。太多OR子句或子句中太多值IN会导致谓词过于复杂，数据库引擎无法解析并生成有效的查询计划。相反，正在生成的查询计划现在可能以低效的方式扫描整个表。

发生这种情况时没有固定的硬编码限制，并且它会因查询而异。

...更好地了解系统，从而更好地了解什么解决方法/修复是最好的。

一个子句中大约 33,000 个值IN是一个不合理的数量。哎呀，即使是 100 个值在我看来也是不合理的，而且在我看来这样的查询设计是一种反模式。

有几种重写查询可以解决问题的主要方法：

将查询分解为具有更小的子句的查询的多个副本IN，然后UNION将它们重新组合在一起。不过，对于您的子句中的这么多值来说，这可能也是不现实的IN。
将值放入某种表中，例如临时表，然后使用JOIN要过滤的表中的 a 。这通常更有效。

在我的公司，从 MySQL 5.7 开始，我们就遇到了一个问题，即根据选项，优化器可以使用的内存有上限range_optimizer_max_mem_size。如果列表中的项目太多，优化器会放弃，并决定进行表扫描而不是使用索引。

请参阅https://dev.mysql.com/doc/refman/5.7/en/range-optimization.html#range-optimization-memory-use

我们的解决方案是在 my.cnf 中设置：

range_optimizer_max_mem_size=0

Run Code Online (Sandbox Code Playgroud)

这意味着优化器没有内存限制，因此开发人员需要避免列表太长而导致内存错误。但更可能使用索引。

这解决了长列表导致表扫描的每种情况下的问题。

归档时间：	2 年，4 月前
查看次数：	3547 次
最近记录：	2 年，4 月前

VARCHAR 主键 - MySQL 9

Innodb：优化 10mb/sec 写入速度 48 小时后 9

如何调整 innodb_read_io_threads ？ 8

DROP 命令拒绝用户“root”@“localhost” 6

MySQL 的写时复制透明数据库 5

如何使用相关表的聚合值（最小值、最大值）快速更新表？ 4

如何让 MySQL 使用函数返回的值作为默认值？ 3

如何在不减慢应用程序速度的情况下备份 MySQL 数据库？ 3

什么比长斑点大？ 3

我可以告诉 MySQL 缓存什么吗？ 3

PostgreSQL 中的 DELETE 非常慢，解决方法？ 58

MySQL 中的 ORDER BY FIELD() 如何在内部工作 52

真的可以将 listen_addresses 设置为列表吗？ 40

条件中的逻辑运算符 OR AND 和 WHERE 中的条件顺序 38

复制一个表的完整结构 34

如何获取用户所属的所有角色（包括继承的角色）？ 32

psql：致命：抱歉，已经有太多的客户了 26

为什么 0 等于空字符串？ 24

SQL:2008 标准中是否指定了 CTE（带查询）的优化栅栏行为？如果有，在哪里？ 24

如果一个数据库只有一个插入，那么索引每一个可能的列组合是不是很糟糕？ 24