使用 pyodbc 的过滤器 .in_(list) 出现“最大参数数量”错误

Nis*_*ant 5 python sqlalchemy pyodbc

我们在 Python 2 + mxODBC 中工作的查询之一在 Python 3 + pyodbc 中不起作用;它会引发如下错误:Maximum number of parameters in the sql query is 2100.whileconnecting to SQL Server. 由于两个打印的查询都有 3000 个参数,我认为它在两种环境中都应该失败,但显然这里的情况似乎并非如此。在Python 2环境中,MSODBC 11或MSODBC 17都可以工作,所以我立即排除了与驱动程序相关的问题。

所以我的问题是:

  1. 在 SQLAlchemy 中将a 作为多个参数发送是否正确list,因为参数列表将与 的长度成比例list?我觉得它看起来有点奇怪;我更愿意将它们连接list成一个,string因为数据库不理解list数据类型。
  2. 是否有任何提示说明为什么它可以在 mxODBC 中工作但不能在 pyodbc 中工作?mxODBC 是否优化了 pyodbc 没有优化的东西?如果有任何指示,请告诉我 - 我可以尝试在此处粘贴更多信息。(我对调试 SQLAlchemy 还很陌生。)

脚注:我看到很多建议对数据进行分块的答案,但由于1 和 2,我想知道我是否首先做了正确的事情。

(由于它似乎与 pyodbc 有关,因此我在官方存储库中提出了内部问题。)

import sqlalchemy
import sqlalchemy.orm

from sqlalchemy import MetaData, Table
from sqlalchemy.ext.declarative import declarative_base

from  sqlalchemy.orm.session import Session

Base = declarative_base()

create_tables = """
CREATE TABLE products(
    idn NUMERIC(8) PRIMARY KEY
);
"""

check_tables = """   
SELECT * FROM products;
"""

insert_values = """
INSERT INTO products
(idn)
values
(1),
(2);
"""

delete_tables = """
DROP TABLE products;
"""

engine = sqlalchemy.create_engine('mssql+pyodbc://user:password@dsn')
connection = engine.connect()
cursor = engine.raw_connection().cursor()
Session = sqlalchemy.orm.sessionmaker(bind=connection)
session = Session()

session.execute(create_tables)

metadata = MetaData(connection)

class Products(Base):
   __table__ = Table('products', metadata, autoload=True)

try:
    session.execute(check_tables)
    session.execute(insert_values)
    session.commit()
    query = session.query(Products).filter(
        Products.idn.in_(list(range(0, 3000)))
    )
    query.all()
    f = open("query.sql", "w")
    f.write(str(query))
    f.close()
finally:
    session.execute(delete_tables)
    session.commit()
Run Code Online (Sandbox Code Playgroud)

Gor*_*son 6

当您执行简单的.in_(list_of_values)SQLAlchemy 时,会呈现以下 SQL ...

SELECT team.prov AS team_prov, team.city AS team_city 
FROM team 
WHERE team.prov IN (?, ?)
Run Code Online (Sandbox Code Playgroud)

...其中 IN 子句中的每个值都指定为单独的参数值。pyodbc 将其发送到 SQL Server 作为...

exec sp_prepexec @p1 output,N'@P1 nvarchar(4),@P2 nvarchar(4)',N'SELECT team.prov AS team_prov, team.city AS team_city, team.team_name AS team_team_name 
FROM team 
WHERE team.prov IN (@P1, @P2)',N'AB',N'ON'
Run Code Online (Sandbox Code Playgroud)

...所以如果您的列表很长,您就会达到 2100 个参数的限制。据推测,mxODBC 在将参数值发送到 SQL Server 之前插入了内联参数值,例如,

SELECT team.prov AS team_prov, team.city AS team_city 
FROM team 
WHERE team.prov IN ('AB', 'ON')
Run Code Online (Sandbox Code Playgroud)

您可以让 SQLAlchemy 为您完成此操作

provinces = ["AB", "ON"]
stmt = (
    session.query(Team)
    .filter(
        Team.prov.in_(sa.bindparam("p1", expanding=True, literal_execute=True))
    )
    .statement
)
result = list(session.query(Team).params(p1=provinces).from_statement(stmt))
Run Code Online (Sandbox Code Playgroud)

  • 呵呵,我对 SQLA 构造查询的评论没有经过深思熟虑 - 我应该意识到它将委托给 DB-API 驱动程序。好答案。 (2认同)
  • 扩展绑定参数是我一直忘记的最有用的事情:/ (2认同)