SQLAlchemy 中 mssql+pyodbc 出现“数据源名称太长”错误

Question

SQLAlchemy 中 mssql+pyodbc 出现“数据源名称太长”错误

Hee*_*Cho 3 etl sqlalchemy pyodbc pandas azure-sql-database

我正在尝试使用 SQLAlchemy 和 pyobdc 将数据帧上传到 Azure SQL Server 数据库上的数据库。我已建立连接，但上传时出现错误：

(pyodbc.Error) ('IM010', '[IM010] [Microsoft][ODBC 驱动程序管理器] 数据源名称太长 (0) (SQLDriverConnect)')

我不确定这个错误是从哪里来的，因为我之前使用过 sqlalchemy 没有问题。我在下面附上了我的代码，有人可以帮我诊断问题吗？

username = 'bcadmin'
password = 'N@ncyR2D2'
endpoint = 'bio-powerbi-bigdata.database.windows.net'

engine = sqlalchemy.create_engine(f'mssql+pyodbc://{username}:{password}@{endpoint}')

df.to_sql("result_management_report",engine,if_exists='append',index=False)

Run Code Online (Sandbox Code Playgroud)

我知道其他 ETL 方法，如数据工厂和 SSMS，但我更喜欢使用 pandas 作为 ETL 过程。

请帮我解决这个错误。

Answer 1

Gor*_*son 6

这里三个问题：

如果用户名或密码可能包含@字符，则需要在连接 URL 中对其进行转义。
对于mssql+pyodbc方言，数据库名称必须包含在 URL 中，以便 SQLAlchemy 识别“主机名”连接（而不是“DSN”连接）。
此外，对于mssql+pyodbc主机名连接，必须使用该属性提供 ODBC 驱动程序名称driver。

构建正确的连接 URL 的最简单方法是使用以下URL.create()方法：

from sqlalchemy import create_engine
from sqlalchemy.engine import URL

my_uid = "bcadmin"
my_pwd = "N@ncyR2D2"
my_host = "bio-powerbi-bigdata.database.windows.net"
my_db = "master"
my_odbc_driver = "ODBC Driver 17 for SQL Server"

connection_url = URL.create(
    "mssql+pyodbc",
    username=my_uid,
    password=my_pwd,
    host=my_host,
    database=my_db,  # required; not an empty string
    query={"driver": my_odbc_driver},
)
print(connection_url)
"""console output:
mssql+pyodbc://bcadmin:N%40ncyR2D2@bio-powerbi-bigdata.database.windows.net/master?driver=ODBC+Driver+17+for+SQL+Server
"""

engine = create_engine(connection_url, fast_executemany=True)

Run Code Online (Sandbox Code Playgroud)

归档时间：	5 年，8 月前
查看次数：	7257 次
最近记录：	2 年，11 月前