SQLAlchemy 中 mssql+pyodbc 出现“数据源名称太长”错误

Hee*_*Cho 3 etl sqlalchemy pyodbc pandas azure-sql-database

我正在尝试使用 SQLAlchemy 和 pyobdc 将数据帧上传到 Azure SQL Server 数据库上的数据库。我已建立连接,但上传时出现错误:

(pyodbc.Error) ('IM010', '[IM010] [Microsoft][ODBC 驱动程序管理器] 数据源名称太长 (0) (SQLDriverConnect)')

我不确定这个错误是从哪里来的,因为我之前使用过 sqlalchemy 没有问题。我在下面附上了我的代码,有人可以帮我诊断问题吗?

username = 'bcadmin'
password = 'N@ncyR2D2'
endpoint = 'bio-powerbi-bigdata.database.windows.net'

engine = sqlalchemy.create_engine(f'mssql+pyodbc://{username}:{password}@{endpoint}')

df.to_sql("result_management_report",engine,if_exists='append',index=False)
Run Code Online (Sandbox Code Playgroud)

我知道其他 ETL 方法,如数据工厂和 SSMS,但我更喜欢使用 pandas 作为 ETL 过程。

请帮我解决这个错误。

Gor*_*son 6

这里三个问题:

  1. 如果用户名或密码可能包含@字符,则需要在连接 URL 中对其进行转义。
  2. 对于mssql+pyodbc方言,数据库名称必须包含在 URL 中,以便 SQLAlchemy 识别“主机名”连接(而不是“DSN”连接)。
  3. 此外,对于mssql+pyodbc主机名连接,必须使用该属性提供 ODBC 驱动程序名称driver

构建正确的连接 URL 的最简单方法是使用以下URL.create()方法:

from sqlalchemy import create_engine
from sqlalchemy.engine import URL

my_uid = "bcadmin"
my_pwd = "N@ncyR2D2"
my_host = "bio-powerbi-bigdata.database.windows.net"
my_db = "master"
my_odbc_driver = "ODBC Driver 17 for SQL Server"

connection_url = URL.create(
    "mssql+pyodbc",
    username=my_uid,
    password=my_pwd,
    host=my_host,
    database=my_db,  # required; not an empty string
    query={"driver": my_odbc_driver},
)
print(connection_url)
"""console output:
mssql+pyodbc://bcadmin:N%40ncyR2D2@bio-powerbi-bigdata.database.windows.net/master?driver=ODBC+Driver+17+for+SQL+Server
"""

engine = create_engine(connection_url, fast_executemany=True)
Run Code Online (Sandbox Code Playgroud)