Xwn*_*ola 6 python sqlalchemy pydoc pandas dask
我有一个使用 pandas 的 read_sql ,它工作正常。然而,当我尝试使用相同的逻辑在 Dask 下重新创建相同的数据帧时。它给了我NoSuchTableError。我确信该表存在于我的 SQL 数据库中。
熊猫#works:
import urllib
import sqlalchemy as sa
import pandas as pd
sql = "SELECT * FROM my_table"
params = urllib.parse.quote_plus("DRIVER={SQL Server Native Client 11.0};\
SERVER=my_server;\
DATABASE=db_name;\
Trusted_Connection=yes;")
engine = sa.create_engine('mssql+pyodbc:///?odbc_connect=%s' % params)
df = pd.read_sql(sql, engine)
print(df.head())
Run Code Online (Sandbox Code Playgroud)
由于 Dask 使用 sqlalchemy 的完整 URL,我还尝试在 sqlalchemy 中重新创建相同的连接,并且它有效。我只是很困惑为什么它在 Dask 中不起作用。
sqlalchemy #works:
import pyodbc
import sqlalchemy as sal
from sqlalchemy import create_engine
engine = sal.create_engine('mssql+pyodbc://my_server/db_name\
?driver=SQL+Server+Native+Client+11.0?trusted_connection=yes')
result = engine.execute("select * from my_table")
for row in result:
print(row[0])
Run Code Online (Sandbox Code Playgroud)
Dask#NoSuchTableError:
import urllib
import sqlalchemy as sa
import dask.dataframe as dd
from sqlalchemy.engine.url import make_url
params = urllib.parse.quote_plus("DRIVER={SQL Server Native Client 11.0};\
SERVER=my_server;\
DATABASE=db_name;\
Trusted_Connection=yes;")
conn_str = 'mssql+pyodbc:///?odbc_connect={}'.format(params)
url = make_url(conn_str)
df = dd.read_sql_table('my_table', url, index_col='ID')
print(df.head())
Run Code Online (Sandbox Code Playgroud)
有人遇到过相同/类似的问题吗?任何想法都非常感激!提前致谢。
小智 3
如果不知道有关如何设置 SQL Server 的更多详细信息,我相信这将是 Dask 文档中特定于 SQL Server 的,您需要提供关键字 schema=,如下所示:
dftest = dd.read_sql_table(table="table_name_only", uri=uri, index_col="somekey", schema="schema_name", divisions=[1,2,3])
Run Code Online (Sandbox Code Playgroud)
请注意,uri这里是 SQLAlchemy 字符串,而不是连接对象。
https://docs.dask.org/en/latest/dataframe-api.html#dask.dataframe.read_sql_table
| 归档时间: |
|
| 查看次数: |
1041 次 |
| 最近记录: |