enu*_*ris 3 python sql pyodbc pandas
我正在尝试将复杂 SQL 查询的结果导入到 Pandas 数据框中。我的查询要求我创建几个临时表,因为我想要的最终结果表包含一些聚合。我的代码如下所示:
cnxn = pyodbc.connect(r'DRIVER=foo;SERVER=bar;etc')
cursor = cnxn.cursor()
cursor.execute('SQL QUERY HERE')
cursor.execute('SECONDARY SQL QUERY HERE')
...
df = pd.DataFrame(cursor.fetchall(),columns = [desc[0] for desc in cursor.description])
Run Code Online (Sandbox Code Playgroud)
我收到一个错误,告诉我形状不匹配:
ValueError: Shape of passed values is (1,900000),indices imply (5,900000)
Run Code Online (Sandbox Code Playgroud)
事实上,所有 SQL 查询的结果应该是一个有 5 列而不是 1 列的表。我已经使用 Microsoft SQL Server Management Studio 运行了 SQL 查询,它可以工作并返回我想要的 5 列表。我试图不将任何列名传递到数据帧中并打印出数据帧的头部,发现熊猫已将 5 列中的所有信息放入 1。每行中的值是由逗号分隔的 5 个值的列表,但 pandas 将整个列表视为 1 列。熊猫为什么要这样做?我也试过走这pd.read_sql条路线,但我仍然遇到同样的错误。
编辑:
我做了一些更多的调试,考虑到评论。该问题似乎并非源于我的查询是嵌套的。我尝试了一个简单的(一行)查询来返回一个 3 列表,但我仍然遇到相同的错误。打印出来fetchall()是这样的:
[(str1,str2,str3,datetime.date(stuff),datetime.date(stuff)),
(str1,str2,str3,datetime.date(stuff),datetime.date(stuff)),...]
Run Code Online (Sandbox Code Playgroud)
使用pd.DataFrame.from_records来代替:
df = pd.DataFrame.from_records(cursor.fetchall(),
columns = [desc[0] for desc in cursor.description])
Run Code Online (Sandbox Code Playgroud)