mic*_*elg 5 python ms-access pyodbc pandas
我尝试了许多不同的东西来从Access中提取数据并将其放入一个整洁的数据框中.现在我的代码看起来像这样.
from pandas import DataFrame
import numpy as np
import pyodbc
from sqlalchemy import create_engine
db_file = r'C:\Users\username\file.accdb'
user = 'user'
password = 'pw'
odbc_conn_str = 'DRIVER={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=%s;UID=%s;PWD=%s' % (db_file, user, password)
conn = pyodbc.connect(odbc_conn_str)
cur = conn.cursor()
qry = cur.execute("SELECT * FROM table WHERE INST = '796116'")
dataf = DataFrame(qry.fetchall())
print(dataf)
Run Code Online (Sandbox Code Playgroud)
这会将数据放入数据框,但第二行是列表.我需要下面的代码段在4个单独的列中,而不是2个列表.
0 (u'RM257095', u'c1', u'796116')
1 (u'RM257097', u'c2', u'796116')
2 (u'RM257043', u'c3', u'796116')
3 (u'RM257044', u'c4', u'796116')
Run Code Online (Sandbox Code Playgroud)
我使用了像kdb_utils这样的模块,它有一个read_query函数,它从kdb中提取数据并将其分成一个整齐的数据帧.有没有这样的访问或其他方式来拉取数据并巧妙地将其放入数据框?
考虑使用pandas的直接read_sql方法:
import pyodbc
import pandas as pd
...
cnxn = pyodbc.connect('DRIVER={{Microsoft Access Driver (*.mdb, *.accdb)}};DBQ=' + \
'{};Uid={};Pwd={};'.format(db_file, user, password)
query = "SELECT * FROM mytable WHERE INST = '796116'"
dataf = pd.read_sql(query, cnxn)
cnxn.close()
Run Code Online (Sandbox Code Playgroud)