从使用绑定变量的数据库查询创建pandas数据帧

Dav*_*arx 5 python sql database oracle pandas

我正在使用Oracle数据库.我可以这么做:

    import pandas as pd
    import pandas.io.sql as psql
    import cx_Oracle as odb
    conn = odb.connect(_user +'/'+ _pass +'@'+ _dbenv)

    sqlStr = "SELECT * FROM customers"
    df = psql.frame_query(sqlStr, conn)
Run Code Online (Sandbox Code Playgroud)

但我不知道如何处理绑定变量,如下所示:

    sqlStr = """SELECT * FROM customers 
                WHERE id BETWEEN :v1 AND :v2
             """
Run Code Online (Sandbox Code Playgroud)

我尝试过这些变化:

   params  = (1234, 5678)
   params2 = {"v1":1234, "v2":5678}

   df = psql.frame_query((sqlStr,params), conn)
   df = psql.frame_query((sqlStr,params2), conn)
   df = psql.frame_query(sqlStr,params, conn)
   df = psql.frame_query(sqlStr,params2, conn)
Run Code Online (Sandbox Code Playgroud)

以下作品:

   curs = conn.cursor()
   curs.execute(sqlStr, params)
   df = pd.DataFrame(curs.fetchall())
   df.columns = [rec[0] for rec in curs.description]
Run Code Online (Sandbox Code Playgroud)

但这个解决方案只是......不太优雅.如果可以的话,我想在不创建游标对象的情况下这样做.有没有办法用大熊猫做整件事?

Pau*_*l H 0

据我所知,pandas 期望 SQL 字符串在传递之前完全形成。考虑到这一点,我会(并且总是)使用字符串插值:

params = (1234, 5678)
sqlStr = """
SELECT * FROM customers 
WHERE id BETWEEN %d AND %d
""" % params
print(sqlStr)
Run Code Online (Sandbox Code Playgroud)

这使

SELECT * FROM customers 
WHERE id BETWEEN 1234 AND 5678
Run Code Online (Sandbox Code Playgroud)

所以这应该psql.frame_query很好。(根据我使用 postgres、mysql 和 sql server 的经验,确实如此)。