我需要 pandasql 库来对我的 pandas 数据框进行一些查询。我在一个简单的示例上运行以下代码并收到以下错误。奇怪的是,不能将其视为查询!我尝试重新安装并升级 pandasql、pandas、pip 和其他一些,但我找不到问题所在。我使用的是 Jupiter Notebook,编译器是 Ubuntu 20.04.5 LTS 上的 python3.8。
代码:
import pandas as pd
import pandasql as ps
import numpy as np
df = pd.DataFrame([[1234, 'Customer A', '123 Street', np.nan],
[1234, 'Customer A', np.nan, '333 Street'],
[1233, 'Customer B', '444 Street', '333 Street'],
[1233, 'Customer B', '444 Street', '666 Street']], columns=
['ID', 'Customer', 'Billing Address', 'Shipping Address'])
q1 = """SELECT * FROM df """
ps.sqldf(q1)
Run Code Online (Sandbox Code Playgroud)
结果:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
~/.local/lib/python3.8/site-packages/sqlalchemy/engine/base.py in …Run Code Online (Sandbox Code Playgroud)