我正在尝试完成一项家庭作业,为此我需要在 statsmodels 中使用分类变量(由于拒绝像其他人一样使用 stata)。我花了一些时间阅读 Patsy 和 Statsmodels 的文档,但我不太明白为什么这段代码不起作用。我尝试将它们分解并使用 patsy 命令创建它,但出现了相同的错误。
我目前有:
import numpy as np
import pandas as pd
import statsmodels.formula.api as sm
# This is where I'm getting data
data = pd.read_csv("http://people.stern.nyu.edu/wgreene/Econometrics/bankdata.csv")
# I want to use this form for my regression
form = "C ~ Q1 + Q2 + Q3 + Q4 + Q5 + C(BANK)"
# Do the regression
mod = sm.ols(form, data=data)
reg = mod.fit()
print(reg.summary2())
Run Code Online (Sandbox Code Playgroud)
此代码会引发错误:TypeError: 'Series' object is not callable。statsmodels 网站上 …