我正在尝试使用Python和Pandas 执行差异差异(使用面板数据和固定效果)分析.我没有经济学背景,我只是想过滤数据并运行我被告知的方法.但是,据我所知,我明白基本的diff-in-diffs模型如下所示:
也就是说,我正在处理一个多变量模型.
下面是R中的一个简单示例:
https://thetarzan.wordpress.com/2011/06/20/differences-in-differences-estimation-in-r-and-stata/
可以看出,回归将一个因变量和树组观察值作为输入.
我的输入数据如下所示:
Name Permits_13 Score_13 Permits_14 Score_14 Permits_15 Score_15
0 P.S. 015 ROBERTO CLEMENTE 12.0 284 22 279 32 283
1 P.S. 019 ASHER LEVY 18.0 296 51 301 55 308
2 P.S. 020 ANNA SILVER 9.0 294 9 290 10 293
3 P.S. 034 FRANKLIN D. ROOSEVELT 3.0 294 4 292 1 296
4 P.S. 064 ROBERT SIMON 3.0 287 15 288 17 291
5 P.S. 110 FLORENCE NIGHTINGALE 0.0 313 3 …
Run Code Online (Sandbox Code Playgroud) 我有一个像这样的数据框:
Run Code Online (Sandbox Code Playgroud)year fcode y x 0 1987 410032 NaN 0 1 1988 410032 NaN 0 2 1989 410032 NaN 0 3 1987 410440 NaN 0 4 1988 410440 NaN 0 5 1989 410440 NaN 0 6 1987 410495 NaN 0 7 1988 410495 NaN 0 8 1989 410495 NaN 0 9 1987 410500 NaN 0 10 1988 410500 NaN 0 11 1989 410500 NaN 0 12 1987 410501 NaN 0 13 1988 410501 NaN 0 14 1989 410501 NaN 0 …