我想估计一个IV回归模型,使用许多与年,人口统计等虚拟对象的互动.我找不到一个明确的方法在熊猫中这样做,如果有人有提示我很好奇.
我正在考虑尝试scikit-learn和这个功能:
http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.PolynomialFeatures.html
我正在研究一个数据集 (PSID),它以 SAS 格式(一个 .txt 和另一个包含解释数据的指令的文件)提供数据。我在 Python 中找不到任何东西来读取这种类型的数据。
有谁知道一个预先存在的模块/脚本来读取 SAS 数据?
编辑(从评论添加到答案):数据在 ascii/text 中,一行数据的开头如下所示:
3 10 1015000 150013200 00 002500 00 00