将SAS数据文件导入python数据框

pde*_*var 5 python sas pandas

我正在研究一个数据集 (PSID),它以 SAS 格式(一个 .txt 和另一个包含解释数据的指令的文件)提供数据。我在 Python 中找不到任何东西来读取这种类型的数据。

有谁知道一个预先存在的模块/脚本来读取 SAS 数据?

编辑(从评论添加到答案):数据在 ascii/text 中,一行数据的开头如下所示:

3 10 1015000 150013200 00 002500 00 00

jos*_*iah 5

从版本 17 开始,Pandas 现在支持读取文件扩展名为 .xpt 的 sas 文件。有关其他详细信息,请参阅指向Pandas 文档的链接

df = pd.read_sas('sas_xport.xpt')
Run Code Online (Sandbox Code Playgroud)


pde*_*var 1

所以我写了一个可以导入数据的包。在这里能找到它:

https://pypi.python.org/pypi/psid_py

这是我的第一个包裹,对于草率的工作感到抱歉。此外,它仅针对 PSID 数据集进行了测试,我确信其他 SAS 格式也存在错误。不过,有总比没有好。

除了读取 sas 数据之外,它还会为您构建面板数据,以防您喜欢这类事情。