有没有办法在R中读取Stata版本13数据集文件?
我试图做以下事情:
> library(foreign)
> data = read.dta("TEAdataSTATA.dta")
Run Code Online (Sandbox Code Playgroud)
但是,我收到了一个错误:
read.dta("TEAdataSTATA.dta")中的错误:
不是Stata版本5-12 .dta文件
有人可以指出是否有办法解决这个问题?
我有一个 10 GB .dta Stata 文件,我正在尝试将其读入 64 位 R 3.3.1。我正在使用大约 130 GB RAM(4 TB HD)的虚拟机,.dta 文件大约有 300 万行和 400 到 800 个变量。
我知道 data.table() 是读取 .txt 和 .csv 文件的最快方法,但是有人建议将大型 .dta 文件读取到 R 中吗?将文件作为 .dta 文件读入 Stata 需要大约 20-30 秒,尽管我需要在打开文件之前设置工作内存最大值(我将最大值设置为 100 GB)。
我没有尝试过在 Stata 中导入 .csv,但我希望避免使用 Stata 接触该文件。通过使用 memisc 将 stata .dta 文件导入 R找到了解决方案,但这假设 RAM 稀缺。就我而言,我应该有足够的 RAM 来处理该文件。