相关疑难解决方法(0)

Pandas read_stata()包含大型.dta文件

我正在使用大约3.3千兆字节的Stata .dta文件,因此它很大但不会过大.我有兴趣使用IPython并尝试使用Pandas导入.dta文件,但是有些事情正在发生.我的盒子有32千兆字节的RAM,并试图加载.dta文件导致所有使用的RAM(约30分钟后)和我的计算机停止运行.这不是'感觉'正确,因为我能够使用外部包中的read.dta()打开R中的文件没有问题,并且使用Stata中的文件很好.我使用的代码是:

%time myfile = pd.read_stata(data_dir + 'my_dta_file.dta')
Run Code Online (Sandbox Code Playgroud)

我在Enthought的Canopy程序中使用IPython.'%time'的原因是因为我有兴趣对R的read.dta()进行基准测试.

我的问题是:

  1. 有什么我做错了导致熊猫出现问题吗?
  2. 是否有解决方法将数据导入Pandas数据帧?

python stata pandas

10
推荐指数
2
解决办法
1万
查看次数

标签 统计

pandas ×1

python ×1

stata ×1