小编pie*_*ons的帖子

为什么 pandas 和 R 之间的数据帧内存使用量存在如此大的差异?

我正在处理https://opendata.rdw.nl/Voertuigen/Open-Data-RDW-Gekentekende_voertuigen_brandstof/8ys7-d773中的数据(使用“Exporteer”按钮下载 CSV 文件)。

当我使用 R 将数据导入到 R 时,read.csv()它需要 3.75 GB 的内存,但是当我使用它将数据导入 pandas 时,pd.read_csv()它会占用 6.6 GB 的内存。

为什么这个差异这么大呢?

我使用以下代码来确定 R 中数据帧的内存使用情况:

library(pryr) 
object_size(df)
Run Code Online (Sandbox Code Playgroud)

和蟒蛇:

df.info(memory_usage="deep")
Run Code Online (Sandbox Code Playgroud)

python memory r dataframe pandas

4
推荐指数
1
解决办法
2461
查看次数

标签 统计

dataframe ×1

memory ×1

pandas ×1

python ×1

r ×1