小编Ami*_*ine的帖子

在python中处理大型XLSX文件

我有一个很大的 xlsx Excel 文件(56mb,550k 行),我试图从中读取前 10 行。我尝试使用xlrd,openpyxlpyexcel-xlsx,但它们总是需要超过 35 分钟,因为它将整个文件加载到内存中。

我解压了 Excel 文件,发现xml其中包含我需要的数据的解压为 800mb。

当您在 Excel 中加载相同的文件时,需要 30 秒。我想知道为什么在 Python 中需要那么多时间?

python excel xlrd xlsx openpyxl

5
推荐指数
1
解决办法
2万
查看次数

标签 统计

excel ×1

openpyxl ×1

python ×1

xlrd ×1

xlsx ×1