我有一个很大的 xlsx Excel 文件(56mb,550k 行),我试图从中读取前 10 行。我尝试使用xlrd,openpyxl和pyexcel-xlsx,但它们总是需要超过 35 分钟,因为它将整个文件加载到内存中。
xlrd
openpyxl
pyexcel-xlsx
我解压了 Excel 文件,发现xml其中包含我需要的数据的解压为 800mb。
xml
当您在 Excel 中加载相同的文件时,需要 30 秒。我想知道为什么在 Python 中需要那么多时间?
python excel xlrd xlsx openpyxl
excel ×1
openpyxl ×1
python ×1
xlrd ×1
xlsx ×1