我目前正在使用pandas来读取Excel文件并向用户显示其工作表名称,因此他可以选择他想要使用的工作表.问题是文件非常大(70列x 65k行),在笔记本上加载最多需要14秒(CSV文件中的相同数据需要3秒).
我在熊猫的代码是这样的:
xls = pandas.ExcelFile(path)
sheets = xls.sheet_names
Run Code Online (Sandbox Code Playgroud)
我之前尝试过xlrd,但获得了类似的结果.这是我的xlrd代码:
xls = xlrd.open_workbook(path)
sheets = xls.sheet_names
Run Code Online (Sandbox Code Playgroud)
那么,有人能建议一种更快的方法从Excel文件中检索工作表名称而不是读取整个文件吗?
我正在使用open_workbook()函数打开一个excel文件.但我找不到任何函数来稍后在xlrd模块中关闭该文件.有没有办法使用xlrd关闭xls文件?或者根本不需要?
我有一个excel文件,我想这对于一个excel文件(200Mb)来说非常庞大,它有大约20页的信息.
我的问题是,如果以下简单操作执行需要将近5分钟是正常的.我想知道我是否以正确的方式做到这一点.
import xlrd
def processExcel(excelFile):
excelData = xlrd.open_workbook(excelFile)
sheets = excelData.sheet_names()
print sheets
Run Code Online (Sandbox Code Playgroud)
正如你所看到的,在第一步我只是试图获取工作表名称,只有那么简单的事情需要5分钟......这可能吗?