尝试打开 Excel 时出现“KeyError:“存档中没有名为“xl/sharedStrings.xml”的项目”

Pra*_*ngh 5 python excel dataframe pandas powerbi

我正在尝试使用 Python 脚本将数据导入 PowerBi,以便我可以安排它定期刷新数据。我面临着从 Excel 文件获取数据的挑战,并在导入时收到错误“KeyError:“存档中没有名为“xl/sharedStrings.xml”的项目”。

当我查看 xl 文件夹中的 xlsx 文件的存档时,没有文件sharedString.xml。因为excel中没有字符串。该文件在 excel 中可以正常打开,没有任何问题,但在 python 中则不行。

import openpyxl
import pandas
import xlrd
import os
globaltrackerdf = pandas.read_excel (r'C:\Users\Documents\Trackers\Tracker-Global Tracker_V2-2022-06-13.xlsx',sheet_name="Sheet1",engine="openpyxl")
Run Code Online (Sandbox Code Playgroud)

CJ *_*non 1

对我有用的解决方案:使用 Excel 重新保存文件。我的文件在 Excel 中也可以正常打开,但在压缩文件并查看内部后,发现没有sharedStrings.xml. 似乎存在一个错误,保存 xlsx 可能不会生成该sharedStrings.xml文件。我发现了关于为什么会发生这种情况的各种想法,但由于我无法访问客户的 Excel,不确定是什么原因导致的。

有关 XLSX 文件是什么的额外上下文,我发现这很有帮助:https://www.adimian.com/blog/fast-xlsx-parsing-with-python/