如何从 Pandas 的 excel 文件中排除页眉和页脚

Pri*_*mar 2 python-3.x pandas

df=pd.read_excel(filename)

我应该添加哪些属性来排除页眉和页脚?

Jas*_*ngh 7

前往这里:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html

你会找到

pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds)

其中对您有用的是:

pandas.read_excel(skiprows=None, skipfooter=0)

skiprows=1您可以指定要跳过的整数值,header并且skipfooter=1要跳过footer您可以添加要跳过的行数

希望能帮助到你


Adi*_*edi 5

这就是我实现它的方式:

energy = pd.read_excel('Energy Indicators.xls', index_col=None, header=None, footer=None)
energy = energy[18:245].reset_index()
Run Code Online (Sandbox Code Playgroud)

我在我需要删除页眉和页脚的作业中使用它进行数据清理。

所以我首先使用从 excel 导入原始数据

energy = pd.read_excel('Energy Indicators.xls', index_col=None, header=None, footer=None)
Run Code Online (Sandbox Code Playgroud)

现在,由于实际所需数据开始的行是 18,而页脚开始的行是 245 我使用了这个

energy = energy[18:245].reset_index()
Run Code Online (Sandbox Code Playgroud)

我使用reset_index()是因为在删除行后我的索引被弄乱了所以要重置它。

您可能想要删除由创建的名为“index”的额外列 reset_index()