前往这里:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html
你会找到
pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds)
其中对您有用的是:
pandas.read_excel(skiprows=None, skipfooter=0)
skiprows=1
您可以指定要跳过的整数值,header
并且skipfooter=1
要跳过footer
您可以添加要跳过的行数
希望能帮助到你
这就是我实现它的方式:
energy = pd.read_excel('Energy Indicators.xls', index_col=None, header=None, footer=None)
energy = energy[18:245].reset_index()
Run Code Online (Sandbox Code Playgroud)
我在我需要删除页眉和页脚的作业中使用它进行数据清理。
所以我首先使用从 excel 导入原始数据
energy = pd.read_excel('Energy Indicators.xls', index_col=None, header=None, footer=None)
Run Code Online (Sandbox Code Playgroud)
现在,由于实际所需数据开始的行是 18,而页脚开始的行是 245 我使用了这个
energy = energy[18:245].reset_index()
Run Code Online (Sandbox Code Playgroud)
我使用reset_index()
是因为在删除行后我的索引被弄乱了所以要重置它。
您可能想要删除由创建的名为“index”的额外列 reset_index()