pandas.read_excel 在 Excel 中具有相同的列名

Egi*_*ila 4 python excel pandas

当我使用 pandas.read_excel 导入 Excel 表时,存在列名相同的问题(或功能:-))。例如,Excel 文件有两列名为“dummy”,导入数据帧后,第二列名为“dummy.1”。有没有一种方法可以在不重命名选项的情况下导入?

Ant*_*vBR 6

现在我不明白你为什么想要这个。不过,既然我能想到解决方法,我不妨将其发布。

在此输入图像描述

import pandas as pd

cols = pd.read_excel('text.xlsx', header=None,nrows=1).values[0] # read first row
df = pd.read_excel('text.xlsx', header=None, skiprows=1) # skip 1 row
df.columns = cols

print(df)
Run Code Online (Sandbox Code Playgroud)

返回:

   col1  col1
0     1     1
1     2     2
2     3     3
Run Code Online (Sandbox Code Playgroud)

  • 这非常好,因为源文件具有重复的列名称。我需要将表转置(融化、取消旋转)到一个高的数据框中。这使我能够保持匹配的列具有匹配的行。谢谢! (2认同)
  • 想说同样的话,如果您想融合数据框并按重复列进行分组,这非常有用(实际上是必要的)。@pandas 无法识别这一点并构建一个函数,这很烦人...... (2认同)